縦組みにおける英数字正立論8―文字コード

日本の国内規格

日本の国内文字コードには、古くからJIS X0201(1バイト)とJIS X0208(2バイト)があります。英数字はJIS X0201とJIS X0208の両方の文字集合に収容されています。

JIS X0201とJIS X0208を一つにしたのがシフトJISです。シフトJISでは英数字は重複してしまいます。その時代には1バイトは半角文字、2バイトは全角文字と呼ばれていました。
1980年代から2000年頃まではシフトJISが主流でした。ただし、シフトJISを採用していないワープロ専用機も多く使われていました。

Unicode

1980年代の終わり頃にはUnicodeが開発されました。現在は多くのアプリケーションがUnicodeを用いており、文字コードの主流はUnicodeになっていると見られます。

Unicodeは各国の国内コードとの互換性を保つことを優先課題のひとつとしており、日本の国内文字コードとの互換性のために、半角文字と全角文字の両方に異なるコードポイントを与えています。次のようになります。

表:Unicodeの英数字コードポイント
文字 半角文字 全角文字
A~Z U+0041~U+005A U+FF21~U+FF3A
a~z U+0061~U+007A U+FF41~U+FF5A
0~9 U+0030~U+0039 U+FF11~U+FF19

なお、Unicodeは、同じ文字の表示系を2通り以上の文字列(コードポイントシーケンス)で表すことを認めており、正規化という概念を導入して、統一的に扱うことができます。しかし、正規化を実際に実装して利用しているケースは少なく、従って、日本語のテキストでは半角文字と全角文字が混在する状態と見られます。

文字コードのことはここではあまり詳しく説明しません。詳しくは、「PDFインフラストラクチャ解説」をご参照ください。

縦組みにおける英数字正立論7―縦組みにおける英数字の扱いまとめ

日本語の縦組みの中で英数字がどのように表記されるかの実態についてはさらに詳しい調査が必要です。しかし、とりあえず簡単に整理しますと次のようになります。

ラテンアルファベット

縦組みの書籍や新聞・一般向け雑誌では外国の地名や人名等を原文のままアルファベット表記する例は比較的少なく、カタカナで表します。ラテンアルファベットを使うのはAさんやA型のように1文字の記号として使うか、頭文字を連ねるケースが多く、文字の方向は正立が多いと言えます。

但し、英文をそのまま引用する場合、あるいは、著書を紹介するときの著者名、原著名などで英語をそのまま縦組みの行中に含める場合は、文字列単位で右に90度回転して行に収めます。新聞表記の例では、計測単位などに小文字を使いかつ桁数が多い(3文字以上)は横倒しが見られます。

アラビア数字

縦組の書籍では、アラビア数字は次のようなところに出てきます。

  • 目次のページ番号
  • 章番号
  • 箇条書きの項目番号
  • 図表番号
  • 年月日、時間・時刻、金額などの単位付数字

これらはすべて正立で使います。そして2桁の場合はほぼ例外なく縦中横としています。目次などでは3桁の数字も頻繁に現れますが縦中横を使っています。このようにアラビア数字の表記では縦中横の頻度が高いのが特徴です。

なお、翻訳書籍の参考文献一覧(縦組み)でアラビア数字を横倒しで表記している例も確認できますので、アラビア数字は常に正立とは断言できません。

縦組みにおける英数字正立論6―縦組みパソコン雑誌における英数字

縦組みのパソコン雑誌における英数字の使われ方を調べてみます。調査対象としたのは、日経BP社発行の「日経PC21」2012年3月号です。この雑誌は、ビジネスマンがパソコンを使うためのハウツー情報誌ですので技術とビジネスの接点に位置しています。ハウツーの図版が多いのが特徴です。図版の部分にキャプションと説明文が多くありますが横組みと縦組みが混在しているのも誌面の特徴です。

雑誌の誌面

肝心の英数字の使い方ですが、サンプルとして誌面の一部を紹介します。

図:日経PC21の誌面の一部

(「日経PC21」2012年3月号、66頁の一部)

図を見ると一目瞭然ですが、ラテンアルファベットは正立、アラビア数字も正立が基本です。もう少し詳しく見るために、先頭(9頁)から33頁までの記事の中の縦組みになっている部分の方向を確認してみます。

ラテンアルファベット

ラテンアルファベットは103箇所でてきますが、そのうち102箇所が正立、1箇所だけ横倒しです。

主なパターンは次の通りです。すべて正立です。

  • 1文字のみ 36箇所。例:Gメール、アクセスA
  • 小文字で始まる単語 27箇所。例:iPad、iPhone、iCloud、iTunes、iPad
  • “OECD”のように1字1字読む単語:25箇所。例:NTT、USB、HDD、URL、IE、PDF、OK、PFU、SD、ID
  • 先頭文字が大文字,以下が小文字の単語:7箇所。例:Gmail、From、SugarSync、Web、ScanSnap
  • “NATO”のように単語のように読む:2箇所。例:LAN、NAS
    その他 例:Sign In、Free Download、Wi-Fi

横倒しは1箇所のみです:@gmail.com

アラビア数字

アラビア数字は1文字ずつ正立で表記していますが、2桁のときは縦中横で正立です。横倒し表記はありません。

  • 1文字づつ正立 118箇所。図の番号が55箇所、数値が25箇所です。例:100Kbps、2年契約、2台、1つ、1テラ、2ギガ、1冊、4種類など。
  • 2文字の縦中横 100箇所。図の番号が多く93回です。

「日経PC21」はラテンアルファベットやアラビア数字を原則正立で表記しています。正立の範囲がかなり広いようです。但し、すべて正立というわけではなくて「コマンドとかメニュー名は横倒しで表記することもある」とのことです。

縦組みにおける英数字正立論5―新聞方式縦組みの英数字

編集者や記者のためのガイドブックとして、「記者ハンドブック 第12版」(共同通信社編著、2011年10月11日、ISBN978-4-7641-0619-2)を調べてみます。

まず、この本の構成ですが、全体740頁のうち、先頭から630頁までが縦組みで、資料編110頁が横組みです。外国の地名・人名の表記、新聞略語集などが資料編に収容されています。縦組みで表記しにくいラテンアルファベットの英語表記は横組み頁を設けているのです。

ラテンアルファベット

正立(2-a.)

WHEN、WHERE、WHO、WHAT、WHY、HOW、5W1H、もうひとつのW、WORTH (10頁)、A欄、A+B、など(110頁)、GK、MFなど(125頁)、ウイリアム・J・クリントン(126頁)、AからBまで(127頁)、SLのかま(202頁)、CD(236頁、256頁)、DVD(256頁、276頁)、B5版(383頁)、JOC(408頁)、RSウイルス、IgA腎症(487頁)、E型肝炎、GVHD、A型、A群、HTLV1、HAM、ADH、LD、TSH、QT、IBS(488頁)、ACS、Q熱、ALS、CJD、DIC(489頁)、SARS(490頁)、PTSD、SAS、STD、ATL、GHD(491頁)、ADHD、TSH、H5N1(492頁)、SIDS、VRE、PRL、Bウイルス、ビタミンD(493頁)、CJD、GSS、FFI、CKD、CFS、COPD、MRSA、HUS(494頁)、VRE、O26、MRSA、BSE(495頁)(病気の名前はラテンアルファベット頭文字が多い)、AはBの、lockとrock(小文字だが、正立)、W杯、ASEAN(527頁)、AP、RP(528-529頁)、NHK(531頁)、JR(549頁)、CEO、COO、A氏(550頁)、A=当人、B=・・・、C=称号、D=当人(562頁)、START2、GIレース(570頁)、A340、F22、P3C(571頁)、ABCDのうち(574頁)、4WD(581頁)、SI(585頁)、kW(縦中横)(586頁)、特殊な場合のほかは、「C、F」は使わない。m、cm(縦中横)、km(同)、g、kg(同)、cc(同)、W、kW(同)を使っても良い(587頁)。これ以外にも1文字の例はいくつかありますが省略します。

横倒し(2-b.)

(外来語の書き方の項)現音の語尾の―er, ―or, ―arなどは、-yは(461頁)、語尾の-umは、語尾が-tureの(462頁)、http://www.kyodo.co.jp/(改行)feedback@kyodo.news.jp(以上、全角形で横倒し)(560頁)

先頭から587頁までのラテンアルファベットについては大文字・小文字とも原則正立で、外来語であることを明示的に示したときやURLを横倒しです。つまり横倒しが例外です。かならずしも全角形・半角形ではありません(余談ですが、WebアクセスのためにはURLは半角形が望ましいのにときどき全角形を見かけます。特に、法務省の商業登記簿謄本ではURLを全角形で表記しています。官公庁系文書ではURLを全角で表す決まりがあるのでしょうか。)。

計量単位のラテンアルファベット

ところが、主な計量単位と種類の項(590-597頁)にはラテンアルファベットの正立と横倒しが混在で出てきます。

正立(3-a.)

E, P, G, M, k, h, da, d, c, m, μ, n, p, f, a(アト), a(アール),A, ac, LD50, Ω, Å, oz, nm, M, ct, K, Kt, 24K, cd, Ci, GW, kW, C/kg, Gy, K, G, COD, ppm, cc, Sv, J, pH, dB, eV, AU, t, tn, N, Kt, Kn, Pc, Pa, BOD, ppm, ppb, ppt, μs, bu, FLOPS, MFLOPS, Bq, Hz, μm, M, nm, MPH, M, μ, MIPS, lx, R

横倒し(3-b.)

I.U., floz, cpm, car, Gal, gal, Kcal, MeV, GeV, TeV, lbt, Ltn, barrel, bit, byte, nsec, psec, (discomfort index, DI), hPa, MHz, kHz, rad, rem, lot

3-aを見ますと、1文字は正立、2文字も正立で縦中横として表記、3文字以上は大文字なら正立で縦に並べるという規則のようです。但し、3-aでppm, ppbが正立になっているのは例外ですが、これは定義箇条の見出しだからでしょうか。3-bでは小文字が混じった3文字となり、これは横倒し、( )内で英文表記とセットになっているときは大文字2文字(DI)でも横倒としているようです。全角形とか半角形の区別はないようです。

アラビア数字について

  • 目次は縦組で目次の中の頁番号は3桁までの縦中横です。
  • 年月日、箇条書きの項目番号、数量(X個、Xつなど)はアラビア数字ですが、2桁までは縦中横、それ以上は正立して表記しています。箇条書きの項目番号を(1)のように表記する場合、括弧まで含めて縦中横としています。(15)という4文字組(115頁)の縦中横が出てきます。
  • 投票の得票数の例では2桁でも縦中横を使わずに表記しています。(534頁。電文の例だから例外かもしれません。)

このようにこの書籍の中にはアラビア数字はかなり頻繁にでてきますが、すべて正立です。2桁の縦中横数字の頻度が非常に多いのが特徴です。

新聞方式のまとめ

共同通信社のハンドブックは新聞の表記ともかなり類似していると思いますが、まとめると次のようになります。

アラビア数字はすべて正立で横倒しはない。但し原則2文字まで(まれに年齢などで上下の括弧内3文字)が縦中横です。縦中横の頻度が多いと思います。

ラテンアルファベットも原則として正立です。3-bでみるように単位が小文字交じりで3文字以上になったときのみ横倒し表記となります。全角形と半角形の使い分けはしていません。

縦組みにおける英数字正立論4―小説の中の英数字

日本の代表的な小説の中で英数字がどのように使われているかを調べてみます。

「昭和史発掘」

「昭和史発掘9」(松本清張、文春文庫、2005年11月10日新装版第一刷)では、外国人名、国名・地名、外国語由来の単語はカタカナで表しています。そして、本文の中のアルファベットは「A行動記」「B仙台発見遺書」(順序記号)(P.231)「Y判士」(p.294)のように1文字の記号として使っているだけです。もちろん正立で使っています。

横倒しのアルファベットは本文には登場しません。

年号、日にち、年齢、人数などの数字はすべて漢数字で表記しています。縦組み中のアラビア数字は次の使われ方だけです(この他に、ページ番号、奥付けにもアラビア数字が使われていますが、これらは横組みなので除外します。以下同様に横組み部分は除外。)。

  • 表紙の「9」という巻数
  • 節番号(1,2,・・・)
  • 箇条書きの項目番号(p.63)
  • 目次のページ番号(縦中横(縦組の一行中に文字列を横に進める方向で表記すること。「日本語組版処理の要件」3.2.5参照。))

「翔ぶが如く」

「翔ぶが如く五」(司馬遼太郎、文春文庫、2007年4月5日第7刷)では外国人名、地名、外来語はカタカナ表記になっており、ラテンアルファベットはエープ山(App-Hill)(p.236)に横倒し表記で使われているだけです。

アラビア数字は目次(縦中横)だけで本文の中では数字は漢数字表記です。

「日本の一番長い日」

「日本の一番長い日」(半藤 一利、文春文庫、2006年7月10日第1刷)ではラテンアルファベットは正立、横倒しの両方で現れます。K型、A型などの使い方はいづれも1文字で正立しますが、「subject to」の訳についての話題(p.37)のときは英語として横倒しています。

アラビア数字は目次と注番号(縦中横)にでてきます。

小説のまとめ

この3冊の小説では次のようにまとめることができます。

(1)アラビア数字を横倒しにした例はありません。

但し、目次、注番号、などに縦中横形式で多用されていますので縦中横が使えないときどうするか、と言う問題があります。

(2)ラテンアルファベットは記号として1文字を使うことがあり、このとき正立します。また、英文(単語含め)を表すために使うときは横倒しです。

縦組みにおける英数字正立論3―英数字は正立・横倒しの扱いが厄介

ところが、縦組みするときにラテンアルファベットやアラビア数字(以下、総称して「英数字」といいます)を正立させるか横倒しさせるかを決めるのは厄介です。

ラテンアルファベット

日本語の中には、ラテンアルファベットを使うことができます。例えば、A氏、NHK、ISOといった文字列の中のアルファベットは記号であり、縦組みでは一字一字正立させなければなりません。しかし、同じラテンアルファベットでも縦組みする日本語の文章の中に”International Standard Organization”というような文字列があるとき、これを一文字づつ正立して縦に並べますと大変読みにくいものとなります。従って、縦組みの中では文字列全体を右に90度回転して行に収めます(「日本語組版処理の要件」2.3.2 縦組と横組の主な相違点のb-1-ii)。これは1文字毎にみますと右に90度回転、つまり横倒ししているように見えます。

このようにラテンアルファベットはその使われ方によって、正立したり横倒しになったりします。つまり、縦組み中のラテンアルファベットは文字単位で方向を決定することができません。

アラビア数字

日本語文章中のアラビア数字についても同様です。アラビア数字の使われ方は多様です。まず、第1章、図1・1など章・節番号、箇条書きの1.など項目番号に使います。このとき1桁のアラビア数字は縦組みでは正立させたいでしょう。では、第10章、図1-10、10項のときはどうしたら良いでしょうか。さらに大きな桁数の数値や数式の中ではどうしたら良いでしょうか。

縦組みでは数字は漢字で表すというのは一つの方法ですが、しかし、大きな桁数の数字を漢字で表すと読みにくくなりますし、数式は漢字で表すことはできません。つまり大きな桁数の数字や数式中などでは横倒しのアラビア数字を使うことになるでしょう。

そうしますと、アラビア数字についても正立と横倒しを許容せざるを得ないことになります。

記号類

なお、日本語文脈と英文文脈・数式などの文脈の両方に使われる記号類についても同じように両方を許容しなければならないものがあると思われますが、議論の論点を絞るためにここでは割愛します。

本書の課題

このように日本語では横組みと縦組みでは文字の方向等の扱いを替える文字があり、その中で、英数字の取り扱いは大変厄介です。本書では縦組みにおける英数字の扱いを中心に検討します。

縦組みにおける英数字正立論2―縦組みするときの字形の変更

印刷や制作に携わっている人にとっては横組みと縦組みでは扱いを変更しなければならない文字があることは常識に近いと思います。しかし、これから著者自身が電子書籍を制作することになると、著者にもこういう知識が必要となります。

横組み縦組みで共通の文字

日本語の表記に使う文字の中で漢字やひらがな(の多く)は、通常、正方形の枠の中にデザインされており、横組みか縦組みかを意識することなく使うことができます。

縦組みと横組みで方向・形を変える文字

次にあげる文字は、横組みから縦組みに変更するとき、回転させたり、文字の形を変える必要があります。

  • 括弧類は横組みでは正立していますが縦組みでは横になります。この場合は、時計回りに90度回転することになります。
  • 句読点の場合は、ひとつの文字を囲む矩形の中で、横組みでは左下におきますが、縦組みでは右上におきます。この位置関係の変更は回転では実現できませんので、文字の形を別のものに替える必要があります。
  • 「~」は縦組みでは字の形が変わります。また、「っ」のような小書きの文字は横組み用では矩形の中央ですが、縦組み用では矩形の右側になります。
  • 前後の文字の関係を示すような記号類や方向性をもつ記号類は縦組みでは時計回りに90度回転させる必要があります。

上のような文字は縦組みで変更する必要はありますが方向は一意に決定することができます。方向が曖昧になりそうな記号についても、一定の約束を予め取り決めておくことができます。

縦組みにおける英数字正立論1―はじめに

日本語の書籍の組版には横組みと縦組みの二つの方式があります。技術書・専門書は横組みが多いのに対し文芸書をはじめとする一般書や経済書は縦組みという使い分けがなされていますが、現在は横組みか縦組みかは著者や編集者などが出版する立場から決めています。書籍は刷り上った頁が読者の目に触れることになりますし、読者が組方向を変更することは想定していません。

ところが、EPUB形式の電子書籍では、コンテンツはWebと同じXHTMLの形式であり、そのレイアウトはCSS(Cascading Stylesheet)で指定します。コンテンツを組版して表示するのは読者の手元にあるEPUBリーダです。EPUB3ではCSS3のWriting Modesという仕様を利用してコンテンツに縦組みを指定することができます。しかし、EPUB3リーダには縦組みのできないものもあります。つまり、コンテンツが縦組みで読まれるか横組みで読まれるかを、著者や編集者が確定することができません。

もう少し広く考えますと、電子書籍の形式にはEPUBだけでなく、AmazonのKindleなど、他にも有力な形式があります。また、技術書・専門書ではPDF形式による販売も多くなると見られます。そうしますと、今後は、様々な形式の電子書籍による出版を見込んでコンテンツを作成しなければなりません。

このためにはコンテンツを出版する形式やレイアウトからできるだけ切り離して用意しておくことが重要になります。本書ではそういった観点からコンテンツの中の英数字についてどのように扱ったら良いかを横組み・縦組みとの関係から検討して英数字正立論を提唱しています。まだラフなアイデアの段階ですが、ご参考にしていただくと幸いです。