UTR#50のフォーラムでの質問に答える: UTR#50とMVOは拙劣な規定であり、日本語の縦書きは不便になる

先日、UTR#50のフォーラムに「The approach of UTR#50 is different from Japanese standards」(UTR#50のアプローチはJIS X4051と異なる)というコメントを投稿した[1]ところ、次のような質問がありました。回答を直接英語で書くのは面倒なので、日本語で書いてGoogle Translationで翻訳してみようと思います[2]。うまくいくと一石二鳥だけど。(で結論としては、まだまだという感じですがとりあえず下訳的につかって修正したものを投稿しました[3]。まあ、私の英語力はそんなに高くないですので、便利といえば便利です。)

質問1. なぜ、我々の世界をJIS X 4051に限定する必要があるか?

質問2.UTR#50またはMVOが役に立たないというのであれば、その理由が分からない。

回答1.世界全体の言語の中で、文字を縦書きする言語は比較的少ない。現時点では、縦書きを採用する言語の中で、世界中で最も多くの人が使っているのは日本語である。過去においては縦書きで最も多く使われる文字は中国の漢字であった。また漢字文化圏の周辺には漢字以外にも縦書きする文字が多数あった――満州文字、モンゴル文字、西夏文字、契丹文字、ハングル、チュノムなど。しかし、中国本土の中国語は漢字の簡体字化に伴い、横書きに移行してしまった。また、周辺部の縦書きする文字の多くは消滅した。この結果、縦書きする文字は減っているのである。

縦書きの中に、横書きしかできない文字をどのように配置するかは非常に難しい問題である。これを正しく規定しているのはJIS X4051のみである。「日本語組版処理の要件」(JLReq)は、和欧混植に関する規定に関して、残念ながらJIS X4051よりも劣っている。

こうしてみると、JIS X4051は縦書きの中に横書き専用文字をどう配置するか――日本語組版でいう和欧混植――を正しく仕様化した世界で唯一の文書であるだろうと思う。縦書きの中に横書き文字を配置する方法に関して、JIS X4051をリスペクトするのは当然である。

逆に質問したい。縦書きの中に横書き専用の文字を配置する仕様を定めた文書が他にあるのか?あるのなら教えていただきたい。

回答2.Unicodeの文字は抽象的なものである。文字の形をグリフというが、印刷ではグリフの具体的な形状(グリフイメージ)をレンダリング(可視化)するのである。文字のコードポイントからグリフイメージへの変換処理方法には、文字によって様々な違いがある。一般的に言えば、コードポイントにグリフイメージを直接対応つける方法は、世界の文字を印刷するための技術としては役に立たない。

UTR#50とMVOは文字のコードポイントにグリフ可視化結果を規定する方法である。上に述べたように、一般論としてもこのアプローチは誤っている。このことを、以下に、具体的に例を示して説明する。

縦書き時のグリフイメージは文字のコードポイントの特性ではない。文字のコードポイントとグリフイメージは独立である。例えばInDesignにはアスキー文字を全角形で表示して、正立させる機能がある。その逆に、全角文字コードをプロポーショナル字形で表すこともできる。つまり、InDesignは文字のコードポイントとグリフイメージを独立のものとして扱っている。[4]

(9/21追記開始)文字のコードポイントに対して対応をつけることのできるグリフはひとつではない。複数のグリフを対応つけることができる。例えば、日本語組版ではラテンアルファベットには全角形とプロポーショナル形があるとしている。全角形とプロポーショナル形というのはグリフの区別であり文字コードの区別ではない。ラテンアルファベットの文字コードはU+0041~005A(大文字)とU+0061~007A(小文字)である(これらをアスキーアルファベットという)。JIS X4051の規定では、横書き時にはアスキーアルファベットにプロポーショナル形を割り当てて使うのが標準である(横書き時にアスキーアルファベットを全角形で表すことは一般には行なわない)。縦書き時には、アスキーアルファベットを全角形で正立したり、プロポーショナル字形で横倒しで並べたりできる。これは文字コードの使い分けではなく、グリフの使い分けである。具体的な実装例でいうと、InDesignは、縦書き時にアスキーアルファベットをプロポーショナル形で横倒し表示したり、全角形で正立させて表示する機能がある。つまり、InDesignは文字のコードポイントに対してグリフを何種類か対応付け、実際の表示においてその中から切り替えることができるのである。(9/21追記終わり)

別の例を示す。XML文書でコンテンツを表すのは文字コードの並びである。コンテンツ自体に方向属性を含むと再利用性が失われる。ひとつのコンテンツを縦書きでも横書きでも使えるようにするためには、縦書きのときのグリフイメージの向きを、コンテンツに対するXMLマークアップとスタイルシートの組み合わせによって指定するべきである。

繰り返すが、UTR#50とMVOは文字のコードポイントに縦書き時の方向を規定するというものである。特に、縦書きで、全角文字コードは正立し、アスキー文字を横倒しすると規定している。UTR#50とMVOを採用すると、コンテンツを縦書き専用、横書き専用に書き分ける必要が生じて大変不便である。

また、日本語の縦組みの書籍では、1ページの中に縦書きと横書きが混在している。また、本文は縦書きで索引は横書きという方式が一般的である。このように縦書きと横書きを同時に使う場合にも、UTR#50とMVOを採用すると不便である。[5]

[1]http://unicode.org/forum/viewtopic.php?f=35&t=346
[2]Google Translationの出力
[3]コメント投稿 2012/9/11
[4]上記のUnicodeフォーラムにて、山本太郎氏から独立ではないという指摘がありました。確かに、独立という表現は正しくないので、9/21にこの部分を削除して表現を改めました。文章の後ろの方もフォーラムの議論を鑑みてもっと補足するほうが良いのですが、これは別途、文章化することにします。
[5]この文章はUnicodeのフォーラムに投稿するために原文として書いたものなのですが、別途に何がどう不便かをもう少し具体的に説明したいと思っています。

縦組みは複雑さを増し、移行期的混乱状態。その原因は英数字の書字方向にある。

「横書き登場」(屋名池 誠著、岩波新書、2003年初版発行)[1]を読むと、幕末・明治時代から西欧の文明を取り入れる過程で横書きの普及が始まって、現在に至っていることがはっきり分かる。最初は、和字を右から左に書く右横書きと、左から右に書き進める左横書きが行なわれ、戦前までは併用されていたが、戦後に急速に左横書きに一本化された。

英語を中心とする欧米の文字は左横書きしか向かないラテンアルファベットで綴られているため欧文を和文中に取り込むためには左横書きが便利である。これに対して右横書きは和文中に欧文を取り込む上ではあまりメリットはない。戦後になって日本が米国の勢力圏になってあっという間に左横書きに統一されたのは自然とも言える。「横書き登場」では最初の左横書きの出版物は1871年(明治4年)に登場したとしている(p.61)ので、左横書きという書字方向が確立するのに70年~80年という期間がかかったことになる。

現在の出版物は、(1)横書きのみで構成する横組みと(2)縦書きを主体とし補助的に横書きを併用する縦組みの二つの組版方式が使われている。

横組みと比べると縦組みでは文字や行を進める方向が複雑に入り組んでいることが多い。この複雑さの主な原因はラテンアルファベットとアラビア数字(以下、総称して英数字)である。どのような複雑さがあるかを整理すると次のようになる。

■縦組み書籍の中の横組み頁

書籍などの出版物は、縦組みに分類されるものであっても、すべての頁が縦書きだけで組まれているものはほとんど存在しない。表1にあげるような横組み頁も併用されている。

表1 縦組み出版物の中での横組み頁
・参考文献
・索引
・表紙、章扉、奥付け

表紙や扉の横組みはデザイン上の配慮によるものが多いだろうが、参考文献や索引は英数字を多用することが横組みにする理由だろう。

■縦組み頁の中の横書き箇所

縦組み頁の中の一部に横書きのブロックが入ることも多い。表2のようなケースがある。

表2 縦組み頁の中の横書き箇所
・表は表自体の行とセルの組み方が横書きのものが主流であり、そのときセル内の数字や文章は横書きになる。
・図表の番号、キャプション、図表の説明文。
・目次のページ番号(縦中横)
・各頁のノンブル、頁上・下の柱

表2のような横書きが使われる箇所で使われる数字の種類はアラビア数字である。

■本文の中の英数字の扱い

さらに、縦書きの本文テキストの行中(インライン)での英数字の取り扱いの方法には次の3通りの方法がある。

①英数字を和字として扱う。このときは全角字形を使い、正立させる。
②英数字を欧字として扱う。このときはプロポーショナル字形を使い、文字列全体を横倒しする。このとき和字は日本語組版規則にしたがうが、欧字は欧文組版規則に従う。和欧混植方式となる。
③アラビア数字やラテンアルファベットの組を縦中横で配置する。縦中横には表3のようなケースがある。

表3 縦中横の適用箇所
・月、日、年齢などの2桁の数字を縦中横で配置するとき
・本文中から2桁または3桁の章番号、頁番号を参照するとき
・注番号、箇条書き番号などを(1)のように縦中横で扱うとき
・本文中の2桁の数値(アラビア数字)などを縦中横として扱うとき

■縦組みの類型

現在の日本語縦組み出版物における、本文テキスト中での英数字の取り扱い類型は大よそ3つである。

①新聞方式:朝日、読売、日経等の大新聞は、21世紀になってから、2桁の数字については縦中横表記とするが、それ以外のほぼすべての英数字を和字として扱う方式に移行した。

②伝統的方式:数量を表すアラビア数字は漢数字表記とする。固有名詞や慣用句はアラビア数字のままである。また図表番号や章番号などの参照は、参照先がアラビア数字の場合はアラビア数字のことが多い。従って、伝統的方式であってもアラビア数字は随所に使われる。外来語をはじめ外国人などの人名など欧文の単語はできるだけカタカナで表記する。カタカナ表記の括弧内に原文のラテンラテンアルファベット表記を添える。この時ラテンラテンアルファベットは和欧混植の対象となる。

②現代的方式:アラビア数字は新聞と同じように和字として全角形で正立する。頭字語のラテンラテンアルファベット大文字は和字扱いする。商品名などではラテンラテンアルファベット大文字と小文字が入り混じるが、そのとき文字列全体を和字扱いとしたり、または大文字だけなら和字扱いで正立・小文字が入ると文字列全体を横倒しする。どのような種類の文字列を正立させるかあるいは横倒しするかの基準は曖昧で書籍毎に異なるし、書籍の中でも完全に統一されていないときがある。

■縦組みの未来

商品名(iPhone、iPadなど)、サービス名(twitter、facebookなど)、人気グループ名、会社名などの固有名詞にラテンアルファベットが多用されるようになっている。これらはカタカナ表記できないので、出版物にも必然的にラテンアルファベットが増える。縦組みにおいてラテンアルファベットを和字扱いするか欧字扱いするかは、新聞のようにすべて和字扱いする方式から全部を欧字扱いすることまで幅広く明確な基準がない。

アラビア数字は、漢数字に変更する方式から、すべて和字扱いで正立する方式まである。

このように、本文テキスト中のラテンラテンアルファベットとアラビア数字の扱い方はさまざまであり、混乱状態にあると言っても過言ではない。

全体としては伝統的方式から現代的方式への移行過程にあるだろう。そうすると縦組みは移行期的混乱の中にあると言って良い。この混沌状態の結果として新たな縦組み方式が定着するのか、それとも縦組みの複雑さに見切りをつけて、横組みに1本化されるのか?

こうした混沌に加えて、縦組みは横組みに比べて製作コストが高い方式となっていることにも注意が必要である。これについては別途検討する。

[1]「横書き登場」と縦書きと横書きのゆくえ

□■□■□■□■□■□■ご案内□■□■□■□■□■□■

CASオンラインショップでCAS-UBのユーザー登録することで、誰でも30日間だけ無償でご利用いただくことができます。
CAS-UB評価ライセンス

「横書き登場」と縦書きと横書きのゆくえ

「横書き登場」(屋名池 誠著、岩波新書、2003年初版発行)は、日本語の印刷物に横書きが登場してから、現在に至るまでの軌跡を豊富な調査と図版をもとにして丁寧に解説している。

日本語は、現在、縦書き・横書きという2つの書字方向を許す世界でもまれな言語である。その理由は、日本語を表記するのに使う漢字、ひらがな、カタカナという3種類の文字が形態素・音節文字で一字がカバーする範囲が広いこと(p.66)、漢字・ひらがな・カタカナの多くは字形が正方形であって文字を縦方向にも横方向にも続けて書くことができる特性をもっているからである。

それに対して、西欧から入ってきた言語はもともと横方向だけにしか書かれない。これは①ラテン文字が正方形でないというデザインの特性、②ラテン文字は音素に対応する、すなわち語を表すのに多くの文字を使い、文字列をひとつのまとまった形として読み取るという方式になっているためである(p.66)。このため西欧の言語を縦書きするには横転横書きをする必要がある。

日本語は江戸時代までは縦書き専用であった。日本が西欧の文化・技術を取り入れた幕末から明治にかけての時代は、日本語の書字についても混沌の時代になったのは必然である。

さて著者は、明治から戦後までの日本語の書字方向について、次のように整理している。

1. 日本語の横書きが登場したのは江戸幕府が開国したころ。最初は右から左へ書き進めるものであった。右横書きは縦組みの行が進む方向と書き進める方向が同じなのでわかり易かった。
2. 明治初期の辞書は欧字を左横書き、和字を横転縦書きして欧語と日本語の共存を図った。横転縦書きでは、欧語は左から右へ。日本語を左90度回転して縦書きする。横転縦書きは大正13年まで見られる。
3. 左横書きは明治4年の英和辞書で初めて登場した。欧字との共存のためである。また、左横書きは、楽譜、数学、簿記(数字)などに用いられた。こうした左横書きは西欧の文物を本格的に学んだ人、すなわち一部のインテリ向けでハイカラ・西洋文明受け入れ派という印象がある。これに対して、右横書きは切符、地図など民衆向けの用途であった。これは縦組みの行進行方向と文字の読む方向が一致しており、一般人にわかりやすく、また書籍の製本もしやすかったため。
4. 右横書きは、縦書きの印刷物の中で、右横書きを見出し、記事のリード、キャプションなどに使う、縦書き(右横書き併用)のスタイルとしても使われた。これに対して左横書きは専用で使われた。
5. 大正になると、縦書きの印刷物の中で、左横書きを見出し、記事のリード、キャプションなどに使う、縦書き(左横書き併用)のスタイルも使われるようになった。
6. 昭和の戦前は、①縦書き(右横書き併用)のスタイル、②縦書き(左横書き併用)のスタイル、③左横書き専用の3つのスタイルが並存した。但し、左横書きは西欧文化を受け入れる印象があり、右翼政治家などの攻撃を受けることがあった。しかし、効率という面で左横書きを採用しようという動きもあった。
7. 戦後は、一気に、①左横書きが増え、また、②縦書き(左横書き併用)のスタイルと二つがつかわれるようになった。
8. 今後は、左横書き(縦書き併用)に収斂していくのではないだろうか。

■感想
現在では縦組みは、新聞、雑誌、書籍の一部などの印刷出版物の世界のみで見かけるものとなり、出版関連の専門家や趣味の世界で使われるものとなっている。

実用・効率を重んじるビジネス文書などではほとんど使われないし、Webや電子メールはすべて横書きである。

そういう意味では、確かに、既に社会全体としては左横書き(縦書き併用)の時代になっている。日本語の書字方法は西欧文化との遭遇で大幅に変化した。左横書きが定着した明治から戦後までの変化が第一段階とすると、インターネット技術と遭遇している現在は第二段階と言える。現在、Webでは縦書きはほとんど用いられていないし、あまり必要性も語られない。従って、第二段階が、このまま推移すると、縦書きが消滅する方向で収斂する可能性も大きいだろう。

100年~200年単位でみると出版でも縦書きを使う文化が生き残るか、そして縦書きを使い続けるにはどうしたら良いかを考えさせられる。

■書籍の情報
書名:「横書き登場」
著者:屋名池 誠
発行所:岩波新書
発行年:2003年11月初版1刷発行
ISBN:4-00-430863-1

□■□■□■□■□■□■ご案内□■□■□■□■□■□■

CASオンラインショップでCAS-UBのユーザー登録することで、誰でも30日間だけ無償でご利用いただくことができます。
CAS-UB評価ライセンス

UTR#50: 文字の方向特性に関するカウンター提案の概要紹介

縦書き時の文字の方向特性を決めようとするUTR#50に関して新しい提案が3月5日に公開されました。現在公開されているUTR#50(Revision 3)は、Eric Mullerさん(アドビ)によるものですが、このカウンター提案は、LaurentiuさんとDwayneさん(両者ともMS)の共同によるものです。

「Updated Proposal to Revise UTR#50 Unicode Properties for Vertical Text Layout」

Unicode コンソーシアムのUTC #130会議で発表されたものを元にして、(1) Unicode全文字についての方向クラス(Orientation_Class)特性値の組を含めたのと、(2) UTR#50のRevision 3への参照を含むように更新されたものです。

UTR#50のrevision 3(2012年2月10日版、以下、UTR#50-20120210)についての説明はこちらを参照してください:縦書きにおける文字の方向について、UTR#50改訂版ドラフトの内容紹介

1.本提案の概要

(1) UTR#50-20120210は日本語を中心に考えているが、縦書きは日本語だけではないので、一般的な言語の縦組みレイアウトを実装するための文字特性とガイドを定義しなければならない。次のようなシナリオにおける縦書きレイアウトのグリフの方向を決めることができるような文字のデフォルトのクラス化を提供したい。

  • モンゴル、’Phags-paのような縦書きの文字、漢字・ハングルなどの縦書き記法のデフォルト・レイアウト
  • アラビア・デバナガリのような横書き文字のグリフを回転して表示して接続特性を維持する縦書きのデフォルト・レイアウト
  • ラテン文字のような横書き文字をサイン看板などのように垂直に積み重ねる方式のレイアウト

(2) Orientation_Class(以下、方向クラス)という列挙型のUnicode文字特性とアルゴリズムを提案する。これにより次の二つの縦書きレイアウトモードにおいて、任意のテキストのグリフの方向を決定することができる。

  • デフォルトモードでは縦書き時における文字の普通の方向を表す。デフォルトでは漢字は正立であり、ラテン文字は右に回転して横倒しになる。CSS3のtext-orientation特性値”upright-right”にあたる。
  • スタックモードでは、普通は横倒しになる文字が垂直の方向になり、垂直方向に積み重なる。例えば、スタックモードでは漢字は垂直のままであり、ラテン文字は垂直に戻る。CSS3のtext-orientation特性値”upright”にあたる。

方向クラス値はすべてのUnicode文字の上記の二つのモードにおける挙動を記述するもので、一以上の方向属性(次の表)の組み合わせにより定義される。

表1.方向属性
属性 名前 説明
S Stackable 縦書きでグリフを正立して表示可能な文字
R Rotatable 縦書きでグリフを横倒しして表示可能な文字
T Transformable OpenTypeのGSUB ’vert’による置き換えのようにフォントの特性をつかってグリフの字形変換がなされる文字
I Inherited 結合文字のように先行するグリフから方向を継承する文字
A Arrow 矢印や類似の文字
B Break 改行特性値を持つ文字

例えば、ラテン文字の方向クラス値はRS(Rotatable とStackable)であり、デフォルトモードでは回転し、スタックモードでは正立する。アラビア文字はRである。

表2.方向クラス値
クラス値 説明 例 
S Stackableのみ 任意の縦書きレイアウトでグリフが正立する分離記述の文字 象形文字、仮名、ハングルなど
RS Rotatable & Stackable の両方 デフォルトモードでは回転し、スタックモードでは正立する。 分離記述文字の大部分、句読点の一部、デバナガリ文字
R Rotatable のみ 結合記述文字のように隣のグリフとの結合を維持するために回転するもの、ベースラインに従う一部の括弧類
TS 字形変換とStackable グリフは正立のままでフォントの特性により字形変換を蒙る分離記述の文字 カタカナ組み文字、こがきのかな
TR 字形変換とRotatable フォントの特性による字形変換を受けた上でグリフは横倒しになる文字 CJKの括弧、全角幅の括弧
IS Inherited とStackable 結合時は基底文字の方向を継承、分離時は正立する結合文字 かなの濁音・半濁音
IRS InheritedでRotatableまたはStackable 結合時は基底文字の方向を継承、分離時はデフォルトモードで回転、スタックモードで正立する結合文字 一般の付加記号(かなの濁音・半濁音を除く)
IR Inheritedで分離時Rotatable 結合時は基底文字の方向を継承、分離時は回転する結合文字 アラビア、シリア、モンゴルなどの付加記号
A Arrows 矢印はAに分類し、上位のプロトコルでASまたはARSになる
AS Stackableのみの矢印 デフォルトモード、スタックモードともに正立する 一般の矢印
ARS RotatableとStackableの矢印 デフォルトモードで回転、スタックモードで正立する矢印 半角幅の矢印
BR 改行 
 
・方向クラス値は優先度の高い方から低い方への順に並んでいる。例えば、TRではTはRより優先し、TができないときRでも良い。

・方向クラス値は拡張可能である。

・方向属性Rは、UTR#50-20120210のEAVOのS(横倒し)とほぼ同じ。方向属性Sは、UTR#50-20120210のU(正立)とほぼ同じである。UTR#50-20120210のSとUは排他的であるが、方向属性RとSは組み合わせできる。

・多くの分離記述の非CJK文字はRSのようにデフォルトでR、スタック時Sの特性が与えられる。

(4)縦組みにおける双方向テキストについて(省略)

(5)アルゴリズム(概略)
1)Aの文字をAS, ARSに決定する
2)BRが先行しないなら先行モードを続ける
3)縦書きのモードがデフォルトモードのときとスタックモードでそれぞれの文字の方向と変形を行なう。

2.Unicodeの各文字についての方向クラス値

提案のPDFに含まれていますが、これをテキストにしたものがこちらにあります。

http://nadita.com/murakami/utr50-ms-table.txt

3.私見:この提案仕様について、ざっと読んでの疑問

1)デフォルトモードとスタックモードの切り替えのタイミングは?日本語の場合、ひとつの文書中で両方使われるので文書全体ではありえない。そうすると、どういうタイミングで切り替えるのか?段落の中でデフォルトモードとスタックモードを切り替えることになると、これを簡単に実現する仕組みが欲しい。(それともCSSのtext-orientationで切り替えるだけなのか?それなら、Unicodeの仕様にする必要はないだろう)。

2)アラビア文字には分離形と結合形があり、文字ではなくて、単語の中の位置でグリフの形を変える。つまりダイナミックに形が変わるが、この文章では文字のグリフ固定を想定しているように見えてしまう。日本語の漢字やかなの筆文字は結合する、つまり、分離形・結合形はフォント依存になるのではないのだろうか?英語だって手書きだと結合するんだけどな~~

上の1)、2)の疑問はもう少し考えないと・・・

縦組みのPC雑誌における英数字の方向

今日は、縦組みのパソコン雑誌における英数字の使われ方を調べてみました。対象としたのは、日経BP社発行の「日経PC21」2012年3月号です。この雑誌は、ビジネスマンがパソコンを使うためのハウツー情報誌ですので技術とビジネスの接点に位置しています。ハウツーの図版が多いのが特徴です。図版の部分にキャプションと説明文が多くありますが横組みと縦組みが混在しているのも誌面の特徴です。

肝心の英数字の使い方ですが、サンプルとして誌面の一部を紹介します。

(「日経PC21」2012年3月号、66頁の一部)

このようにラテンアルファベットは正立、アラビア数字も正立が基本です。先頭(9頁)から33頁までの記事の中の縦書きになっている部分の方向を確認してみました。

1.ラテンアルファベットは103箇所でてきますが、そのうち102箇所が正立、1箇所だけ横倒しです。

主なパターンを見ます。次のパターンはすべて正立です。

(1)1文字 36箇所。例:Gメール、アクセスA
(2)小文字で始まる単語 27箇所。例:iPad、iPhone、iCloud、iTunes、iPad
(3)“OECD”のように1字1字読む単語:25箇所。例:NTT、USB、HDD、URL、IE、PDF、OK、PFU、SD、ID
(4)先頭文字が大文字,以下が小文字の単語:7箇所。例:Gmail、From、SugarSync、Web、ScanSnap
(5)“NATO”のように単語のように読む:2箇所。例:LAN、NAS
(6)その他 例:Sign In、Free Download、Wi-Fi

横倒しは1箇所だけ:@gmail.com

2.アラビア数字

アラビア数字は、正立で1文字ずつ書くか、2桁までは縦中横で正立です。横倒しはありません。

(1)1文字づつ正立 118箇所。図の番号が55箇所、数値が25箇所です。例:100Kbps、2年契約、2台、1つ、1テラ、2ギガ、1冊、4種類など。
(2)2文字の縦中横 100箇所。図の番号が多く93回です。

「日経PC21」はラテンアルファベットやアラビア数字を原則正立で表記しています。正立の範囲がかなり広いように感じます。但し、すべて正立というわけではなくて「コマンドとかメニュー名は横倒しで表記することもある」とのことです。

縦組み書籍における英数字の使われ方

日本語の縦組み書籍の中で英数字(ラテンアルファベットやアラビア数字)をどのように使うかはかなり悩ましい問題です。

この問題を整理するにあたり、実際の書籍で少し実態を調べてみたいと思います。少しずつになりますが。

例えば、「昭和史発掘9」(松本清張、文春文庫、2005年11月10日新装版第一刷)ではアラビア数字は次の使われ方だけで、年号、日にち、年齢、人数などの数字はすべて漢数字で表記しています。
・表紙の「9」という巻数
・節番号(1,2,・・・)
・箇条書きの項目番号(p.63)
・奥付け(横組)
・目次のページ番号(縦中横)
・柱のページ番号(横書き)
☆最後の3つは横方向。

また、外国人名、国名・地名、外国語由来の単語はカタカナで表しています。そして、アルファベットは奥付け以外には、「A行動記」「B仙台発見遺書」(順序記号)(P.231)「Y判士」(p.294)のような使い方だけで、つまり1文字の記号として使っているだけです。この場合は正立です。

次の例では、「翔ぶが如く五」(司馬遼太郎、文春文庫、2007年4月5日第7刷)でもアラビア数字は目次(縦中横)と柱と奥付け(横組)しかでてきません。本文の中では数字は漢数字表記です。外国人名、地名、外来語はカタカナ表記でラテンアルファベットはエープ山(App-Hill)(p.236)に横倒し表記で使われているだけです。

また、「日本の一番長い日」(半藤 一利、文春文庫、2006年7月10日第1刷)ではアラビア数字は目次、柱、奥付け以外では注番号(縦中横)ででてきます。ラテンアルファベットは、「subject to」の訳についての話題(p.37)で英語として横倒し、K型、A型いづれも1文字で正立のような使い方です。

上の3冊の小説では次のようにまとめることができます。

(1)アラビア数字を横倒しにした例はありません。

但し、目次、注番号、などに縦中横形式で多用されていますので縦中横が使えないときどうするか、と言う問題があります。

(2)ラテンアルファベットは記号として1文字を使うことがあり、このとき正立します。また、英文(単語含め)を表すために使うときは横倒しです。

関連記事:
縦組み書籍における英数字の使われ方―その2(共同通信社の記者ハンドブック)

未来の縦書き文字の表示はどうなるの?

Webなどで日本語の縦書きを表示できるようにしようという標準化プロジェクトが進んでいます。この標準化が進みますとパソコンやスマホを初めとして様々な場所で日本語を縦書きで表示できるようになるでしょう。大賛成・歓迎です。

これに関連して、いま、関係者の間で熱い議論になっているのは、プレーン・テキストを縦書きでどう表示するか、ということです。

プレーン・テキストとはなんでしょうか?現在、多くの方がWebのページや電子メールなどで横書きの文字を読んでいますが、Webページでは文字に大きさやフォントの種類などの様々な指定がなされています。一方、これに対して電子メールを読むときは飾りのない文字を読んでいます。この飾りのない文字をプレーン・テキストと言います。

このプレーン・テキストを縦書きでどのように表示するか、というのは簡単な問題ではありません。さらに、日本の文字だけではなくて、世界中の文字を考慮して、標準を決めようとするとなかなか大変なことです。従って、論点が沢山出てくるわけですが、その中の一つに次があります。

日本語のプレーン・テキストの中にアルファベットや数字を含んでいるとき、アルファベットや数字を縦書きするときはどうすべきか。

まず、従来の横書きでは、日本語の中にアルファベットや数字があったときは、次のように表示されます。

これを縦書きにするとき、アルファベットや数字の表示の仕方として次の図に挙げた3通りを考えることができます。


PDF版

A.は英数字をすべて横に寝かせる方法です。
B.は英数字をすべて正立させる方法です。
C.は英数字の中で、英語の範囲を横に寝かせ、その他の英文字と数字を正立させる方法です。

C.は日本の縦組みの書籍で一般に使われている方法です。これを実際に行なうやり方には2つあります。
C-1.文章を入力するときに、横に寝かせる英数字を半角文字で、正立させる英数字を全角文字で入力する。印刷・表示のときに全角文字を正立させ、半角文字を横倒しする。
C-2.英数字の入力する際には、全角文字と半角文字は区別しないで、何らかの方法で正立する文字と寝かせる文字を判別する。

この中ではどれが良いでしょうか。

少し補足しますと、日本語の表示には多くの場合、英数字に全角形と半角形が使えます。A、B、C-2は全角形と半角形を文字としては区別をしないことを前提としています。つまり、全角形と半角形を文字として区別しないでしかも文字の種類だけで方向を決めるとするとA、B、C-2の選択肢となります。

それに対して、C-1は全角形と半角形を文字として異なるものとして取り扱います。C-1の問題点は全角文字と半角文字を使い分けるのはなかなか難しいことで、原稿レベルでは混乱していることがあります。また、横書きと縦書きを切り替えるときにも少々難があります。あまり推奨されません。

これまでの多くのソフトウエアは全角文字と半角文字を別の文字として扱ってきました。しかし、最近は全角文字と半角文字を同じ文字として、表示の際に全角形と半角形を切り替えることができるようになってきています。全角文字と半角文字を区別しないとするとどうするか?ということを考えないといけなくなるわけです。

○詳細:http://blog.cas-ub.com/?p=614
○この話は、文字、フォント、グリフに関する知識があるとより分かりやすくなります。これについては、現在執筆中の「PDFインフラストラクチャー解説」に詳しく説明しています。興味のあるかたは、EPUB版(未完成)を配布していますのでどうぞ→http://www.cas-ub.com/project/