「新版論文の教室」には書籍の縦組みレイアウトパターンと文字の方向パターンの典型例がある

「新版論文の教室」(戸田山 和久)は本書は現在の書籍の縦組みの複雑さを典型的に表していて、縦組みにおける英数字と記号などの向きの取り扱いを考える上では格好の材料です。なぜならば、日本語縦組み書籍のページレイアウトと縦組みにおけるラテンアルファベット、アラビア数字、記号の文字方向についてそれぞれの典型パターンを見ることができるからです。

I. 本書のレイアウト概要

1. 本書のページレイアウト・パターン
(1) 本文は縦組みです。
(2) ところどころに1ページまたは見開ページ全体を横組みしたページがあります。
(3) 縦組みのページの中に部分横書きの図が配置されているページがあります。

2. 英数字と記号の使い方パターンまとめ
最初に本書の英数字・記号の使い方には次の特長があります。
①本文は縦組みで数字は漢数字を原則としています。つまり伝統的組版に属します[1]。
②順序数としてのアラビア数字は頻出し、和字扱いのラテンアルファベット、記号類も豊富に使われています。
③アラビア数字だけの縦中横のみでなく、ラテンアルファベットと記号を組み合わせた縦中横、カタカナと記号を組み合わせた縦中横も使われています。
④論文の書き方に関するテキストということで文献の参照の記述方法とか、参考文献リストの書き方説明があります。
⑤テキストブックなので間違った例があります。つまり本来使うべきでない使い方の例もあります。

(1) ラテンアルファベットの使い方・パターン
・正立は1文字の記号、頭字語、および項目番号(順序をあらわす記号)として
・横倒しは英語の単語・フレーズ、参考文献引用箇所表示と参考文献一覧の著者名・欧文書名・雑誌名・欧文参考文献のタイトル・出版社名・ページ(p)
・記号と組み合わせての縦中横

(2) アラビア数字の使い方・パターン
・本書は伝統的組版に属します。つまり本文の文中の数字は漢数字が原則です。しかし、アラビア数字も一杯でてきます。アラビア数字の利用パターンのほとんどは章番号、節番号、項目番号、図番号、ページ番号などの順序数、ならびにそれらへの参照テキストです。これらは1から開始して2桁になることがあり、1桁では正立、2桁は縦中横です。ページ番号参照は3桁まで縦中横です。
・数値は原則漢数字でアラビア数字正立はあまり出てきません。但し、例外はフォントサイズを表すポイント数がアラビア数字の数値です。慣用でアラビア数字と判断しているのでしょう。漢数字基本で書いても、漢数字で表すのに不適切な数値があるということです。
・A4などの慣用句は1文字づつ正立です。
・本文中の年号は漢数字ですが、参考文献の発行年とページ数はアラビア数字で横倒し、また引用ページ番号の表記は横倒しです。但し、和書・雑誌の表題はアラビア数字正立もでてきます。「表題」のように原題を変更できないときは、原則と異なる表記も必要となります。

(3) 記号類の使い方・パターン
記号類についても正立・横倒し・縦中横(ラテンアルファベットと組み合わせで正立する)が出現します。

Ⅱ 本書における英数字・記号の使い方(詳細)

1.著者による全角・半角・数字の表記

この本の著者は、全角・半角・数字の表記について次のように書いています[2]。

○全角・半角・数字の表記の項(pp.256-7)
(1) 横書きの文章の場合、数字や年号はすべて半角の算用数字というのが基本だ。全角数字を使って「1995年」と書くのはやめる。
例外として、熟語や固有名詞の一部になっている場合は漢数字を使う。悩ましいのは「1つ」「2つ」「第1に」とするか「一つ」「二つ」「第一に」とするかだが、これはどちらもある。統一が取れているのが大事。算用数字で「1つ」と書く場合は、半角ではなく全角を使う。
(2) 外国語も半角がきまりである。

2. ラテンアルファベットの使い方・パターン例
(1) 1文字毎正立
・順序を表す:付録A~E、パターンA~パターンC、成績のA、B、C
・記号:「Aなんじゃ」、「A」、AならばBである、AであればB、Aではない/Aである、Aの話、Bの話、aとbが似ている、物体X
・頭字語:NHK、OKだから、ATOK、DVD、NASA、RPG法、UFO、CD
・人名:R・A・ラファティ
・慣用句:A4

(2) 縦中横
・対立仮説H´ [Hとプライムの組み合わせ]
・(a)も(b)も [()との組み合わせ]

(3) 横倒し
・欧文単語~文:(right)、concept、conception、real、検索結果がaggregation, assemblage, assembly, assortment, bee, body, breedと… 、“Pay it forward”、“it”、“You’re really something”、euphemism、(Sokal’s Hoax)、(profession)、comestibles、food、skelton、abduction、induction、dedcution、(the thing)、(references)、
・Webのサービス名・URL:infoseek、Yahoo、Google、goo、http://www…、Reliable sources、CiNii Books (http://ci.nii.ac.jp/books)、CiNii Articles (http://ci.nii.ac.jp/)
・引用箇所を表記するときの文献名、著者名、ページ番号:(Papinou 1996 p.2)
・英文参考文献の著者名、論文タイトル、書名・雑誌名、出版社名、出現ページ範囲:Simpson, L. (2991). “How to Play the Alto-Saxophone”, Murphy, B. G. ed. Modern Jazz Performance, Horny Dick Press. pp. 156-201

3. アラビア数字
(1) 正立
・章番号:第1章~第9章
・章番号参照:第2章では、第4章の内容には
・節番号:1-1~9-5
・節番号参照:3-6でも触れたが、
・項目番号:その1~その5、【1】~【3】[【】は数字の上下につき、数字のみ正立]、【鉄則1】~【鉄則9】【練習問題1】~【練習問題9】、(2-1)~(2-3)、テクニック1~、条件1~条件2、例1、例2
・項目番号参照:[鉄則1]
・図番号参照:図1~図9 [図自体は横書きであり、図番号・キャプションは横書き。本文内の図番号参照は縦書きである。]
・横書きページ中のテキストを縦書き内から参照:アウトライン・バージョン2
・慣用句:A4
・数値:0点、10・5ポイント[3]

(2) 縦中横
・目次項目のページ番号:2桁、3桁のページ番号が縦中横
・項目番号:(1)~(3)[これはU+2474~でも可]、【鉄則10】~【鉄則36】、【練習問題10】~【練習問題17】
・ページ番号参照:19ページ[2桁ページ番号参照]、108~109ページ[3桁ページ番号参照]
・図番号参照:図11~
・注番号と注の合印:(23)と注の合印(23)、注23
・数値(2桁):12ポイント

(3) 横倒し
・引用文献参照の出版年・ページ番号:(Papinou 1996 p.2)
・参考文献の出版年・ページ番号:ラテンアルファベットの横倒しの例を参照。

4. 記号の使い方・パターン
(1) 正立
・部番号:Ⅰ~Ⅴ
・区切り記号:!?‼
・箇条書き:㋑㋺…、①②…、
・その他:α、★(箇条書きラベル参照)、★(箇条書きラベル)、/、段落の区切りに(/)を入れる、%、†

(2) 縦中横
・括弧がローマ数字と組み合わせて正立:(i)~(ⅲ)
・縦中横で記号の方向は変わらない:カ*(記号の派生)

(3) 横倒し
・「」『』【】()[]
・… ― = ~:;“”.,
・矢印:⇔、→

※次は、横倒し文脈内の例である。
・;[引用文献の文献間区切り]
・英語と一緒:“”、’、.、,

5. 横書きのページ
・pp.108~109:(1)~(3)、Ⅰ~Ⅵ、NASA、→、Groupthink、?
・p.111:バージョン0、Ⅰ~Ⅴ、(1)~(3)が登場する。
・p.117:同
・p.127:[]、()、?、/
・p.136:バージョン1、「」
・p.143:バージョン2
・p.176:aもbも、AならBである

6. 部分横書き
・柱:章番号
・図:図1~図16(ラベル)、根拠1~、∴、()

Ⅲ 書籍の情報
書名:「新版論文の教室」
著者:戸田山 和久
発行所:NHKBooks
発行年:2012年8月第1刷発行
ISBN:978-4-14-091194-5


[1] 伝統的組版については「縦組み時の文字方向について:UTR#50のSVOデフォルト、MVOデフォルト、現代方式、伝統方式、新聞方式の相違を分析する」を参照。
[2] この部分は、漢数字とアラビア数字の使い分けと、全角・半角の使い分けの話が入り混じっています。このうち、全角・半角については横書きでは英数字は半角が原則としています。ただし、アラビア数字1文字のときだけは全角としています。ここでいう半角・全角は、専門的には文字コードではなくてグリフ(字形)と解釈すべきです。但し、InDesignのような印刷専門のソフトでは文字コードとグリフを独立に扱うことができますが、オフィスソフトのような一般向けのツールの多くは文字コードとグリフを独立に扱う機能がないことが多いので、「1つ」は全角文字(コード)を使うと解釈しても問題は生じません。
[3] 縦横変換の難しい例である。横書きで10.5のように2桁の数字と1桁の数字が連続するとき、10を半角、5を全角(10.5)とすると非常に見にくい。横書きでは10.5→縦書きでは10・5と小数点が別の文字になる。

□■□■□■□■□■□■ご案内□■□■□■□■□■□■

CASオンラインショップでCAS-UBのユーザー登録することで、誰でも30日間だけ無償でご利用いただくことができます。
CAS-UB評価ライセンス

縦組み時の文字の方向に関する議論を解きほぐす試み (1)コンテンツの記述

春先から、「縦組み時の文字コード正立論」というテーマで何回かブログを書き、また、資料をEPUBにまとめてきました。そろそろ、その結論を出さなければならないだろうと考えて、Unicodeコンソーシアムのフォーラムに質問および意見を投稿しました。この投稿に関しては、Adobeの山本太郎氏から強い反対意見が出る[*1]など、残念ながら多くの賛成を得るにいたっていません。

また、Twitterの議論でも縦組時の文字の方向をどうすべきか、ということに関して多くの方から多数の意見が出ています[*2]。

国際電子出版EXPOの会場でも私の主張に同意される方、あるいは意見を異にする方数名の方と直接意見交換をさせていただきました。

この議論がとても難しい理由は、(1) これまで受けた職業的訓練など発言者の経験、あるいは美観といった主観に基づく判断と、(2) デジタル組版に関わる技術要素が極めて高度になっていることがあります。

(1) と(2)の両方が複雑に組み合わさっているため、問題の理解が難しく、従って、適切な解決策を提案するのが非常に難しくなります。そこで、あらためて(2)について検討することで、複雑に込み入ってしまった問題を解きほぐすことを試みてみたいと思います。

まず、テキストコンテンツ(Unicodeで記述されているものとします)があったとき、それが画面または印刷物(紙)として目に見える過程を図示し、それにどのような技術要素が関係しているかを簡単な絵で表してみます。

最初に、これらの技術要素について順番に簡単な解説を試みます。

1.コンテンツの記述

テキストコンテンツは一般には符号化文字集合で規定された文字コードを使って表現します。符号化文字集合としては、2000年ごろまではシフトJISが主流でした。これまでに蓄積されたコンテンツの量としては、シフトJISが圧倒的に多いと思います。

例えば、青空文庫はJIS X0201(但し、半角カナを除く)とJIS X0208の文字を使って入力し、シフトJIS形式で保存することになっています。JIS X0201(半角)とJIS X0208(全角)ではアラビア数字やラテンアルファベットがダブっていますが、これについては、半角と全角を使い分ける簡単な規則を次のように定めています[*3]。

・縦組みで正立しているラテンアルファベットは全角で、英単語は半角で入力します。
・アラビア数字は1文字のときは全角で、2文字以上は半角で入力します。

青空文庫の全角・半角の使い分けはシフトJISを使うときの基本的な方法と言って良いと思います。

さて、現在の多くのアプリケーションで採用している、符号化文字集合は、Unicodeが主流になっていると言って良いと思います。そして、今後新しく作られて流通するコンテンツはUnicodeベースに移行していくことになると予想できます。

2.シフトJISとUnicodeの違い

シフトJISは、MS-DOSのために開発された文字の保存方式(符号化方式)です。従って、MS-DOSが動作する環境であるPCに密接に関係しています。すなわち、文書を表示するディスプレイは半角と全角のセルをもつキャラクタ・ディスプレイであり、ドットパターンとして作成された文字がROM(リードオンリーメモリ)に保存されています。

JIS X0201の文字は半角幅のセルに表示され、JIS X0208の文字は全角幅のセルに表示されるということで文字コードとその表示幅は完全に1対1対応しています。

これに対して、Unicodeは新しい世代のコンピュータのための文字集合として設計されています。文字を表示する環境は、ビットマップ・ディスプレイであり、文字の字形はアウトライン(ベクトル)としてフォントファイルに収容されています。これにより、文字の幅も半角・全角というような固定幅から開放されて、プロポーショナルな幅をもつ字形のデザインが可能となっています。

こうした環境変化に対応し、Unicodeは文字とグリフ(字の形)を分離するCharacter-Glyphモデルを採用し、Unicodeは抽象化された文字(Character)を定義することになっており、文字の表示形は定義しないとされています。

Unicode標準はグリフイメージを定義しない。標準は、グリフがどのように可視化されるかではなく、文字がどのように解釈されるかを定義する。(中略)Unicode標準は、画面に見える文字の詳細な形、大きさ、方向は定義しない[*4]。

[*1] Fundamental questions
[*2] http://togetter.com/li/251192
[*3] 青空文庫工作員作業マニュアル (2011年11月20日第二版)
[*4] Unicode 仕様書第1章より引用