戦前の岩波文庫における英数字の扱い

神田の古本屋にいって、戦前の本を探してみました。さすがに戦前の古本は店頭にもあまりありませんが、岩波文庫の「ミレー」(文庫本165頁)を見つけました。印刷・発行は昭和14年10月です。

本文はもちろん縦組みですが、表紙は横組みで書名や著者名などは、文字を右から左へ進めています。

以下、ラテンアルファベットと数字の使い方の紹介です。

ラテンアルファベットが、人名の欧文表記、書名表記、詩の文章などを示すために使われている場合は、横倒しである。これらの箇所は本文テキスト中で文脈上特別な意味付けができるものが多い。

正立の箇所は、人を指す1文字の代名詞、1文字のイニシャルに使っているときだけである。

数字については年の表記は本文ではほとんど漢字になっているが、アラビア数字が書籍の書名とともにその発行年などの表記に使われているときは横倒しになっている。わずかに数箇所書籍と関係なくアラビア数字の年表示がでている。その年表記の漢数字との使い分け基準はあまりはっきりわからない。

1.ラテンアルファベット
ラテンアルファベットは、本文中氏名、単語などで出現する。その箇所を分類すると訳文の原文、氏名、書名、雑誌名、会社名、引用である。これらは横倒しの欧文プロポーショナルフォントで組まれている。

(1)横倒し

a) 訳文の原文
「いまわの際」(in extremis)
「美術新報」(“Gazette Des Beaux Arts”)
「食事」(La Becqée)
「第五講演(Leeture)」
「美は題材とは関係ない」(“La belezza è lontana dalla materia”)
「沈黙は耳を澄ます。」“Silence listens”
「沈黙は満足していた。」“Silence was pleased.”
「些事を斥けよ。」(“Relinqne curiosa”)
「神ハ高慢ナル…」(Deus resistit …) (預言者の言葉)

b) 氏名
Alfred Sensier (1815-1877)
Miss Clementina Black

c) 書名、雑誌名
A. Sensier 「ジャン・フランソワ・ミレーの生涯と作品」(“La Vie et l’Œuvre de J.-F. Millet,” 1881)
“The Popular Library of Art”
“Talks on Art” (1875)
“Atlantic Monthly”
(“Gazette Des Beaux Arts” 1877-85)
参考書目の書名に多数(著者名、書名、発行年月、発行所などの形式)

あとがき中の原典参照部分:
“Millet”, by Romain Rolland, Duckworth & Co.
The Popular Library of Art
Alfred Sensier; La Vie et l’Œuvre de J.-F. Millet. A Quantin, Paris. 1881
Etienne Moreau-Nélation : Millet, raconté par lui-même. 3 vols. Henri Laurens, Paris, 1921
“CUR ARS PICTURAE APUS ITALOS XVI SAECULI DECIDDERIT”, 1895
“La Décadence de la Peinture italienne.”, 1896
“Revue de Paris”
“VIE DES HOMMES ILLUSTRES”

d) 社名
Duckworth & Co.

e) 引用段落
Et jam summa procul villarum culmina fumant
Majoresque cadunt altes de montibus umbrae

“Insere, Daphni, pyros; carpent tux poma nepotes” (ヴィルギリウス)

f) 引用文
“Et si mon …” (イタリック体、聖書の言葉、ルカ傳)

(2) 正立
ラテンアルファベットの正立は氏名のイニシャルまたはL氏のように人を指すために使用している。

W・モリス・ハント
P・J・プルードン
M・ド・シャントルー
M・L・ルトロンヌ
L氏(13箇所)

2.アラビア数字
数字はほとんど漢数字である。年月日などは漢数字表記が原則である。

(1)横倒し
アラビア数字は書籍の発行年、参考書目録の(海外)書籍発行年、人名につづく生年-没年に使われている。このときはラテンルファベットの書籍名ととも横倒し表記になっている。

書籍発行年数以外に本文にはアラビア数字の横倒しが2箇所ある:①「その当時(1853-54) 」、②「美術史教授時代(1902 」である。但し、このような年の表記は多くの箇所では漢数字になっている。アラビア数字にしている基準が明確ではない。

横倒しアラビア数字は半角幅のようだ。

(2)正立
正立のアラビア数字は、本文ノンブル(正立)のみである。目次の章見出しの頁位置示す頁番号は漢数字である。

3.書誌情報
書名:ミレー
著者:ロマン・ロラン著
訳者:蛯原 徳夫
発行時期:昭和14年10月
体裁:文庫本、164頁
発行所:岩波書店

■CASオンラインショップでCAS-UBのユーザー登録をしていただくと、誰でも30日間だけ無償でご利用いただくことができます。
CAS-UB評価ライセンス

縦組みにおける半角文字の方向―MS-DOSの一太郎と松

縦組みにおける半角文字の扱いについて、今回は、MS-DOSの一太郎と松を調べてみました。

手近にあるPC-9801が動かないので、エプソンのPC98互換機(PC-486 NOTE AU)を動かして、一太郎dash、松Ver.5をインストールして動かしてみました。一太郎と松はMS-DOSの時代にもっとも人気があったワープロソフトです。一太郎dashはノートパソコン向けに軽量化したタイプ。松Ver.5はシリーズの最後の方の製品です。

両方とも縦組み文書を作るときは、横書きで編集します。そして、印刷するときにプリンタの印刷方向と用紙の方向、および文字の向きを調整して縦組みを実現します。現在は画面上で縦組みのまま編集することができますが、当時のパソコンソフトではそうした編集操作はできませんでした。

また当時のパソコンのプリンタはページを1ページずつ取り扱う方式(ページプリンタ)ではなくて、一行ずつプリントする方式であったことも忘れることができません。

今回、プリンタは既になく、紙に印刷できないので、印刷プレビューの画面で文字がどうなるかを見てみました。

1.一太郎dash

一太郎dashの印刷プレビュー画面は次の写真です。横組では用紙上辺は画面の上辺にあたりますが、縦組みでは用紙上辺が画面の左辺になります。

縦組み文書であっても編集時は横書きで編集しますので、漢字も半角英数も文字が画面に対して正立の状態です。

そして、印刷時に漢字を左に90度回転して、用紙の上辺に対して文字の上辺が対応するようになります。一方、半角英数は回転せずに画面に対して正立のままです。結果的に、漢字に対しては右に90度回転した状態となります。

2.松ver.5

松Ver.5の印刷プレビュー画面は次の写真です。横組みでも縦組みでも画面の上辺が用紙の上辺になります。

縦組み文書であっても、横書きで編集しますので編集時は漢字も半角英数も文字が画面に対して正立の状態です。編集時の行は横方向で文字は左から右に進みます。

そして、印刷プレビューでは漢字は正立、半角英数は右に90度回転して横倒しです。行が縦になり、文字が上から下に進みます。

3.漢字と半角英数で方向が違う理由は?

一太郎も松も縦組み文書を印刷した結果は、用紙の向き(用紙上を上)に対して漢字は正立し、半角英数は右に90度回転します。

漢字が正方形なのに、半角英数は幅が1/2幅なので、漢字に対して90度寝かせるように出力することで、行の長さが横書きのときと同じになるからでしょう。

この方法は、先日のワープロ専用機ではNECの文豪と同じやり方です[*1]。

MS-DOSの時代には、文字を半角と全角のセルに表示する技術が基本になっており、文字の字形を自由自在に変形して表示することは難しかったのです。この文字の表示・印刷の技術上の制約上のために半角英数を横倒しにしたのではないだろうかと思います。

なぜ、このような設計になったかは開発担当者に確認する必要がありますが、おそらくすでにその設計理由を確定するのはできないように思います。弊社に「新松」の開発者が数名是移籍していますが、彼らに聞いても、「もう忘れてしまった。」という回答が帰ってくるのみです。

[*1] 縦組みにおける半角文字の扱い―ワープロ専用機はまったくばらばら

縦組み時の文字の方向に関する議論を解きほぐす試み (1)コンテンツの記述

春先から、「縦組み時の文字コード正立論」というテーマで何回かブログを書き、また、資料をEPUBにまとめてきました。そろそろ、その結論を出さなければならないだろうと考えて、Unicodeコンソーシアムのフォーラムに質問および意見を投稿しました。この投稿に関しては、Adobeの山本太郎氏から強い反対意見が出る[*1]など、残念ながら多くの賛成を得るにいたっていません。

また、Twitterの議論でも縦組時の文字の方向をどうすべきか、ということに関して多くの方から多数の意見が出ています[*2]。

国際電子出版EXPOの会場でも私の主張に同意される方、あるいは意見を異にする方数名の方と直接意見交換をさせていただきました。

この議論がとても難しい理由は、(1) これまで受けた職業的訓練など発言者の経験、あるいは美観といった主観に基づく判断と、(2) デジタル組版に関わる技術要素が極めて高度になっていることがあります。

(1) と(2)の両方が複雑に組み合わさっているため、問題の理解が難しく、従って、適切な解決策を提案するのが非常に難しくなります。そこで、あらためて(2)について検討することで、複雑に込み入ってしまった問題を解きほぐすことを試みてみたいと思います。

まず、テキストコンテンツ(Unicodeで記述されているものとします)があったとき、それが画面または印刷物(紙)として目に見える過程を図示し、それにどのような技術要素が関係しているかを簡単な絵で表してみます。

最初に、これらの技術要素について順番に簡単な解説を試みます。

1.コンテンツの記述

テキストコンテンツは一般には符号化文字集合で規定された文字コードを使って表現します。符号化文字集合としては、2000年ごろまではシフトJISが主流でした。これまでに蓄積されたコンテンツの量としては、シフトJISが圧倒的に多いと思います。

例えば、青空文庫はJIS X0201(但し、半角カナを除く)とJIS X0208の文字を使って入力し、シフトJIS形式で保存することになっています。JIS X0201(半角)とJIS X0208(全角)ではアラビア数字やラテンアルファベットがダブっていますが、これについては、半角と全角を使い分ける簡単な規則を次のように定めています[*3]。

・縦組みで正立しているラテンアルファベットは全角で、英単語は半角で入力します。
・アラビア数字は1文字のときは全角で、2文字以上は半角で入力します。

青空文庫の全角・半角の使い分けはシフトJISを使うときの基本的な方法と言って良いと思います。

さて、現在の多くのアプリケーションで採用している、符号化文字集合は、Unicodeが主流になっていると言って良いと思います。そして、今後新しく作られて流通するコンテンツはUnicodeベースに移行していくことになると予想できます。

2.シフトJISとUnicodeの違い

シフトJISは、MS-DOSのために開発された文字の保存方式(符号化方式)です。従って、MS-DOSが動作する環境であるPCに密接に関係しています。すなわち、文書を表示するディスプレイは半角と全角のセルをもつキャラクタ・ディスプレイであり、ドットパターンとして作成された文字がROM(リードオンリーメモリ)に保存されています。

JIS X0201の文字は半角幅のセルに表示され、JIS X0208の文字は全角幅のセルに表示されるということで文字コードとその表示幅は完全に1対1対応しています。

これに対して、Unicodeは新しい世代のコンピュータのための文字集合として設計されています。文字を表示する環境は、ビットマップ・ディスプレイであり、文字の字形はアウトライン(ベクトル)としてフォントファイルに収容されています。これにより、文字の幅も半角・全角というような固定幅から開放されて、プロポーショナルな幅をもつ字形のデザインが可能となっています。

こうした環境変化に対応し、Unicodeは文字とグリフ(字の形)を分離するCharacter-Glyphモデルを採用し、Unicodeは抽象化された文字(Character)を定義することになっており、文字の表示形は定義しないとされています。

Unicode標準はグリフイメージを定義しない。標準は、グリフがどのように可視化されるかではなく、文字がどのように解釈されるかを定義する。(中略)Unicode標準は、画面に見える文字の詳細な形、大きさ、方向は定義しない[*4]。

[*1] Fundamental questions
[*2] http://togetter.com/li/251192
[*3] 青空文庫工作員作業マニュアル (2011年11月20日第二版)
[*4] Unicode 仕様書第1章より引用

縦組みにおける半角文字の扱い―ワープロ専用機はまったくばらばら

UnicodeにUTR#50という仕様案ができて、Unicodeの各文字(キャラクタ)に対して縦組み時のデフォルトの方向を定義しようとしています。すでに、このブログで何回も書きましたが、現在、そのことをいろいろ考えています。半角形と全角形の扱いを少しさかのぼってみようと思い、初期のOA機器であるワープロ専用機での扱いを調べてみました。

ワープロ専用機はもう販売されていませんが、1980年代の半ばに登場し、1990年代に急速に普及したのですが、マイクロソフト Wordや一太郎などのパソコン用ワープロソフトとの競争で売れなくなり、2000年代初頭までに全メーカが生産終了してしまいました。もう使用している人はあまりいないと思います。

ワープロ専用機で縦組み文書を編集・印刷するときの半角文字の扱いを調べてみてびっくりです。各社各様でまったくばらばらです。

●ルポ、書院は半角文字も正立させていますが、なんと高さを1/2にしています。
●文豪 JX-750は半角文字横倒し、富士通OASYS LX-9500SDは横倒しと正立です。

当時のワープロ専用機の表示・印刷の技術的制約の中で各社が取り扱いを工夫していたのでしょう。
詳しくは下の報告と模式図をご覧ください。

■各社のワープロ専用機の半角縦書き文字の扱い(報告)

会社にあった主要ワープロメーカの4機種の縦書き編集における文字の方向(印刷については、インクリボン等が切れているため、ワープロ上のプレビュー機能での確認によります。

●東芝RUPO JW06H
(1)縦書き文書編集時、画面での縦書き表示無し(横書き表示で編集して印刷時縦書き)

(2)印刷
全角文字の正立に対して
半角文字も正立し、全角1文字分の高さに2文字を配置(文字の高さを1/2に変形)

●シャープ 書院 WD-V01
(1)縦書き文書編集時、画面での縦書き表示無し(横書き表示で編集して印刷時縦書き)

(2)印刷
全角文字の正立に対して
半角文字も正立し、全角1文字分の高さに2文字を配置(文字の高さを1/2に変形)

●NEC文豪 JX-750
(1)縦書き文書編集時の縦書き表示有り
画面表示
縦書き文書編集時
全角文字の正立に対して
半角文字も正立し、全角1文字分の高さに2文字を配置
(2)印刷
全角文字の正立に対して
半角文字は横向きで全角1文字分の高さに2文字を配置

●富士通 OASYS LX-9500SD
(1)縦書き文書編集時の縦書き表示有り
画面表示
縦書き文書編集時
全角文字の正立に対して
半角文字は横向きで全角1文字分の高さに2文字を配置

(2)印刷
「縮小文字の向き」という設定があり、下記の2種類から指定
「横向き」 あるいは「縮小文字2文字単位で縦向き」
(この機種では縦書き指定時、必ず選択させられる。一応、初期選択は「横向き」)

a. 「横向き」の場合
全角文字の正立に対して
半角文字は横向きで全角1文字分の高さに2文字を配置
(画面表示と同じ)
b. 「縮小文字2文字単位で縦向き」の場合
全角文字の正立に対して
半角文字も正立し、全角1文字分の領域に半角2文字を配置
AB
CD
E

●模式図

個人的な感想ですが、1990年代の初頭~前半は、私も「リッチテキスト・コンバータ」を中心に、ワープロ専用機-パソコンソフトの文書変換仕様などを作成したり、開発に関わっていました。当然半角文字の扱いは調べていたはずなのですが、改めてすっかり忘れていたことに気がついて、忘れていた自分に呆れてしまいました。

●「リッチテキスト・コンバータ

メルマガを縦組みのEPUB3やPDFに自動変換する方法の検討

UTR#50の仕様のことを何回も書いていますが、CAS-UBでこのことを取り上げる理由の一つとして、横書きで書いたメルマガを縦組みのEPUB3やPDFによる電子書籍で読むことができるようにしたい、という狙いがあります。

CAS-UBでは、メルマガをEPUBに変換するサービスを計画していますが、いまのところ横組みについての目処をつけた段階です。その後の段階として縦組みはもちろん考えているのですが、縦組みにするには一段階高いハードルがあります。

そう、「文字の方向」です。ほとんどのメルマガでは、英数字と記号が頻繁に出てきます。その英数字と記号の文字コードはほとんどが、Unicodeの基本ラテンブロック(ASCII)範囲のコードになっています。そして、現在、多くのEPUBReaderは、基本ラテンブロックの文字を横倒しにしています。このためメルマガ中の英数字が全部横倒しになってしまいます。これではとても読めません。

ということで、横倒しの文字の方向を調整するのが次のハードルとなります。処理方法として①1文字ずつ正立、②数字は2文字ペアで縦中横、③文字列全体を横倒し、とするとして、この処理を行なうべき箇所がどの位あるかをカウントしてみます。

現在のメルマガの最高峰とも言える『津田大介の「メディアの現場」』(Vol.36、2012年6月30日発行)を題材にして、その中から数ページを取り上げて、①~③の発生頻度を見てみましょう。

CAS-UBでEPUB変換して縦組スタイルシートを適用したものをAdobe Digital Editions 1.8.1で表示して、①にしたら良い箇所を緑で、②にしたら良い箇所を橙で、③にしたら良い箇所を水色の枠で囲ってしめしてみました。

1.「今週のニュースピックアップ」の中の1ページ

このページは、①7箇所、②4箇所、③なしとなります。

2.津田大介クロニクルの中の1ページ

このページは、①8箇所、②1箇所、③4箇所となります。

3.今週の原発情報クリッピングの1ページ

このページは、①7箇所、②7箇所、③5箇所となります。

4.奥の細道の1ページ

このページは、①9箇所、②10箇所、③1箇所となります。

●以上の4ページだけでみますと、

①英数字を1文字ずつ正立させると良い箇所:31箇所
②数字をペアで縦中横にすると良い箇所:22箇所
③英数字を文字列全体として横倒しすると良い箇所:10箇所

となります。

いままでに様々な縦組み書籍の文字の方向を調べて、このブログで結果を報告してきました。それと凡そ同じ傾向を示しています。

数字については横倒しすると良い箇所はほとんどなくほぼ正立が望ましくなります。特に縦中横にすると良い箇所が非常に頻繁に出てくるのが特徴です。

『津田大介の「メディアの現場」』は、URLが頻出します。この例でもURLが4箇所ありますが、それを除くと通常に書かれた日本語文章で英数字を横倒しすべき箇所は少ないことが分かります。

さて、いま、手作業で方向指定方針を示したのですが、これを自動的に判別して最適なマークアップをすることができるとメルマガの縦組みEPUB、縦組み書籍化が自動的に実現できることになります。

英数字がデフォルト正立であれば、このマークアップ数は半減しますが、プログラムで処理するなら作業負荷はどっちでもそれほど変わりません。

看板の文字にみる英数字の方向

春先からずっと議論しているUnicodeのUTR#50という仕様のこと。文字のデフォルト方向を決めようというものなのです。

どうも、Twitterに登場するデザイナーとかDTP制作者は英数字のデフォルトが横倒しになってもあまり困らないようで、世間の感覚とずれているように感じます。このずれは、ある印刷業界に詳しい人の忠告では、彼らはずっと昔からそれでやってきたし、そのように訓練されてきており、現状でちゃんと仕事ができているし、困っていないから話しても無駄なのだそうです。プロとはそういう訓練を受けている人のことなのでしょう。まさしくプロフェッショナル恐るべしです。

で、その忠告者によると、そういう人にはご苦労さんとだけ言って議論は避けるようにする方が良いと。

しかし、Twitterに出てきて意見を言うのは、みんなプロばかりなんですよ。

まあ、そんなことで、会社の近くの看板の文字をいくつかピックアップして憂さ晴らし。

1.地名番地

近くの中央区の看板ですが、数字の20は縦中横という方式で正立しています。Chuo-ku Nihonbashi Kodenmachoの文字も縦中横という方式で正立です。

2.東京三菱FUJ銀行

UFJはアルファベット大文字で正立です。

で、どうよ、やはり世の中正立が多いじゃないかと思ったら・・・

3.みずほ銀行

みずほ銀行の看板には、横倒しのロゴが入っていました。まあこれは正式な銀行名ではなくて、デザインされたロゴなので、他とか少し違うのでしょうね。

「銃・病原菌・鉄」に見る縦組みにおける英数字の扱いーアラビア数字はほとんど正立する

「銃・病原菌・鉄」(ジャレド・ダイヤモンド著、倉骨 彰訳、草思社、2000年10月発行)は上下巻合計約650頁の大著です。最近、文庫本が出版されていますが、ここでは単行本版を対象にして英数字がどのように組版されているかを見てみます。

1.全体

本文は縦組みですが、索引は横組みです。なお、原書には巻末に参考文献一覧がありますが、訳文では参考文献一覧は省略されており、Webで公開されています。

また、ページ番号は小口側にアラビア数字で表記、左頁下に片柱で章番号と章タイトルを横組み表記しています。章タイトルは本文は漢数字表記ですが、柱はアラビア数字表記に変更しています。

図のキャプションは横組みで、図番号は図1-1の形式です。図の説明文はキャプションの下についており横組みで、例えば「紀元前7000年」のように年数はアラビア文字で表記しています。

表は横組みであり、表キャプションは横組みで、表の番号は表5-1の形式です。

2.目次

部番号、章番号、ページ番号はアラビア数字です。章番号は2桁まで、ページ番号は3桁までですが2桁以上は縦中横となります。

3.本文

3.1 ラテンアルファベット

(1) ラテンアルファベットが正立で使われている箇所

a.一文字づつ正立――91箇所

本文中ではラテンアルファベットが1文字ずつ正立で使われている箇所が一番多くなっています。記号、頭字語のほか、言語の表記や音を表すために使われています。

(本文中の頁)

B型やO型、A型(p.28)、「最古といわれていたX」より古いX、古いX (p.52) 、DNA (p.56)、BC (p.138に2回)、bc (p.138)、牡馬Aは牡馬B、C、D、Eより…牡馬Bは序列が上のAには…序列が下のC、D、Eを…CはAとBに服従し、DとEを従えて (p.257)、線文字B (下p.17、下p.18、下p.24、下p.28、下p.40、下p.42に3回、下p.48)、線文字A (下p.28、下p.48)、 他の欧州語にある「b」「c」「f」「g」「w」「x」「z」(下p.29)、「c」(下p.29)、「j」、「u」、「w」(下p.29)、頭音(a、b、g、dなど)(下p.30)、「g」が、「c」に、「g」を(下p.31)、「D」「R」「b」「h」を使って、チェロキー語の「a」「e」(下p.34)、「l」と「r」(下p.40 2回)、「p」と「b」、「g」と「k」と(下p.40)、「XがYを発明した」(下p.55)、黄色のHBが(下p.57)、QWERTY(下p.60に3回、下p.61、下p.62、下p.317に8回、下p.318に3回)、ABO型のBとMNS型のS(下p.138)、南方振動(ENSO)(下p.148)、カリフォルニア州ロスアンゼルス校(UCLA)(下p.281)、Dvorak配列(下p.318)

b.縦中横――23箇所

ラテンアルファベットを縦中横で表記している箇所の大部分は言語の音を表しています。

○出現箇所
「sh」や「th」(下p.17)、「ti」(下p.22)、(ta、ti、tu、te、toなどのように)(下p.24)、マヤの「ne」という音節は「しっぽ」を意味する「neh」と同じ…)(下p.24)、英語で「th」(下p.29)、「ts」(下p.29)、「si」「ni」の音節(下p.34)、「se」…「yu」「sa」「na」…「ho」…「li」…「nu」(下p.34)、「ph」、「kh」(下p.40)

(2)ラテンアルファベットが横倒しで使われている――80箇所

横倒しで使う箇所は、原典を表したり、元の言葉の注記、言語表記に関わる使い方が中心です。

○出現箇所
「Cargo(積荷)」(p.18, p.29)、『人間はどこまでチンパンジーか(The Third Chimpanzee)』(p.38)、「持てるもの(Haves)」と「持たざるもの(Have-nots)」(p.133)、オリーブ(Olea europea)(p.197)、「family」が「fa-mi-ly」の…(下p.17)、英語で「four」…ロシア語で「chetwire」…フィンランド語で「neljä」…インドネシア語で「empat」(下p.20)、「-tion」(下p.22に2回)、「shun」(下p.22に2回)、「believe」という…「蜂(bee)の絵」と「葉っぱ(leaf)の絵」…「bee-leaf」(下p.22)、歯(tooth)、話(speech)、話し手(speaker)などを(下p.22)、二(two)、相互(each)、山頂(peak)を付加すれば、△two=tooth、△each=speech、△peak=speaker(下p.22)、’aleph=ox雄牛、beth=house家、gimel=camelラクダ、daleth=doorドア(下p.30)、裁判所の書記が「We order John to deliver the 27 fat sheep that he owes to the government」…「John 27 fat」(下p.40)、「lap」も「rap」も「lab」も「laugh」(下p.40)、とても寒い夜を意味する「five-dog night」(下p.148)、「tatoo(入れ墨)」と「taboo(タブー)」、「boondocks(未開の奥地)」、「amok(怒り狂う)」「batik(バティク、蠟染め)」、「orangutan(オランウータン)」(下pp.193-194)、「羊」を…「avis」…「ovis」…「oveja」…「ovtsa」…「owis」…「oi」…「sheep」…「owe」…「owis」)(下pp.203-204)、「goat」「horse」「wheel」「brother」「eye」など(下p.204)、「gun」…「gun」…「fusil」…「ruzhyo」(下p.204)、「two」「bird」「ear」「head louse(毛ジラミ)」(下p.204)、「pig」「dog」「rice」(下p.204)、「outrigger canoe」「sail」「giant clam」「octopus」「fish trap」「sea turtle」(下p.204)、「science」とは…「scire」…「scientia」(下p.322)、“GUNS, GERMS, AND STEEL : The Fates of Human Societies” (W.W.Norman & Company, 1997)(訳者あとがき)

3.2 アラビア数字

人類史ですので本文では4桁の年数、年月などが頻繁に出てきますがすべて漢数字です。従って、アラビア数字が使われているケースは少なくなっています。

本書は頁番号は、アラビア数字ですが、本文中の頁番号参照は漢数字を使っています。頁番号参照が3桁数字になることが多いためでしょう。箇条書きにも正立で使われています。

(1)アラビア数字が正立で使われている。縦中横を含む。

アラビア数字は、参照先の部・章・節番号の表記、参照先図番号の表記、参照先表番号の表記に多数使われています。1桁では正立、2桁のとき縦中横になります。

・参照先部・章・節の番号は頻繁に出てきますので数えません(数えきれない)。

・参照先図番号――36箇所

○出現箇所
(図1-1を参照)(p.51)、(図2-1)(p.80)、(図4-1を参照)(p.124)、(図5-1を参照)(p.141に2回)、図8-1 (p.199)、(図8-2)(p.204)、(図8-1→二〇七頁)(p.205)、図10-1 (p.263)、図10-2 (p.271)、(図12-1→二一頁)(下p.19)、(図12-1)(下p.19)、図15-1 (下p.132、下p.134)、図16-1(下p.175、下p.178)、(図17-1)(下p.193)、(図17-2)(下p.199)、(図18-1)(下p.247)、図19-1(下p.260、下p.261、下p.265、下p.266、下p.289)、図19-2(下p.265に3回、下p.266に2回、下p.268に2回、下p.269)、図19-3(下p.273、下p.276に2回)、図19-4(下p.285)、図10-1(下p.294)

・参照先表番号――23箇所

○出現箇所
(表5-1を参照)(p.142)、表7-1は(p.183、p184)、表8-1(p.205、下p.303)(表9-1参照)、(表9-1中の…)(p.236)、表9-2(p.240、p.241、下p.303)、表9-3(p.246)、表13-1(下p.82、下p.83)、表14-1→九一頁(下p.89)、表18-1(下p.232、下p.233、下p.234に4回、下p.235に2回)、表18-2(下p.243)、

・箇条書き――17箇所

○出現箇所
(1)(2)(3)(4)(5)(下p.63)、(1)(2)(3)(4)(下p.63と下p.64、下pp.102-103)

・その他――36箇所

○出現箇所
炭素14 (p.49に4回、p.67に2回、p.68に2回、p.136に9回、p.137に1回、p.138に6回、下p.235)、炭素12 (p.136に4回、p.138に2回)、窒素14 (p.136に1回)、3000BC、3000bc(一文字ずつ正立、p.138)、「4」という記号(下p.20)、数字の4(下p.34)

(2)アラビア数字が横倒しで使われている――4箇所

アラビア数字が横倒しで使われている箇所は4箇所しかありません。

○出現箇所
裁判所の書記が「We order John to deliver the 27 fat sheep that he owes to the government」…「John 27 fat」(下p.40)、(20×19÷2で)一九〇通り(下p.115)、(W.W.Norman & Company, 1997)(訳者あとがき)

昭和前半の縦組み新書版における英数字

縦組みの出版物で英数字がどのように表記されているかについての調査を行なっています。表記方法は、年代、および、ジャンルによって異なると予想しますが、すべてを網羅的にかつ統計的に調査するのはなかなか大変なので、今のところ、かなり行き当たりばったりですが。

今日は、昭和の早期に発行された「国語の変遷」を調べてみます。本書は本文縦組みですが、表紙が横組みです。

かなと漢字は右から左に書いていますが、アラビア数字(71)は左から右です。(17ではなく71であることは、本文のノンブルから分かります。)

さて、英数字ですが次のようになります。

1.ラテンアルファベット

本書でのラテンアルファベットの利用例を図で示します。

図1(p.121)

図2(p.44)

図3(p.161)

このように本書ではラテンアルファベットを次の二通りで用いています。

(1) 音を表す記号としての用途 図1、図2
(2) 英語の単語と記号の用途 図3

音を表す記号として用いるとき、a. 母音は1文字ずつ正立、b. 子音+母音は縦中横、c. 子音が入った「ことば」としての発音(上の図には相当するものがありません)あるいは子音を’,’で区切って並べるとき(図1)文字列を全体として横倒しにしています。

図3を見ますと英語の単語と記号については字数に関わらず、1文字であっても横倒しです。一文字でも横倒しの理由はなんなのでしょうか?

頭字語(YMCA、IWW)は1文字づつ正立です。文脈的には、頭字語も英語とされていますので、正立の基準は英語か日本語かではなくて頭字語か否かになっているように思います。

2.アラビア数字

本書ではアラビア数字は各頁下中央のノンブルのみです。

目次の頁番号、章番号(第一、第二、…)、節番号(一、二、…)、箇条書きの項目番号、年月などの数字はすべて漢数字となっています。

○書籍の情報
書名:「国語の変遷」
著者:金田一京助
出版元:日本放送出版協会
発行:昭和16年12月30日

昭和前半の縦組み文学書における英数字

手元にある昭和の前半に発行された2冊の文学書を対象にして英数字の使われ方を調べてみました。

○最初は日本の作家の書いた小説の例です。

書籍:「成吉思汗」(尾崎士郎著、新潮社、昭和15年7月発行)

本文314頁、解説18頁

1.ラテンアルファベット

本書には全体を通じてラテンアルファベットはまったく使われていません。

2.アラビア数字

本書の中に現れるアラビア数字は、本文の節番号とノンブル(イタリック体で頁下中央に横書き)のみです。

なお、章番号は漢数字、目次の頁番号も漢数字となっています。
従ってアラビア数字は非常に少ないのですが、すべて正立しています。

○次は、原文はフランス語から翻訳した文学書です。

書籍:「サン・ペテルスブルグの夜話」(ド・メーストル著、岳野 慶作訳、中央出版社、昭和23年5月発行)

本文と解題205頁

1.ラテンアルファベット

匿名人物を指すために枢密顧問官なるT、騎士B、などの形式で本文中にときどき(全体を通じて10箇所程度)使われています。すべて1文字で正立です。本文の文字サイズと同じ高さをもちます。

人物名をカタカナ表記した後に注として原文が入っていることがあります。この場合、ラテンアルファベットの部分が横倒しです。これらの括弧内の文字は、本文より小さな文字サイズのプロポーショナルフォントで組まれています。

例)
ド・メーストル(De Maistre)、クリスティンヌ・ド・モッツ(Christine de Motz)など

他に書籍の題、難しい単語の原文が()内にとして付されていることがあります。この場合、ラテン文字の部分が横倒しです。

例)
「サン・ペテルスブルグの夜話」(Soirées de Saint-Petersbourg)、テ・デウム(Te Deum)(注、カトリック教会が感謝祭において歌う賛美歌。「Te Deum Laudamus・神よ、われら、おんみを...)

つまり、本文の補足的情報として括弧に括られた形式で単語がラテンアルファベットで表記されていることがあり、これらが横倒しになっています。

2.アラビア数字

本書にはアラビア数字はまったく使われていません。
頁番号(目次、見開き左右のノンブル)、章に相当する番号、年月日、数量などすべての数値が漢字表記です。

このように昭和の前半の文学書では英数字はあまり使われていません。しかし、少数みられる英数字の箇所は1文字のとき正立、翻訳書では注として原文の表記に使われていて、その場合横倒しとなっていることが分かります。

UTR#50 のドラフト第5版に関する批判的コメント

日本語を縦組みしたときに、文字の方向をどう決定するかということについて、何回もブログで書いてきましたがこれはかなり悩ましい問題です。CAS-UBでも縦組のPDFを生成したり、EPUB3には縦組みレイアウト用CSSを指定できますので、早急に整理しなければならないと思っています。

UnicodeやCSSワーキンググループでは、この検討が精力的に行なわれており、UnicodeのUTR#50が先日(5月17日)ドラフト第5版になりました。

http://www.unicode.org/reports/tr50/tr50-5.html

今回の大きな変更点は、レポートの表題が「Unicode Properties for Horizontal and Vertical Text Layout」に変わったことです。従来は、「Unicode Properties for Vertical Text Layout」でしたが、今回から横書きでの文字の方向に関する記述が追加になりました。

横書きプロパティが追加になりました。

○プロパティ
横書き(Horizontal Orientation、HO):横書き用
縦積み方向(Stacked Vertical Orientation、SVO):文字がほとんど正立する世界における縦行用
混在縦組み方向(Mixed Vertical Orientation、MVO):東アジア、特に日本、中国、韓国の縦行用

UTR#50はUnicodeの文字に対して3つのプロパティにおける文字方向のデフォルト値を規定するものです。

○プロパティ値は次のように規定されます。

U:コード表に表れるのと同じ方向で、正立表示する文字
R:コード表を時計方向に時計方向に90度回転して、横倒しで表示する文字
L:コード表を時計方向に反時計方向に90度回転して、横倒しで表示する文字
T、Tu、Tr:単に正立または横倒しではなくて、縦組みで使うときはコード表とは異なるグリフを必要とする。Tuはフォールバックとしてコード表のグリフを正立で使うことができる。Trはフォールバックとしてコード表のグリフを時計方向に90度回転して使うことができる。

Unicodeの各文字に対するプロパティ値のデータ表が提供されています。

http://www.unicode.org/reports/tr50/tr50-5.Orientation.html

第5版では、プロパティ値のデータ表に、HOの列が追加になりました。一方、MVOの値は、これまでA案とB案提案されていましたがB案に一本化されました。

■問題点
UTR#50には、かなり大きな問題があります。

その1:SVOとMVOが明確に規定されていないこと。

原文は次のようになっています。

SVO:「… intended to be used for vertical lines in those parts of the world where characters are mostly upright. 」
MVO:「… intended to be used for vertical lines in East Asia, and more specifically in Japan,…」

MVOについてはサンプルの図3があり、和欧混植の組版を意味していることは明らかです。しかし、SVOの定義でいうところの「文字がほとんど正立する世界」とは一体どこのことなのでしょうか?MVOの定義には「東アジア特に日本の縦書きの行」とありますので、するとSVOは日本は属さないと読めてしまいます。

このあたりの定義をもっと明確にする必要があります。たとえば、SVOは和文のみ、MVOは和文と欧文が混ざるときというように。しかし、おそらく少なくとも日本語の書籍についてはSVOという世界はほとんど存在しないので、日本語の書籍ではあまり意味がない概念でしょう。

その2:方向特性値の決め方がまずい。

方向特性値は、「This default determination is based on the most common use of a character, …」とあります。つまり、デフォルトの方向は文字の最も一般的な使用法に基づいている、とのことです。しかし、最も一般的な使用法をどうやって判断しているか理解できません。

たとえば、プロパティ値のデータ表で見ますと、アラビア数字(ASCIIコード範囲)は、MVOで「R(横倒し)」と決めています。

MVOのサンプルである図3(Figure 3. Japanese vertical text)には数字が3箇所に出てきますが、いづれも正立で、横倒しになっていません。アラビア数字をMVO:Rとするのは、このサンプル図に矛盾しています。たった1枚の図で判断するなよ、と言われるかもしれませんが、しかし、日本で実際に販売されている縦組みの雑誌や書籍では、アラビア数字の大半は正立です。これは市販の縦組本を少し調査すればすぐに分るはずです。

たとえば、このブログで先週調査結果を報告した「刑務所なう。」には、アラビア数字が数百箇所はでてきますが、横倒しになっている箇所はほとんど例外的と言って良いほど少なく、アラビア数字の99%以上は正立しています。

「刑務所なう。」にみる縦組みにおける英数字・記号の向きを参照のこと

方向特性値を「(市販の書籍や雑誌における)最も一般的な使用法」とするならば、例えばアラビア数字(ASCIIコード範囲)は、間違いなくMVOで「U(正立)」にしなければならないでしょう。そうするとUTR#50の「最も一般的な使用法」はどうやって決めているのでしょうか?

もしかすると、InDesignのデフォルトが横倒し?そうすると、DTPオペレータが毎回せっせと数字を立てていることになるのですが。

ここで白状しますと、AH Formatterもアラビア数字(ASCIIコード範囲)は、MVO:Rなのです。困ったな。

つまり、いままでは英数字はASCIIコード範囲は縦書き時横倒し、互換コード範囲は正立という方式がずっとすべてのアプリケーションの実装となっていたのです。で、方向特性値を「(ベンダにとって)最も一般的な使用法」と定義すれば矛盾はなくなるのですが、それで良いのだろうか?いや、それではだめだろう、ということなのです。