縦組みリフロー書籍のKindle PaperwhiteとiPad版での見え方の相違(メモ)

CA-UBで制作した縦組み書籍(mobi形式)がAmazon Kindle ストアで発売されました。

「転職の法律があなたを守る ―転職の法律36か条―」(Amazon Kindle版)(360円)

そこで、早速、自分で購入して、Paperwhite(以下、Kindle PW版)と、iOS版のKindleアプリ(Kindle for iPad V3.4 [2]。以下、Kindle iOS版)で見え方を比較してみました。Kindle PW版は縦組みリーダとして安定しています。一方、Kindle iOS版は不具合があり、電子書籍のリーダとしてまだ不安定という印象があります。こういった問題はいずれ解決されるでしょうから、あまり気にしなくても良いとは思いますが。

1.Kindle iOS版での縦組み

Mobi形式の電子書籍を、Send-to-KindleやUSB経由でコピーした電子書籍はKindle iOS版では縦組みになりません。しかし、AmazonのKindle Storeから正規に購入した本は問題なく縦組みになります。

2.目次

本書では、HTML目次をSpineの先頭に登録するとともにGuideに登録し、また別途EPUB版NCX目次を設定しています。[1]

(1) Kindle PW版でのナビゲーションは、HTML目次と移動メニューになります。移動メニューは次のように表示されます。

(2) Kindle iOS版では、HTML目次は表示されますが、NCXは表示されません。「移動」メニューには、HTML目次へのリンクが設定されています。

ちなみに Kindle iOS版では、HTML目次はつぎのように表示されます。

3.文字の位置

Kindle iOS版では文字種によって、行の中央に配置されない文字があります。本書で出てくる文字種はかなり少ないのですが、次のような文字に問題があります。

①丸付き数字

丸付き数字が行の右側に寄って、行間が広がっています。Kindle PW版は問題ありません。

②丸記号

丸記号(○)が行の右側に寄って、行間が広がっています。Kindle PW版は問題ありません。

③三点リーダ

三点リーダが行の左側に寄っています。Kindle PW版は中央になり、問題ありません。

4.縦中横について

索引語が2箇所以上出てくるときアラビア数字で順番を設定しています。このアラビア数字を正立させるため縦中横を指定しています。この縦中横指定した数字の表示が、Kindle PW版では正しいですが、Kindle iOS版は文字が小さく、しかも右によっています。次の図では(1)、(2)の中の1、2に縦中横を指定しています。

○マークアップ
<a href="0032.html#_30032_2e_2e1">(<span class="tcy">2</span>)</a>

○CSS
span.tcy {
-webkit-text-combine: horizontal;
-epub-text-combine: horizontal;
-moz-text-combine: horizontal;
-ms-text-combine: horizontal;
-o-text-combine: horizontal;
text-combine: horizontal;

}

(1)Kindle PW版

(2)Kindle iOS版

5.CSSのレイアウト

(1)Kindle iOS版では行の左右の空きがなくなるケースがあります。これはスクロールの仕方によっては右側の空きが現れるケースもあり、やや不安定です。

上のように行の右空きがなくなりますが、同一の箇所が、スクロールの仕方によって下のように表示されることがあります。

Kindle PW版は常に次の図のようになります。PW版は安定しています。

(2)同じような例ですが、次のようなケースもあります。マークアップやスタイルシートの指定は同じなので、不安定という印象を持ちます。

Kindle iOS版で角丸め・右空きがなくなるケース、同表示されるケース

Kindle PW版は常に次の図のようになります。

[1] Kindle mobi形式サンプルとKindle 専用のEPUBと一般のEPUBの相違点(リフロー型の場合)
[2] iPadはiOS6.0.1です。

UTR#50のフォーラムでの質問に答える: UTR#50とMVOは拙劣な規定であり、日本語の縦書きは不便になる

先日、UTR#50のフォーラムに「The approach of UTR#50 is different from Japanese standards」(UTR#50のアプローチはJIS X4051と異なる)というコメントを投稿した[1]ところ、次のような質問がありました。回答を直接英語で書くのは面倒なので、日本語で書いてGoogle Translationで翻訳してみようと思います[2]。うまくいくと一石二鳥だけど。(で結論としては、まだまだという感じですがとりあえず下訳的につかって修正したものを投稿しました[3]。まあ、私の英語力はそんなに高くないですので、便利といえば便利です。)

質問1. なぜ、我々の世界をJIS X 4051に限定する必要があるか?

質問2.UTR#50またはMVOが役に立たないというのであれば、その理由が分からない。

回答1.世界全体の言語の中で、文字を縦書きする言語は比較的少ない。現時点では、縦書きを採用する言語の中で、世界中で最も多くの人が使っているのは日本語である。過去においては縦書きで最も多く使われる文字は中国の漢字であった。また漢字文化圏の周辺には漢字以外にも縦書きする文字が多数あった――満州文字、モンゴル文字、西夏文字、契丹文字、ハングル、チュノムなど。しかし、中国本土の中国語は漢字の簡体字化に伴い、横書きに移行してしまった。また、周辺部の縦書きする文字の多くは消滅した。この結果、縦書きする文字は減っているのである。

縦書きの中に、横書きしかできない文字をどのように配置するかは非常に難しい問題である。これを正しく規定しているのはJIS X4051のみである。「日本語組版処理の要件」(JLReq)は、和欧混植に関する規定に関して、残念ながらJIS X4051よりも劣っている。

こうしてみると、JIS X4051は縦書きの中に横書き専用文字をどう配置するか――日本語組版でいう和欧混植――を正しく仕様化した世界で唯一の文書であるだろうと思う。縦書きの中に横書き文字を配置する方法に関して、JIS X4051をリスペクトするのは当然である。

逆に質問したい。縦書きの中に横書き専用の文字を配置する仕様を定めた文書が他にあるのか?あるのなら教えていただきたい。

回答2.Unicodeの文字は抽象的なものである。文字の形をグリフというが、印刷ではグリフの具体的な形状(グリフイメージ)をレンダリング(可視化)するのである。文字のコードポイントからグリフイメージへの変換処理方法には、文字によって様々な違いがある。一般的に言えば、コードポイントにグリフイメージを直接対応つける方法は、世界の文字を印刷するための技術としては役に立たない。

UTR#50とMVOは文字のコードポイントにグリフ可視化結果を規定する方法である。上に述べたように、一般論としてもこのアプローチは誤っている。このことを、以下に、具体的に例を示して説明する。

縦書き時のグリフイメージは文字のコードポイントの特性ではない。文字のコードポイントとグリフイメージは独立である。例えばInDesignにはアスキー文字を全角形で表示して、正立させる機能がある。その逆に、全角文字コードをプロポーショナル字形で表すこともできる。つまり、InDesignは文字のコードポイントとグリフイメージを独立のものとして扱っている。[4]

(9/21追記開始)文字のコードポイントに対して対応をつけることのできるグリフはひとつではない。複数のグリフを対応つけることができる。例えば、日本語組版ではラテンアルファベットには全角形とプロポーショナル形があるとしている。全角形とプロポーショナル形というのはグリフの区別であり文字コードの区別ではない。ラテンアルファベットの文字コードはU+0041~005A(大文字)とU+0061~007A(小文字)である(これらをアスキーアルファベットという)。JIS X4051の規定では、横書き時にはアスキーアルファベットにプロポーショナル形を割り当てて使うのが標準である(横書き時にアスキーアルファベットを全角形で表すことは一般には行なわない)。縦書き時には、アスキーアルファベットを全角形で正立したり、プロポーショナル字形で横倒しで並べたりできる。これは文字コードの使い分けではなく、グリフの使い分けである。具体的な実装例でいうと、InDesignは、縦書き時にアスキーアルファベットをプロポーショナル形で横倒し表示したり、全角形で正立させて表示する機能がある。つまり、InDesignは文字のコードポイントに対してグリフを何種類か対応付け、実際の表示においてその中から切り替えることができるのである。(9/21追記終わり)

別の例を示す。XML文書でコンテンツを表すのは文字コードの並びである。コンテンツ自体に方向属性を含むと再利用性が失われる。ひとつのコンテンツを縦書きでも横書きでも使えるようにするためには、縦書きのときのグリフイメージの向きを、コンテンツに対するXMLマークアップとスタイルシートの組み合わせによって指定するべきである。

繰り返すが、UTR#50とMVOは文字のコードポイントに縦書き時の方向を規定するというものである。特に、縦書きで、全角文字コードは正立し、アスキー文字を横倒しすると規定している。UTR#50とMVOを採用すると、コンテンツを縦書き専用、横書き専用に書き分ける必要が生じて大変不便である。

また、日本語の縦組みの書籍では、1ページの中に縦書きと横書きが混在している。また、本文は縦書きで索引は横書きという方式が一般的である。このように縦書きと横書きを同時に使う場合にも、UTR#50とMVOを採用すると不便である。[5]

[1]http://unicode.org/forum/viewtopic.php?f=35&t=346
[2]Google Translationの出力
[3]コメント投稿 2012/9/11
[4]上記のUnicodeフォーラムにて、山本太郎氏から独立ではないという指摘がありました。確かに、独立という表現は正しくないので、9/21にこの部分を削除して表現を改めました。文章の後ろの方もフォーラムの議論を鑑みてもっと補足するほうが良いのですが、これは別途、文章化することにします。
[5]この文章はUnicodeのフォーラムに投稿するために原文として書いたものなのですが、別途に何がどう不便かをもう少し具体的に説明したいと思っています。

縦組みは複雑さを増し、移行期的混乱状態。その原因は英数字の書字方向にある。

「横書き登場」(屋名池 誠著、岩波新書、2003年初版発行)[1]を読むと、幕末・明治時代から西欧の文明を取り入れる過程で横書きの普及が始まって、現在に至っていることがはっきり分かる。最初は、和字を右から左に書く右横書きと、左から右に書き進める左横書きが行なわれ、戦前までは併用されていたが、戦後に急速に左横書きに一本化された。

英語を中心とする欧米の文字は左横書きしか向かないラテンアルファベットで綴られているため欧文を和文中に取り込むためには左横書きが便利である。これに対して右横書きは和文中に欧文を取り込む上ではあまりメリットはない。戦後になって日本が米国の勢力圏になってあっという間に左横書きに統一されたのは自然とも言える。「横書き登場」では最初の左横書きの出版物は1871年(明治4年)に登場したとしている(p.61)ので、左横書きという書字方向が確立するのに70年~80年という期間がかかったことになる。

現在の出版物は、(1)横書きのみで構成する横組みと(2)縦書きを主体とし補助的に横書きを併用する縦組みの二つの組版方式が使われている。

横組みと比べると縦組みでは文字や行を進める方向が複雑に入り組んでいることが多い。この複雑さの主な原因はラテンアルファベットとアラビア数字(以下、総称して英数字)である。どのような複雑さがあるかを整理すると次のようになる。

■縦組み書籍の中の横組み頁

書籍などの出版物は、縦組みに分類されるものであっても、すべての頁が縦書きだけで組まれているものはほとんど存在しない。表1にあげるような横組み頁も併用されている。

表1 縦組み出版物の中での横組み頁
・参考文献
・索引
・表紙、章扉、奥付け

表紙や扉の横組みはデザイン上の配慮によるものが多いだろうが、参考文献や索引は英数字を多用することが横組みにする理由だろう。

■縦組み頁の中の横書き箇所

縦組み頁の中の一部に横書きのブロックが入ることも多い。表2のようなケースがある。

表2 縦組み頁の中の横書き箇所
・表は表自体の行とセルの組み方が横書きのものが主流であり、そのときセル内の数字や文章は横書きになる。
・図表の番号、キャプション、図表の説明文。
・目次のページ番号(縦中横)
・各頁のノンブル、頁上・下の柱

表2のような横書きが使われる箇所で使われる数字の種類はアラビア数字である。

■本文の中の英数字の扱い

さらに、縦書きの本文テキストの行中(インライン)での英数字の取り扱いの方法には次の3通りの方法がある。

①英数字を和字として扱う。このときは全角字形を使い、正立させる。
②英数字を欧字として扱う。このときはプロポーショナル字形を使い、文字列全体を横倒しする。このとき和字は日本語組版規則にしたがうが、欧字は欧文組版規則に従う。和欧混植方式となる。
③アラビア数字やラテンアルファベットの組を縦中横で配置する。縦中横には表3のようなケースがある。

表3 縦中横の適用箇所
・月、日、年齢などの2桁の数字を縦中横で配置するとき
・本文中から2桁または3桁の章番号、頁番号を参照するとき
・注番号、箇条書き番号などを(1)のように縦中横で扱うとき
・本文中の2桁の数値(アラビア数字)などを縦中横として扱うとき

■縦組みの類型

現在の日本語縦組み出版物における、本文テキスト中での英数字の取り扱い類型は大よそ3つである。

①新聞方式:朝日、読売、日経等の大新聞は、21世紀になってから、2桁の数字については縦中横表記とするが、それ以外のほぼすべての英数字を和字として扱う方式に移行した。

②伝統的方式:数量を表すアラビア数字は漢数字表記とする。固有名詞や慣用句はアラビア数字のままである。また図表番号や章番号などの参照は、参照先がアラビア数字の場合はアラビア数字のことが多い。従って、伝統的方式であってもアラビア数字は随所に使われる。外来語をはじめ外国人などの人名など欧文の単語はできるだけカタカナで表記する。カタカナ表記の括弧内に原文のラテンラテンアルファベット表記を添える。この時ラテンラテンアルファベットは和欧混植の対象となる。

②現代的方式:アラビア数字は新聞と同じように和字として全角形で正立する。頭字語のラテンラテンアルファベット大文字は和字扱いする。商品名などではラテンラテンアルファベット大文字と小文字が入り混じるが、そのとき文字列全体を和字扱いとしたり、または大文字だけなら和字扱いで正立・小文字が入ると文字列全体を横倒しする。どのような種類の文字列を正立させるかあるいは横倒しするかの基準は曖昧で書籍毎に異なるし、書籍の中でも完全に統一されていないときがある。

■縦組みの未来

商品名(iPhone、iPadなど)、サービス名(twitter、facebookなど)、人気グループ名、会社名などの固有名詞にラテンアルファベットが多用されるようになっている。これらはカタカナ表記できないので、出版物にも必然的にラテンアルファベットが増える。縦組みにおいてラテンアルファベットを和字扱いするか欧字扱いするかは、新聞のようにすべて和字扱いする方式から全部を欧字扱いすることまで幅広く明確な基準がない。

アラビア数字は、漢数字に変更する方式から、すべて和字扱いで正立する方式まである。

このように、本文テキスト中のラテンラテンアルファベットとアラビア数字の扱い方はさまざまであり、混乱状態にあると言っても過言ではない。

全体としては伝統的方式から現代的方式への移行過程にあるだろう。そうすると縦組みは移行期的混乱の中にあると言って良い。この混沌状態の結果として新たな縦組み方式が定着するのか、それとも縦組みの複雑さに見切りをつけて、横組みに1本化されるのか?

こうした混沌に加えて、縦組みは横組みに比べて製作コストが高い方式となっていることにも注意が必要である。これについては別途検討する。

[1]「横書き登場」と縦書きと横書きのゆくえ

□■□■□■□■□■□■ご案内□■□■□■□■□■□■

CASオンラインショップでCAS-UBのユーザー登録することで、誰でも30日間だけ無償でご利用いただくことができます。
CAS-UB評価ライセンス

縦組みにおける半角文字の方向―MS-DOSの一太郎と松

縦組みにおける半角文字の扱いについて、今回は、MS-DOSの一太郎と松を調べてみました。

手近にあるPC-9801が動かないので、エプソンのPC98互換機(PC-486 NOTE AU)を動かして、一太郎dash、松Ver.5をインストールして動かしてみました。一太郎と松はMS-DOSの時代にもっとも人気があったワープロソフトです。一太郎dashはノートパソコン向けに軽量化したタイプ。松Ver.5はシリーズの最後の方の製品です。

両方とも縦組み文書を作るときは、横書きで編集します。そして、印刷するときにプリンタの印刷方向と用紙の方向、および文字の向きを調整して縦組みを実現します。現在は画面上で縦組みのまま編集することができますが、当時のパソコンソフトではそうした編集操作はできませんでした。

また当時のパソコンのプリンタはページを1ページずつ取り扱う方式(ページプリンタ)ではなくて、一行ずつプリントする方式であったことも忘れることができません。

今回、プリンタは既になく、紙に印刷できないので、印刷プレビューの画面で文字がどうなるかを見てみました。

1.一太郎dash

一太郎dashの印刷プレビュー画面は次の写真です。横組では用紙上辺は画面の上辺にあたりますが、縦組みでは用紙上辺が画面の左辺になります。

縦組み文書であっても編集時は横書きで編集しますので、漢字も半角英数も文字が画面に対して正立の状態です。

そして、印刷時に漢字を左に90度回転して、用紙の上辺に対して文字の上辺が対応するようになります。一方、半角英数は回転せずに画面に対して正立のままです。結果的に、漢字に対しては右に90度回転した状態となります。

2.松ver.5

松Ver.5の印刷プレビュー画面は次の写真です。横組みでも縦組みでも画面の上辺が用紙の上辺になります。

縦組み文書であっても、横書きで編集しますので編集時は漢字も半角英数も文字が画面に対して正立の状態です。編集時の行は横方向で文字は左から右に進みます。

そして、印刷プレビューでは漢字は正立、半角英数は右に90度回転して横倒しです。行が縦になり、文字が上から下に進みます。

3.漢字と半角英数で方向が違う理由は?

一太郎も松も縦組み文書を印刷した結果は、用紙の向き(用紙上を上)に対して漢字は正立し、半角英数は右に90度回転します。

漢字が正方形なのに、半角英数は幅が1/2幅なので、漢字に対して90度寝かせるように出力することで、行の長さが横書きのときと同じになるからでしょう。

この方法は、先日のワープロ専用機ではNECの文豪と同じやり方です[*1]。

MS-DOSの時代には、文字を半角と全角のセルに表示する技術が基本になっており、文字の字形を自由自在に変形して表示することは難しかったのです。この文字の表示・印刷の技術上の制約上のために半角英数を横倒しにしたのではないだろうかと思います。

なぜ、このような設計になったかは開発担当者に確認する必要がありますが、おそらくすでにその設計理由を確定するのはできないように思います。弊社に「新松」の開発者が数名是移籍していますが、彼らに聞いても、「もう忘れてしまった。」という回答が帰ってくるのみです。

[*1] 縦組みにおける半角文字の扱い―ワープロ専用機はまったくばらばら

縦組み時の文字の方向に関する議論を解きほぐす試み (1)コンテンツの記述

春先から、「縦組み時の文字コード正立論」というテーマで何回かブログを書き、また、資料をEPUBにまとめてきました。そろそろ、その結論を出さなければならないだろうと考えて、Unicodeコンソーシアムのフォーラムに質問および意見を投稿しました。この投稿に関しては、Adobeの山本太郎氏から強い反対意見が出る[*1]など、残念ながら多くの賛成を得るにいたっていません。

また、Twitterの議論でも縦組時の文字の方向をどうすべきか、ということに関して多くの方から多数の意見が出ています[*2]。

国際電子出版EXPOの会場でも私の主張に同意される方、あるいは意見を異にする方数名の方と直接意見交換をさせていただきました。

この議論がとても難しい理由は、(1) これまで受けた職業的訓練など発言者の経験、あるいは美観といった主観に基づく判断と、(2) デジタル組版に関わる技術要素が極めて高度になっていることがあります。

(1) と(2)の両方が複雑に組み合わさっているため、問題の理解が難しく、従って、適切な解決策を提案するのが非常に難しくなります。そこで、あらためて(2)について検討することで、複雑に込み入ってしまった問題を解きほぐすことを試みてみたいと思います。

まず、テキストコンテンツ(Unicodeで記述されているものとします)があったとき、それが画面または印刷物(紙)として目に見える過程を図示し、それにどのような技術要素が関係しているかを簡単な絵で表してみます。

最初に、これらの技術要素について順番に簡単な解説を試みます。

1.コンテンツの記述

テキストコンテンツは一般には符号化文字集合で規定された文字コードを使って表現します。符号化文字集合としては、2000年ごろまではシフトJISが主流でした。これまでに蓄積されたコンテンツの量としては、シフトJISが圧倒的に多いと思います。

例えば、青空文庫はJIS X0201(但し、半角カナを除く)とJIS X0208の文字を使って入力し、シフトJIS形式で保存することになっています。JIS X0201(半角)とJIS X0208(全角)ではアラビア数字やラテンアルファベットがダブっていますが、これについては、半角と全角を使い分ける簡単な規則を次のように定めています[*3]。

・縦組みで正立しているラテンアルファベットは全角で、英単語は半角で入力します。
・アラビア数字は1文字のときは全角で、2文字以上は半角で入力します。

青空文庫の全角・半角の使い分けはシフトJISを使うときの基本的な方法と言って良いと思います。

さて、現在の多くのアプリケーションで採用している、符号化文字集合は、Unicodeが主流になっていると言って良いと思います。そして、今後新しく作られて流通するコンテンツはUnicodeベースに移行していくことになると予想できます。

2.シフトJISとUnicodeの違い

シフトJISは、MS-DOSのために開発された文字の保存方式(符号化方式)です。従って、MS-DOSが動作する環境であるPCに密接に関係しています。すなわち、文書を表示するディスプレイは半角と全角のセルをもつキャラクタ・ディスプレイであり、ドットパターンとして作成された文字がROM(リードオンリーメモリ)に保存されています。

JIS X0201の文字は半角幅のセルに表示され、JIS X0208の文字は全角幅のセルに表示されるということで文字コードとその表示幅は完全に1対1対応しています。

これに対して、Unicodeは新しい世代のコンピュータのための文字集合として設計されています。文字を表示する環境は、ビットマップ・ディスプレイであり、文字の字形はアウトライン(ベクトル)としてフォントファイルに収容されています。これにより、文字の幅も半角・全角というような固定幅から開放されて、プロポーショナルな幅をもつ字形のデザインが可能となっています。

こうした環境変化に対応し、Unicodeは文字とグリフ(字の形)を分離するCharacter-Glyphモデルを採用し、Unicodeは抽象化された文字(Character)を定義することになっており、文字の表示形は定義しないとされています。

Unicode標準はグリフイメージを定義しない。標準は、グリフがどのように可視化されるかではなく、文字がどのように解釈されるかを定義する。(中略)Unicode標準は、画面に見える文字の詳細な形、大きさ、方向は定義しない[*4]。

[*1] Fundamental questions
[*2] http://togetter.com/li/251192
[*3] 青空文庫工作員作業マニュアル (2011年11月20日第二版)
[*4] Unicode 仕様書第1章より引用

昭和前半の縦組み新書版における英数字

縦組みの出版物で英数字がどのように表記されているかについての調査を行なっています。表記方法は、年代、および、ジャンルによって異なると予想しますが、すべてを網羅的にかつ統計的に調査するのはなかなか大変なので、今のところ、かなり行き当たりばったりですが。

今日は、昭和の早期に発行された「国語の変遷」を調べてみます。本書は本文縦組みですが、表紙が横組みです。

かなと漢字は右から左に書いていますが、アラビア数字(71)は左から右です。(17ではなく71であることは、本文のノンブルから分かります。)

さて、英数字ですが次のようになります。

1.ラテンアルファベット

本書でのラテンアルファベットの利用例を図で示します。

図1(p.121)

図2(p.44)

図3(p.161)

このように本書ではラテンアルファベットを次の二通りで用いています。

(1) 音を表す記号としての用途 図1、図2
(2) 英語の単語と記号の用途 図3

音を表す記号として用いるとき、a. 母音は1文字ずつ正立、b. 子音+母音は縦中横、c. 子音が入った「ことば」としての発音(上の図には相当するものがありません)あるいは子音を’,’で区切って並べるとき(図1)文字列を全体として横倒しにしています。

図3を見ますと英語の単語と記号については字数に関わらず、1文字であっても横倒しです。一文字でも横倒しの理由はなんなのでしょうか?

頭字語(YMCA、IWW)は1文字づつ正立です。文脈的には、頭字語も英語とされていますので、正立の基準は英語か日本語かではなくて頭字語か否かになっているように思います。

2.アラビア数字

本書ではアラビア数字は各頁下中央のノンブルのみです。

目次の頁番号、章番号(第一、第二、…)、節番号(一、二、…)、箇条書きの項目番号、年月などの数字はすべて漢数字となっています。

○書籍の情報
書名:「国語の変遷」
著者:金田一京助
出版元:日本放送出版協会
発行:昭和16年12月30日

「刑務所なう。」にみる縦組みにおける英数字・記号の向き

原稿用紙を使って原稿を書き、縦組で書籍を作った時代には原稿と出来上がり書籍で文字を書き進める向きが異なることがなかった。しかし、現在のようにワープロを使って横書きで原稿を書いたものから縦組で組版する時代には、原稿と書籍で文字の進行方向が根本的に異なってしまう。このため文字の向きの扱いが混沌となりがちである。

「刑務所なう。」はメルマガ「堀江 貴文のブログでは言えない話」を元にして編集した書籍である。横書きメルマガではラテンアルファベットやアラビア数字がふんだんに使われている。これに相応して「刑務所なう。」には縦組の中にラテンアルファベットやアラビア数字が頻繁に現れる。

こうしたことから「刑務所なう。」はプリント版の縦組み書籍における英数字の方向を検討するための格好の材料でなる。以下に、堀江メルマガと「刑務所なう。」で英数字と記号がどのように使われているかを調べ、メルマガと書籍の文字方向の違いを簡単にまとめてみた。

1. ラテンアルファベット
1.1 メルマガ
ラテンアルファベットはほとんどASCII文字(U+0030~0039、U+0061~007A)で表記されている。互換文字(U+FF10~FF19、U+FF41~FF5A)は皆無ではないが、むしろ誤って使われているように見える。

1.2 書籍
本書籍ではラテンアルファベットの文字列は、①一文字ずつ正立、②縦中横または全角単位字として正立、③横倒しの3通りで現れる。全体としてみるとアルファベットは一文字ずつ正立で現れることが多い。大よそ次の(1)~(3)の規則に従っているようだ。しかし、同じ文字列(Big Dog)が1文字ずつ正立して現れたり(p.383後ろから2行目)、横倒し(BigDog)で現れたり(同最終行)と必ずしも統一がとれていないところがある。

(1) 一文字づつ正立
アルファベット大文字だけの単語や文字列は一文字ずつ正立している。

・大文字1文字: D棟8F(D、8、Fを1文字づつ正立)、B2駐車場、Tシャツ、担当のS
・大文字2文字の略語: OB、NG、TV、DJ、、IP通信、UP、PC、PM、AM(pp.56~57)、CD、QA、QBチーズなど2文字でも縦中横にせず各文字を1文字づつ正立する
・大文字のみからなる単語:WEEKS(pp.37~38)、「THE 昭和」、MTG(ミーティング)。堀江語という方が適切かもしれない。
・大文字を連ねる頭字語:Y・T(Y、Tは姓と名の頭文字、’・’は中点)、ICANN、IFRS、FTA、TPP、DVD
・大文字のみからなる書名、番組名、映画題名など(固有名詞):「JAM THE WORLD」、「J-WAVE」、「JIN」、「TIME LINE」、DENPO、TOKYO FM、EADS社、SNS(社名)、WIRED

(2) 縦中横または全角単位字

単位文字は小文字であっても縦中横にして正立している。

・単位:cm、mm、kg、sec、No.、kcal [p.96 4文字まで?]
・その他:or、Mr. [p.96]、

例外)単位であるが、縦中横になっていないこともある。

・MHz(p.43、縦中横にせず1文字ずつ正立)

(3) 全体を横倒し
単語の中に小文字が入ると固有名詞であっても単語または単語句全体を横倒しにしている。

・小文字が入るラテンアルファベットの名詞:Apple、Google、Google PC(PC含めて横倒し)、Eee PC(同)、ziploc、Kinect、NUAds、Amazon、zip、Live、Good、「We are 宇宙兄弟 VOL.03」[p.96]
・メールアドレス、URL:.com、.net

例外)
しかし、小文字が入っているが1文字ずつ正立しているケースもある:「Bay FM」、gTLD、「NExTWORK」

2. アラビア数字
2.1 メルマガ
(1) ASCII文字(U+0030~0039)と互換文字(U+FF10~FF19)の使い分けについて

メルマガではアラビア数字はASCII文字が主体であるが、ときどき互換文字が使われている。例えば95%(ASCII文字)のような表記が主体だが10%(互換文字)という表記も出てきたり、日付は5/28(ASCII文字)が主体だが、5/20(互換文字)表記もある。このように、メルマガではASCII文字と互換文字が混在している。プリントと比べてややルーズな印象を受ける。

(2) 数字の書き方の例
年月日、時刻、単位付きの数値などはほとんどすべてアラビア数字で記述されており、漢数字は少ない。

アラビア数字の例
・単位付き数字:36000メートル
・日付:2012/4/16、5/28(ASCII文字)
・数値の桁区り:3,208円
・小数点:68.3kg

2.2 書籍
書籍(本文)ではアラビア数字はほとんどすべて正立表記である。次のような規則になっている。

(1) 1桁の数値は正立
(2) 2桁の数値は組にして縦中横。たとえば、11:30 は11が縦中横。’:’(コロン)は横倒し全角幅、30が縦中横である。68.3kgは、68を縦中横、’.’は全角幅中点、3を正立である。
(3) 3桁~4桁の数値は一文字ずつつ正立させる。2012年のような年号は一文字ずつ正立、98,830円のような5桁以上の数値は9万8830円のように4桁ずつにして、各すべての数字を正立させている。本書籍の中では5桁以上の数値はほとんど出現しない。
(4) メルマガと書籍の違いともいえるが、日付はメルマガでは2012/4/10というような表記になっていても書籍では2012年4月10日(10のみ縦中横で、他の数字は1文字ずつ正立)のように変更しているようだ。

数値が横倒し表記になっている箇所は極めてまれであり、例外と言っても問題ないくらいである。横倒し箇所を具体的に示す:
・3.14159Bill$(p.101、数値と単位全体を横倒し)、
・「We are 宇宙兄弟 Vol.4」 (p.501、書名の英数字部分が横倒し)
・H2O(p.508、水の化学式全体を横倒し)、O3(同、オゾンの化学式全体を横倒し)

○書籍の情報
書名:「刑務所なう。ホリエモンの獄中日記195日」
発行日:2012年4月5日第二刷
著者:堀江 貴文
発行所:文藝春秋社
ISBN: 978-4-16-374980-8

○本ブログ記事を「縦組みにおける英数字正立論」0.35版に反映しました。
こちらからダウンロードしていただくことができます。
CAS-UBで制作、無償配布している出版物

縦書きの数学書における英数字の方向は混沌

縦組みのときに、英数字を正立させるか横倒しにするかということについて、少しづつ調べています。で、英数字が沢山でてきそうな書籍のジャンルのひとつに数学関係があります。数学書の多くは、横組みなのですが、一般向けの数学書には縦組みの本をときどき見かけます。

で、次の3冊の縦組み数学書を調べてみました。

1.「いやでも楽しめる算数」(清水 義範著、講談社刊、2001年8月20日)
2.「江戸の数学教科書」(桜井 進、集英社インターナショナル刊、2009年2月28日)
3.「5分で楽しむ数学50話」(エアハルト・ベーレンツ著、岩波書店、2007年12月12日)

この3冊の本の縦組みのテキストの中で、英数字、特に数式がどのように扱われているかを整理すると次のようになります。

1.数式には文章の行の中に書くインライン数式と、数式だけで一つ以上の行領域を占めるブロック数式に分けることができます。

(1)ブロック数式はすべて数式ブロック全体を右に90°回転しています。従って、英数字も数式の記号もまとめて横倒しです。

(2)インライン数式の多くは数式の範囲を右に90°回転して横倒しで表記されます。長い数式ではすべて横倒しです。


(「5分で楽しむ数学50話」のp.12の一部)

上の図のe、xなどの数式中の1文字の定数や変数はすべて本文テキスト中で正立です。

上図左端行のeのx乗など1項の数式(べき乗)は正立表記です。

この中間の例として、上図の[3]の行f'(x)の横倒しと似たような数式を左端の行f(x)のように縦中横の形式で表記している例が見られます。この場合は、文字数にして4文字で正立、5文字で横倒しという区切りですが、むしろ1行の幅に入るなら正立、入らないなら横倒しとしているのかもしれません。

分数も同じようなことがあり、分母と分子が1桁の分数は分母の数値と分子数値を正立させ、分母と分子の桁数が大きくなるとYYY/XXXの形式で横倒しにしています。

他には長めのインライン数式を文字単位で正立させたり、「2n」を縦中横で表記したかと思うと、同一の本のなかで「πr」を横倒しにしてみたり、インライン数式を正立させるか横倒しにするかの判断は振れていることがわかります。特に2文字のインライン数式の方向性は振れています。

2.ラテンアルファベット

本文テキストの中のラテンアルファベットの方向は、通常の小説などと同じで、頭字語、1文字の大文字は正立です。

3.アラビア数字

アラビア数字は、1桁~2桁、場合によっては3桁までは縦中横正立です。それ以上長い桁数のアラビア数字を文字単位で正立させるか、数値として横倒しするかもかならずしも統一されていません。

次の3つの図は、「いやでも楽しめる算数」、「江戸の数学教科書」の中で数字がどのように表記されているか、例を並べてみたものです。ご覧いただくとおわかりのように、1冊の本のなかで、同じような数値が正立、横倒しの2種類の表記ででていたりします。かなり振れがあるといって良いと思います。


「いやでも楽しめる算数」の中の数値の表記例1


「いやでも楽しめる算数」の中の数値の表記例2


「江戸の数学教科書」の中の数値の表記例

3.方向とグリフ

(1)英数字の字形(グリフ)には半角形(アルファベットはプロポーショナル)と全角形がありますが、上の図で分かるように数式の変数や定数の正立するアルファベット文字は横倒しの数式中の文字と同じグリフになります。

(2)数字のグリフは1冊の本の中では1種類です。

4.補足:数字の扱いについて

(この書籍のことではありませんが)Twitterで教えてもらったことによると、@works014さんは「全角文字コードを正立、半角文字コードを縦中横・横倒しで表して、そのあと見え方として字形を統一する」そうです。なお、別の印刷会社の方に聞いた話では「入稿された原稿の数字を最初に全部半角文字コードに統一してから、正立する文字は回転させる」そうです。つまり、縦書きで数字の制作実務上の取り扱い方には二通りある、ということになります。

縦組み書籍における英数字の使われ方―その2

「縦組み書籍における英数字の使われ方」についての実態を調べています。前回(1月24日)は、小説などの文学系の例を3冊とりあげました。

今回は、編集者や記者のためのガイドブックとして、「記者ハンドブック 第12版」(共同通信社編著、2011年10月11日、ISBN978-4-7641-0619-2)を調べてみます。

まず、この本の構成ですが、全体740頁のうち、先頭から630頁までが横書きですが、資料編110頁が横書きです。外国の地名・人名の表記、新聞略語集などが資料編に収容されています。縦書きで表記しにくいラテンアルファベットの英語表記は横書き頁を設けているのです。

(1)数字について
目次は縦組ですが、頁番号は3桁までの縦中横です。
年月日、箇条書きの項目番号、数量(X個、Xつなど)はアラビア数字ですが、2桁までは縦中横、それ以上は正立して表記しています。箇条書きの項目番号を(1)のように表記する場合、括弧まで含めて縦中横としています。(15)という4文字組(115頁)の縦中横が出てきます。
投票の得票数の例では2桁でも縦中横を使わずに表記しています。(534頁。電文の例だから例外かもしれません。)

書籍の中にはアラビア数字はかなり頻繁にでてきますが、すべて正立です。2桁の縦中横数字の頻度が非常に多いのが特徴です。

(2)ラテンアルファベット
2-a. 正立:WHEN、WHERE、WHO、WHAT、WHY、HOW、5W1H、もうひとつのW、WORTH (10頁)、A欄、A+B、など(110頁)、GK、MFなど(125頁)、ウイリアム・J・クリントン(126頁)、AからBまで(127頁)、SLのかま(202頁)、CD(236頁、256頁)、DVD(256頁、276頁)、B5版(383頁)、JOC(408頁)、RSウイルス、IgA腎症(487頁)、E型肝炎、GVHD、A型、A群、HTLV1、HAM、ADH、LD、TSH、QT、IBS(488頁)、ACS、Q熱、ALS、CJD、DIC(489頁)、SARS(490頁)、PTSD、SAS、STD、ATL、GHD(491頁)、ADHD、TSH、H5N1(492頁)、SIDS、VRE、PRL、Bウイルス、ビタミンD(493頁)、CJD、GSS、FFI、CKD、CFS、COPD、MRSA、HUS(494頁)、VRE、O26、MRSA、BSE(495頁)(病気の名前はラテンアルファベット頭文字が多い)、AはBの、lockとrock(小文字だが、正立)、W杯、ASEAN(527頁)、AP、RP(528-529頁)、NHK(531頁)、JR(549頁)、CEO、COO、A氏(550頁)、A=当人、B=・・・、C=称号、D=当人(562頁)、START2、GIレース(570頁)、A340、F22、P3C(571頁)、ABCDのうち(574頁)、4WD(581頁)、SI(585頁)、kW(縦中横)(586頁)、特殊な場合のほかは、「C、F」は使わない。m、cm(縦中横)、km(同)、g、kg(同)、cc(同)、W、kW(同)を使っても良い(587頁)。これ以外にも1文字の例はいくつかありますが省略します。

2-b. 横倒し:(外来語の書き方の項)現音の語尾の―er, ―or, ―arなどは、-yは(461頁)、語尾の-umは、語尾が-tureの(462頁)、http://www.kyodo.co.jp/(改行)feedback@kyodo.news.jp(以上、全角形で横倒し)(560頁)、

以上は、ラテンアルファベットについて、割合規則が明確なように思います。つまり、原則正立です。外来語であることを明示的に示したとき、URLが横倒しです。つまり横倒しが例外です。かならずしも、全角形・半角形ではありません。

(3) 計量単位の項
ところが、主な計量単位と種類の項(590-597頁)にはラテンアルファベットの正立と横倒しが混在で出てきます。

3-a. 正立:E, P, G, M, k, h, da, d, c, m, μ, n, p, f, a(アト), a(アール),A, ac, LD50, Ω, Å, oz, nm, M, ct, K, Kt, 24K, cd, Ci, GW, kW, C/kg, Gy, K, G, COD, ppm, cc, Sv, J, pH, dB, eV, AU, t, tn, N, Kt, Kn, Pc, Pa, BOD, ppm, ppb, ppt, μs, bu, FLOPS, MFLOPS, Bq, Hz, μm, M, nm, MPH, M, μ, MIPS, lx, R

3-b. 横倒し:I.U., floz, cpm, car, Gal, gal, Kcal, MeV, GeV, TeV, lbt, Ltn, barrel, bit, byte, nsec, psec, (discomfort index, DI), hPa, MHz, kHz, rad, rem, lot

3-aを見ますと、どうも、1文字は正立、2文字も正立で縦中横として表記、3文字以上は大文字なら正立で縦に並べるという規則のようです。但し、3-aでppm, ppbが正立になっているのは例外ですが、これは定義箇条の見出しだからでしょうか。3-bで、小文字が混じった3文字となりこれは横倒し、( )内で英文表記とセットになっているときは大文字2文字(DI)でも横倒としているようです。全角形とか半角形の区別はないようです。

共同通信社のハンドブックは新聞の表記ともかなり類似していると思いますが、まとめると次のようになります。

(1)アラビア数字はすべて正立で横倒しはない。但し原則2文字まで(まれに年齢などで上下の括弧内3文字)が縦中横です。縦中横の頻度が多いと思います。

(2)ラテンアルファベットも原則として正立と思います。3-bでみるように単位が小文字交じりで3文字以上になったときのみ横倒し表記となります。

関連記事:
1.縦組み書籍における英数字の使われ方