縦組み経済書にみる英数字と記号の方向―伝統的組版の本

昨日、「円のゆくえを問い直す」(片桐 剛士著、ちくま新書)の話をしましたが、今日は、「さっさと不況を終わらせろ」(ポール・クルーグマン著、山形 浩生訳、早川書房)を検討します。この2つの書籍の組み方は、「円のゆくえを問い直す」が現代組版なのに対して「さっさと不況を終わらせろ」は、伝統的組版の典型です。がちがちの伝統組版と言っても良いくらいです。

■特徴
・外国人名は、映画の名前、団体名などカタカナ表記。頭字語は最初に正式名称と()内の頭字語で表記する
・数字 年号、月などが漢字表記。単位は%ではなくパーセントと表記。
・ページ番号は縦中横表記が原則ですが、一一ページ[p.165]に漢字になっている箇所もあります。不統一です。

■訳者解説を除けば、ラテンアルファベットの横倒しによる欧文表記は1箇所もありません。つまり本文のラテンアルファベットはすべて和字扱いの頭字語または名前の頭文字です。但し、1箇所だけ「VS.」の3文字を縦中横で表記しています。

■本文数字はほとんど漢数字です。訳者解説を除くと横倒しのアラビア数字はありません。章番号、図番号、箇条書きの項番号などはアラビア数字で正立しています。

縦中横が時々あり、2桁の章番号、図番号が縦中横です。また、3桁のページ番号が縦中横になっていたり、訳者解説には3.1のような3文字が縦中横です。

本書では縦中横は他の書籍と比べて少ないのですが、3文字の縦中横を使っているのが本書の特徴です。

■記号は他の書籍と比較すると少なくなっています。
・正立: ?&!
・横倒し(右90度回転): ――「」():『』~=…‐〔〕!.〈〉“”,-/@
 なお、次の記号は欧文文脈にて横倒し:!.“”,-/@

■■データ(ラテンアルファベット正立以外は代表的なもののみ)
1.ラテンアルファベット
1.1 1文字ずつ正立
国内総生産(GDP)、連邦準備制度理事会(FRB)、これはU6と呼ばれる[p.21]、ATM、世論調査NPO、議会予算局(CBO)、国際通貨基金(IMF)、資産担保証券(ABS)、債務担保証券(CDO)、クレジット・デフォルト・スワップ(CDS)、AAA格付け、AIG、J・P・モルガン、連邦預金保険公社(FDIC)、マネー・マーケット・ファンド(MMF)、ロングタームキャピタルマネジメント(LTCM)、CEOたちは、トマス・H・リー・パートナーズ社、THLは、金融巨人UBS、H・L・メンケン、ウイリアム・F・バックリー、あるいはCAPM(読み方はキャップM)、MIT、不動産担保証券(MBS)、スタンダード&プアーズ(S&P)、BNPパリバ、不良資産救済プログラム(TARP)、アメリカ回復再投資法(ARRA)、コマーシャルペーパー(CP)、消費者物価指数(CPI)、労働統計局(BLS)、欧州中央銀行(ECB)、EU諸国、欧州経済共同体(EEC)、GIPSI諸国(ギリシャ、アイルランド、ポルトガル、スペイン、イタリア)、経済協力開発機構(OECD)、国際決済銀行(BIS)、ITブーム、テレビSF、住宅借り換え促進プログラム(HARP)、ジョージ・W・ブッシュ、N・グレゴリー・マンキュー

○訳者解説
pdf、XX政策、IS-LMモデル

1.2 縦中横
刺激策増加VS.緊縮[p.254、VS.の3文字が縦中横]

1.3 横倒し
本文中にはない

○訳者解説
原書の書名・発行社:Paul Krugman End This Depression Now! (W. W. Norton, 2012)
論文名の紹介:Gauti B. Eggertsson and Paul Krugman “Debt, Deleveraging, and Liquidity Trap: A Fisher – Minsky – Koo Approach” (New York: Federal Reserve Bank of New york, 2010) ほか、

2.アラビア数字
2.1 正立
目次の章番号[本文の章扉は横組みなの非該当]、第2章、図7-1、1、2、3、[箇条書き項目番号]

2.2 縦中横
60ミニッツ[p.16]、105ページ[3文字の縦中横]、176ページ[同]、205ページ[同]、図10-1、第12章、300ページ

○訳者解説
3.1、3.2、3.3 [3文字縦中横]

2.3 横倒し
本文中にはない

○訳者解説
原書の発行年、8th ed., [版数]、pp.137-38

3.記号
2.1 正立
?、セービングス&ローン、!

2.2 横倒し(右90度回転)
○本文
――(2倍ダッシュが多い)、「、」、(、)、状況だ:「回復も[コロンの使用が多い[*1]]、
『、』、二〇~二五パーセント、グラス=スティーガル法、ガーン=セント・ジャーメイン法[p.88]、指名するのは……委員会が[p.111]、図7‐1、〔邦題:『国家は破綻する』〕[p.169]、

○訳者解説
原書の書名中の!、“、”、(、)など(ラテンアルファベットの項参照)、『クルーグマン教授の〈ニッポン〉経済入門』〔春秋社、二〇〇三〕、IS-LM、論文名の紹介
サポートページURL:http://cruel.org/…
訳者アドレス:@

注の合印としての※[p.218,p.219]。

[*1]「:」が多く使われているのは本書特徴です。しかし、必ずしも統一されていません。例えば、p.165には「論点は三つ。(改行)箇条書き3項目」という表現があります。一方、まったく同じようなパターンがp.176にあり、「以下を指す:(改行)箇条書き6項目」と表現されており、不統一です。日本語文書中には「:」はそぐわないように感じるのですが。

■書籍情報
書名:「さっさと不況を終わらせろ」
著者:ポール・クルーグマン著、山形 浩生訳
発行元:早川書房
発行年月:2012年8月10日3版発行
ISBN:978-4-15-209312-7

縦組み経済書にみる英数字と記号の方向―記号は回転が多い

「円のゆくえを問い直す」(片桐 剛士著、ちくま新書)は新書版ですが、非常に内容豊富な書籍です。経済書ですので、年号や数字が頻出します。また、海外の機関名等の略称である頭字語もさまざまなものが出てきます。

これらの英数字の扱いについては、特に数字がアラビア数字であり、ラテン文字が多いという点で『英数字正立論』[*1]0.40版で分類した類型によれば「現代組版」に属すると言えます。

英数字については、既に何冊もとりあげましたが、大よそそれらと同じです。いくつかの特徴を述べますと、為替レート、あるいは小数点付の数字について、76.63円を76が縦中横、63は1文字ずつ正立のように表示しています。どうも数字の縦中横は10進法の10の位と1の位を表記するための専用の表記として使っているようです。

日本人の英文著者名表記でItoだけ正立、Hondaは横倒しは不統一です。恐らく間違いと思います。

今回から、記号類も取り上げますが、記号類は次のようになります。

■和文中での記号表記
正立:/%&?†
右90度回転:【】「」()=-~→・・・:><―-÷〈〉『』

なお、+×のような90度回転しても形が変わらないものもあります。

■後注、参考文献の欧文表記の中の記号がありますが、省略します。

■データ(代表的なもののみ)
1.ラテンアルファベット
1.1 1文字ずつ正立する
FRB、QE3(量的緩和第3弾)、7ヶ国(G7)、WEBROZNA、コアCPI、MC+CD[1文字ずつ正立]、Ito(1992)[Itoを1文字ずつ正立、()は右90度回転、1992は1文字ずつ正立]、FOMC

1.2 横倒しする
Honda et al.(2007)、Williams(2011)[p.202, Honda et al. とWilliams は横倒し、()は右90度回転、2007、2011は1文字ずつ正立]
その他、後注[p.271-]のURL、外国人著者による英文参考文献に多数。

2.アラビア数字
2.1 正立する
2011年、第1章、6つのポイント、76.63円[76は縦中横、63は1文字ずつ正立。為替レートすべてこの形式]、①[丸付きアラビア数字]、4兆5129億円[1文字ずつ正立]、0.005ドル[p.46、1文字ずつ正立]、16.88%[16が縦中横、88%は1文字ずつ正立]

2.2 縦中横
10月31日、23.8%[23が縦中横、.は中黒、8と%は1文字ずつ正立]、1ドル=77円81銭[p.53、77, 81 がともに縦中横]、(1)式から(4)式[3文字で縦中横、但し、注の合い印は()を数字の上下につけている]
No.609/April 2011[p.273, /を正立にし、それ以外の英数をすべて横倒し]

2.3 横倒し
参考文献[p.275-]の外国人著者による英文参考文献、日本語文献の英文名の年数、巻数、号番号。

3.記号
3.1 正立する記号
ドル/円レート、%、M&A[M,&,A 3文字が一つずつ正立]、?、†[小見出しの目印記号として]

3.2 横倒し(右90度回転する記号)
【目次】、「、」、(、)、1ドル=75円32銭[=が右90度回転]、図表1-1[‐が右90度回転]、1ドル=76.63円~77.06円[=と~は右90度回転、63、06は1文字ずつ正立。アラビア数字の項を参照]、15%→32%[p.018。→が右90度回転し下向き矢印となる。15と32縦中横]、ウオン・・・・・・[3点リーダが右90度回転]、例:ドル/円レート[:が右90度回転, /は正立]、外国の名目金利>自国の名目金利[>が右90度回転]、外国の名目金利<自国の名目金利[<が右90度回転]、経済安定化政策→財政政策、金融政策[→が右90度回転]、国際金融のトリレンマ――3つの[――は右90度回転]、Nマイナス1(N-1)[P.109、-が右90度回転]、交易条件÷実質実効為替レート[p.154、÷が右90度回転]、〈論点1〉[ヤマカッコは右90度回転、1は正立]、『平成23年版経済白書』[『』はそれぞれ右90度回転、23は縦中横] 参考文献[p.275-]の外国人著者による英文参考文献の年数を囲む括弧、“”引用符、,、.、07-08[範囲]。 ■書籍情報 書名:「円のゆくえを問い直す――実証的・歴史的にみた日本経済」 著者:片桐 剛士 発行元:ちくま新書 発行年月:2012年7月20日第二刷 ISBN:978-4-480-06663-3 [*1]「英数字正立論」http://www.cas-ub.com/project/index.html

□■□■□■□■□■□■ご案内□■□■□■□■□■□■

CASオンラインショップでCAS-UBのユーザー登録することで、誰でも30日間だけ無償でご利用いただくことができます。
CAS-UB評価ライセンス

なぜ、「英数字正立論」が必要なのか?

昨日、「縦組みにおける英数字正立論」第0.40版を公開して、久しぶりにfacebookで紹介したところ、「著者、出版社にとって具体的にどのようなメリット、デメリットがあるか」を説明して欲しいというコメントがありました。

「縦組みにおける英数字正立論」はこちらから配布しています。→CAS-UBで制作した無償配布の出版物

考えて見ますと、「縦組みにおける英数字正立論」はMVOとの対比のことを強調しすぎていて、一般の方にはわかり難くなっているようです。そこで、次に「縦組みにおける英数字正立論」の必要性を少し説明します。

現在、日本語テキスト中のラテンアルファベットとアラビア数字(まとめて英数字と言います)を縦組みで表示するとリーダーによって文字の向きがばらばらになります。これを典型的に示しているのは次の二つの画像です。

●例1:青空文庫のさまざまなリーダによるラテンアルファベット混じりテキストの表示([*1])

●例2:青空文庫のさまざまなリーダによるアラビア数字混じりテキストの表示([*2])

上の2つの画像で見るとおり、日本語のテキストを縦組みで表示したとき英数字の方向はばらばらです。このようになってしまうのは、テキスト(この場合、英数字)を画面に表示するときの方向についての標準的な仕様が存在しないためです。従って、青空文庫のリーダの表示はどれも間違いとは言えません。

一方、市販の新聞や書籍では英数字の方向は概ねきちんと統一されています。
詳細に見ますと、新聞と書籍は異なります。また書籍には、伝統方式と現代方式があることは、「縦組みにおける英数字正立論」に書きました。但し、書籍により、iPhone、Twitterとか、CSN&Yのような文字列は立てたり寝かしたりと方向がばらばらです。さらに、1冊の書籍でも統一されていないこともあります。ですから、あくまで概ね統一ということですが。

では、上に述べた、青空文庫と市販書籍の落差がなぜ生じるのでしょうか?

それは、市販の書籍は編集者・制作者が介在して文字の方向を整理しているからです。また、制作者はDTPソフトを使って簡単に文字の画面上の向き(字形)を変更できます。そして出来上がった版面をPDF化すると、PDFは紙と同じで2次元座標がきちんと指定されますので、文字の方向が変わることはありません。つまり、印刷物では制作者に文字の方向決定が委ねられており、制作者の熟練によって文字の方向が統一されているのです。

現在、Webの縦書きの標準化が進んでいます。この先、数年で縦書きの標準化が完成し、Webブラウザで縦組みが自由にできるようになります。いままではWebやブログでは縦書きが少なかったのですが、今後は、Web、ブログで縦書きが増えると予想されます。

Web、ブログ、EPUB(Webと同じ方法)、ではテキスト文字列を配布します。テキスト文字列は文字コードで表したもの(符号化文字と言います)なのですが、符号化文字の仕様(JIS、Unicode)には英数字の方向については規定がありません[*3]。そこで何も指定しないときWebなどの縦組み表示は例1のようにばらばらになるでしょう。

そこで文字の向きに関して、何らかの標準が必要なことがわかります。この標準を決めようというのが、UnicodeのUTR#50という仕様案です。UTR#50では、MVO方式とSVO方式の二つの方式案があります。

現在、MVO方式が優勢ですが、MVO方式の中では文字毎に方向を決めようとしているため、意見が割れていてなかなか妥協点に達しません。

SVO方式は少数派でしたが、最近、だんだんと賛同者が増えてきているようです。

私の意見は、SVOをベースにするほうが良いということであり、「縦組みにおける英数字正立論」はそれを日本語組版の仕様や実際の書籍を調査して証明しようとしているものです。なぜSVOの方が優れているかは、本論を読んでいただきたいのですが。

[*1]原典は、twitter @POKEPEEK2011氏によるもので次に公開されています。
https://twitter.com/#!/POKEPEEK2011/media/slideshow?url=http%3A%2F%2Ftwitpic.com%2Fa180ys

[*2]原典は、twitter @POKEPEEK2011氏によるもので次に公開されています。
https://twitter.com/#!/POKEPEEK2011/media/slideshow?url=http%3A%2F%2Ftwitpic.com%2F9yvsif

[*3]JIS X0213では括弧類などについて縦書き字形が提示されています。しかし、英数字の縦書き字形というものはありません。UnicodeのEast Asian Width(EAW)という参考資料には英数字の方向について説明があります。但し、EAWは参考資料であり、また、内容的に不適切な説明が多いと思います。詳細はUAX#11 East Asian Width の紹介

□■□■□■□■□■□■ご案内□■□■□■□■□■□■

「縦組みにおける英数字正立論」はCAS-UBで作成しています。便利ですよ~

CASオンラインショップでCAS-UBのユーザー登録することで、誰でも30日間だけ無償でご利用いただくことができます。
CAS-UB評価ライセンス

「縦組みにおける英数字正立論」0.4版発行。第1章、第2章を全面改訂しました。

この数ヶ月の調査結果と、Twitterなどでの議論を踏まえて、「縦組みにおける英数字正立論」を改訂して0.4版としました。

修正箇所: 第1章、第2章は全面改訂。第5章は入れ替え(旧第5章の内容は、新第2章に反映していますが文章は全部書き換え)

第1章は序論に近いので、重要性は低いですが、第2章に結論を持ってきました。

2.1 日本語縦組みの3つの方式

日本語の縦組みの典型には、新聞方式、伝統的方式、現代方式の3種類があること。その例と特徴を示しています。

2.2 欧字の和字扱い・和欧混植・縦中横

日本語の縦組みにおける英数字の扱いの特徴は欧字の和字扱い・和欧混植・縦中横の3項目にあること。3項目の説明を示し、新聞方式、伝統的方式、現代方式との関係を示しています。

特に欧字の和字扱いと和欧混植は、英数字に対する相反する取り扱いです。英数字の文字コード側からみてこの取り扱いを決定する方法がないこと、これについて記述した標準仕様が従来存在しなかったことが、UTR#50議論の混迷の原因と思います。

2.3 マークアップの必要性

日本語の縦組みを指定するには、マークアップが必須であること、その理由を示しています。

2.4 SVOをデフォルトとするマークアップの薦め

MVOをデフォルトとするマークアップとSVOをデフォルトとするマークアップの方法について比較検討します。
その結果として、SVOをデフォルトとするマークアップの方が優れていることを示します。

●PDF版とEPUB3版を作成して、こちらから配布中です。

http://www.cas-ub.com/project/index.html#Free

ぜひご高覧、ご意見を賜りたく存じます。よろしくお願いします。

「縦組みにおける英数字正立論」はCAS-UBで作成しています。便利ですよ~

■ご案内

CASオンラインショップでCAS-UBのユーザー登録することで、誰でも30日間だけ無償でご利用いただくことができます。
CAS-UB評価ライセンス

日本語文書の組版方法 JIS X4051 における縦組みの英数字の向き

日本語組版に関するJIS規格としてJIS X4051[*1]があります。「日本語組版処理の要件」(JLReq)の文字クラス[*2]はJIS X4051を元にしていますが、ベーシックラテンの文字についての考え方は、かなり異なっています。

JIS X4051では日本語組版に使う文字としてはJIS X0213の文字を対象としています。JIS X0201の文字は空白を除いて記載されていません。

ラテンアルファベットの大文字と小文字は、欧文用文字とされており、和字には含まれていません。
また、アラビア数字は、欧文用文字、連数字中の文字、単位記号中の文字(1~4)とされていますが、和字には含まれていません。

このように、JIS X4051ではラテンアルファベットやアラビア数字は、和字クラスには入らないのが、JLReqとの相違点です。

では、ラテンアルファベットやアラビア数字が縦書きで正立しないかというとそうではありません。

4.7和欧文混植処理

備考 和文と欧文を区別する方法は、処理系定義とする。

4.19 b)では縦書きの行中では、欧文の文字の向きを右回りに90°回転して欧文を横書きにし、a)に従う。

備考 縦書きの欧字または数字を和字として扱う場合は、ベタ組みとし、次のように配置する

とあり、JISを正立で表記した例が挙げられています。

すなわち、和欧混植処理では横倒しですが、ラテンアルファベットや数字を和字として扱うこともできて、そのときは正立になります。

このように、JIS X4051ではラテンアルファベットやアラビア数字は和字クラスには入れていないのですが、和字として扱うこともできるとしています。

念のために定義を確認してみますと次のように欧字も縦書きで使う全角形は和字として扱うことになります。

定義)
・和文
 和字で構成される文章であって欧文を含まないもの
・和字
 和文を構成する漢字、仮名、数字、約物およびその他の記号。縦書きの場合、全角の欧字を含む。
・欧文
 欧文用文字および欧文間隔で構成される文章であって、横書きとし、欧文ピッチ処理の対象となるもの。
・欧文用文字
 欧文を書き表すときに主な構成要素となる表音文字(欧字)、数字および記号(コンマ、ピリオド、コロン、セミコロンなど)。縦書きで用いる全角の欧字は、和字として扱う。

[*1] 日本語文書の組版方法 JIS X 4051:2004 平成16年3月20日改正
[*2] 「日本語組版処理の要件」に見る英数字の扱い

■ご案内

CASオンラインショップでCAS-UBのユーザー登録することで、誰でも30日間だけ無償でご利用いただくことができます。
CAS-UB評価ライセンス

縦組み時の文字方向について:UTR#50のSVOデフォルト、MVOデフォルト、現代方式、伝統方式、新聞方式の相違を分析する

AH Formatter V6.0 の縦組み時の文字方法設定にSVOモードを使えるように実装しています。開発者の話では、大分出来上がっているようですので、さっそくこれを使って縦組み時の文字方向の設定について比較検討してみたいと思います。

既に、このブログでは何回も取り上げているとおり、UTR#50(ドラフト)では縦組み時のデフォルト文字方向について、SVO方式とMVO方式が提案されています。

SVO方式、MVO方式ともに、コンテンツ(テキスト)に特別なマークアップを指定しないときのデフォルト文字方向です。実際には、日本語文書の中に欧文の単語などが混じるときは和文混植という組版を行なうことになります。つまり、商業的印刷物を作るときは、SVO・MVOをデフォルトのまま用いるのではなくて、日本語部分と欧文部分について何らかの指定をして使うことになります。

日本語の縦組み文章に英数字が混じるとき、その和欧混植の方法として、現代組版、新聞方式、伝統組版の3通りがあります。

下に例を示しました。ご覧いただくとお分かりの通り、デフォルト状態ではSVOにするかMVOにするかで違いが出ます。新聞組版はSVOに対して縦中横を追加する方式です。

現代組版方式で和欧混植指定をした結果(PDF)はSVOでもMVOとは同等になります。つまり、SVO方式でもMVO方式でも最後の見かけはまったく同じになります。

但し、指定方法(マークアップとCSSの作り方)は、どちらをデフォルトにするかで変わってきます。XHTMLをご覧いただくと分かると思いますが、デフォルトをSVOにするほうが、マークアップはコンテキストに沿うようになります。具体的には、英語単語の箇所に lang=”en” というマークアップをし、スタイルシートでlang=”en”の範囲を横倒しするという指定になります。組版処理を行なう際は、和文と欧文では空きのとり方、改行位置の決定方法が異なりますが、マークアップを手がかりにして処理の切り替えができます。

一方、MVOをデフォルトにすると文字を正立させる目的のマークアップが随所に必要となります。文字の向きを変えることを目的とするマークアップは意味的なものではなく、見かけを整えるためのものです。このマークアップでは、和文組版と欧文組版の処理切り替えの役には立ちません。

伝統的な組版をするには、アラビア数字を漢字に変換するなど別処置が必要となります。

※SVOをデフォルトにするか、MVOをデフォルトにするかの議論に伝統組版を持ち出すのは筋違いですが、参考のため示したものです。

次に順番に紹介します。

1.原稿

原稿は横書きで簡単な文章を含むXHTMLとします。英数字はUnicodeのベーシック・ラテン文字を使っています。


原稿PDF
原稿HTML

2.SVO方式デフォルト

原稿を縦組みとします。そのとき文字の方向をSVOデフォルト設定としたところです。英数字は正立します。記号類の扱いはさらに検討が必要です。


SVOデフォルトPDF
SVOデフォルトHTML
[*1]

3.MVO方式デフォルト

原稿を縦組みとします。そのとき文字の方向をMVO方式のデフォルト設定としたところです。


MVOデフォルトPDF
MVOデフォルトHTML

4.SVO方式を元にマークアップして和文混植を指定する現代組版

原稿を縦組みとします。そのとき文字の方向をSVO方式のデフォルト設定を指定しておき、それに加えて欧文の部分を横倒しする指定と縦中横指定をしたところです。


SVOベースにマークアップで和文混植を指定PDF
SVOベースにマークアップで和文混植を指定HTML

5.MVO方式を元にマークアップして和文混植を指定する現代組版

原稿を縦組みとします。そのとき文字の方向をMVO方式のデフォルト設定を指定しておき、それに加えて和字として扱いたい(正立させたい)英数字を正立指定と縦中横指定をしたところです。


MVOベースにマークアップで和文混植を指定PDF
MVOベースにマークアップで和文混植を指定HTML

4と5は表示上は同じです。しかし、マークアップが異なります。

6.新聞方式

次に新聞方式の設定をします。新聞方式は、SVOデフォルト設定に対してさらにアラビア数字の2桁の箇所のみ縦中横設定をした状態です。SVOでは英数字を正立させてしまうので2桁であっても縦中横にはならないのですが、新聞方式は縦中横を頻繁に使います。


新聞方式PDF
新聞方式HTML

7.伝統方式

最後に比較のため、伝統方式で設定します。伝統方式はマークアップだけではなくて、アラビア数字を漢数字に変換しています。(おまけに、1文字のラテンアルファベットを全角幅にしました。)


伝統方式PDF
伝統方式HTML

■注意
「日本語組版の要求条件」[*1]では正立する英数字は全角形を使うことになっています。これを前提にすると、上のSVOあるいはMVOを元にマークアップして和文混植を指定する現代組版の例では、正立させる文字については全角系のグリフイメージを表示するべきです。このあたりの処理は開発の課題です。現状、上の例ではプロポーショナルなグリフイメージを使っています。

[*1] UTF#50のドラフトSVO仕様:http://unicode.org/reports/tr50/tr50-5.Orientation.htmlでは、
U+003A(コロン)はSVO=Uになっている。しかし、JIS X4051ではコロンの縦書き字形は横倒しである。

■ご案内
CASオンラインショップでCAS-UBのユーザー登録することで、誰でも30日間だけ無償でご利用いただくことができます。
CAS-UB評価ライセンス

第2回 AH Formatter事例紹介セミナー 27日 開催が迫りました

第2回 AH Formatter事例紹介セミナー 7月27日(金曜日)午後開催です。

■開催場所: 堀留町区民会館 東京都中央区日本橋堀留町1-1-1   
  交通 (東京メトロ日比谷線、都営浅草線「人形町駅」A5番出口 徒歩5分
東京メトロ日比谷線「小伝馬町駅」 3番出口 徒歩5分)

■日時 2012年7月27日(金)13時30分~16時40分

■アジェンダ

13:30  開始
13:35~13:50 AHFormatter概要とW3C日本語書籍の組版
13:50~14:20 DITAによるマニュアル作成の実体
       ~シングルソース・マルチターゲットへの取り組み~
       (ニューメリカルテクノロジーズ)
14:20~14:50 XMLによるデジタルビデオカメラ取扱説明書の制作事例
       ~多言語制作の効率化(iTrexシステム)~
       (三和印刷工業)
14:50~15:20 オンライン入稿・自動組版でのAH Formatterの活用事例
       (ニューキャスト)
15:20~15:30 休憩
15:30~16:00 JATS(学術出版物)スタイルシートの説明
16:00~16:20 電子出版への応用
16:20~16:40 質疑応答
16:40  終了

■お申し込み
申し込みフォーム
(事務局:エクスイズムのWebページにジャンプします)

■概要
「第2回AH Formatter事例紹介セミナー」のご案内

■お知らせ(CAS-UB試用ライセンス)
CASオンラインショップでCAS-UBのユーザー登録することで、誰でも30日間だけ無償でご利用いただくことができます。
CAS-UB評価ライセンス

「日本語組版処理の要件」に見る英数字の扱い

日本語組版で文字・記号を行に配置するときの、文字間の空き量、文字間での改行の可否、行の調整のために文字間を空けたり・詰めたりの調整などの振る舞いは文字毎に異なります。その振る舞いが同じ文字や記号ごとにグループ分けし、これを文字クラスとすることにより、組版ソフトなどが文字クラス毎に振る舞いを管理できます。

「日本語組版処理の要件」(W3C技術ノート[*1]、以下、JLreq)では付属書Aに文字クラス、および各クラスに属する文字の一覧が出ています。これを、英数字ならびに(参考のため)ギリシャ文字、キリル文字といった文字の種類毎に、どの文字クラスに属するかという観点から再整理すると次の表のようになります。

Unicode cl-19 漢字等 cl-24 連数字中の文字 cl-25 単位記号中の文字 cl-27 欧文用文字
ラテンアルファベット大文字 U+0041~U+005A
ラテンアルファベット小文字 U+0061~U+007A
アラビア数字 U+0030~U+0039 U+0031~U+0034
ギリシャ大文字 U+0391~U+03A9 U+03A9
ギリシャ小文字 U+03B1~U+03C9 U+03BC
キリル大文字 U+0401
キリル大文字 U+0410~U+042F
キリル小文字 U+0430~U+0451

簡単に各文字クラスの特徴をまとめます。
・漢字類は全角形で、縦組み中では正立、任意の文字と文字の間で改行することができます。
・欧文用文字はプロポーショナル形で、縦組み中では横倒し、単語間でのみ改行できます。
・連数字の中では改行はできません。

JLReqではBasicラテンのアルファベットは、漢字類、欧文用文字の両方に属し、さらに単位記号中の文字にも属します。つまり、ラテンアルファベット文字は全角形をとり、任意の文字間で改行するという漢字のような振る舞いをする一方で、プロポーショナルな字形となり、単語間でのみ改行できるという振る舞いにもなります。

Basicラテンのアラビア数字は、漢字類、欧文用文字に加えて、連数字にも属します。

JLreqの本文では、Basicラテンのアルファベットやアラビア数字が、どういう条件で漢字として振る舞い、あるいは欧文文字、連数字中の文字、単位記号中の文字として振る舞うかは明確に記述されていません。

全体としてはコンテキストによって振る舞いを変えることができるものと想定されているようですが、例えばマークアップによって切り替えるということになるのでしょう。

先日紹介した「UAX#11 East Asian Width」[*2](以下、EAW)では文字に狭い(Narrow)、広い(Wide)、曖昧(Ambiguous)という特性を分けていました。Narrowは欧文用文字の振る舞いをし、Wide文字は漢字類の振る舞いをすることになっていますので、それぞれJLreqのcl-19とcl-27に相当します。

しかし、EAW#11では、Basicラテンの文字はNarrow特性をもち、Wide特性をもたないものとしています。

このように見ますとEAWとJLReqでは、Basicラテンの文字について、対照的な考え方を採用していると言えます。

[*1]日本語組版処理の要件(日本語版)
[*2]UAX#11 East Asian Width の紹介

■CASオンラインショップでCAS-UBのユーザー登録することで、誰でも30日間だけ無償でご利用いただくことができます。
CAS-UB評価ライセンス

UAX#11 East Asian Width の紹介

Unicode仕様の付録にEast Asian Width(EAW)という文書があります[*1]。これは東アジアのレガシーな文字集合(日本では主にシフトJIS)との相互運用のためのUnicode文字の参考特性についての仕様です。

1. EAWの目的

EAWは次のような実装のための参考情報です。

・東アジアのレガシーが符号化文字とUnicodeの相互運用
・東アジアと西欧のタイポグラフィーと行レイアウトの両方のサポート
・東アジアの文字を含む、マークアップされていない文字にフォントを関係つけるため

2.概要

EAWの概要を紹介します。

(1) 半角文字と全角文字
東アジアのレガシーな符号化において1/2Em幅の文字を半角(Halfwidth)といい、Em幅の文字を全角(Fullwidth)という。レガシーな符号化では半角は1バイトであり、全角は2バイトである。Unicodeではもうそのような区別はない。

(2) Unicode文字のデフォルト特性値
Unicodeの文字データベースでは、各Unicode文字にデフォルト幅特性を与えている。これは次の6つの値の一つである:

1) 曖昧
あるときは広く、あるときは狭くなる文字幅特性。曖昧な文字の幅を決定するには、文字コードに含まれていない情報が必要である。この例は、ギリシャ文字やキリル文字であり、東アジアのレガシーな文字集合では広くなり、非東アジアではない用途では狭くなる。

Unicodeから東アジアのレガシーな文字集合に対応つけるときは、全角文字にマップする。非東アジア以外の文字集合に対応つけるときは通常の(狭い)文字にマップする。

2) 全角
UnicodeでFullwidthと定義されている文字すべて。
U+FF01(U+0021(!)の全角文字)~U+FF5E(U+007E(チルダ)の全角文字)
U+FF60(全角幅左白括弧)、FF61(全角幅右白括弧)、FFE0~FFE6(全角記号の異形文字、全角通貨記号など)

3) 半角
Unicodeで明示的にHalfwidthと定義されている文字。
U+FF61~FF64(半角句点、半角鍵括弧、半角読点)
U+FF65(半角中点)
U+FF66~FF9F(半角カタカナ)

Unicodeから東アジアのレガシーな文字集合に対応つけるときは、半角文字にマップする。非東アジア以外の文字集合にはマップできない。

4) 広い(Wide)
漢字、ひらがななど。

Unicodeから東アジアのレガシーな文字集合に対応つけるときは、全角文字にマップする。非東アジア以外の文字集合にはマップできない。

5) 狭い(Narrow)
常に狭い文字である。狭い文字には対応する明示的な全角または広い文字がある。ASCII文字は、Unicodeに全角文字が定義されていることから狭い文字の例である。

Unicodeから東アジアのレガシーな文字集合に対応つけるときは、半角文字にマップする。非東アジア以外の文字集合では通常の(狭い)文字にマップする。

この定義による限り、ASCIIの「A」のような文字を全角形で表示することはできないことになる。

6) 中立(非東アジア)
他の文字である。東アジア文字集合の中には含まれない。

任意の処理において、コンテキストに応じて、文字の幅は最終的に広いか狭いのどちらかに決定する。

3.問題点
EAWは、(1)レガシーな文字符号化とUnicodeの文字コードの相互変換を行なうためのものであるとともに、(2)東アジアと西欧のタイポグラフィーと行レイアウトの両方のサポートとされている。

文字コードの変換については、EAWのような対応関係をつけるのはやむを得ないだろう。

しかし、行レイアウトは、新しいレンダリング方式はフォントの選択やソースの文字コードの範囲をこえた、文脈情報を使って文字の幅(Wide-Narrow)を決定するようになっているが、この仕様書はそういう変換を追跡していないとされている(仕様書の「現代のレンダリング実践」の項)。

しかし、EAWではASCIIコードに属していた文字コードは、狭い(Narrow)文字であり、Wideにならない。ところが、一方、ラテン補助文字、拡張文字、キリル文字、ギリシャ文字はNarrowにもWideにもなる。

具体例で示すと、たとえば、「A」(ASCIIに属する)という文字はWideにはならないので、「A」をWideにするには、「A」に対応する「A」という全角文字コードに変換しなければならない。ところが、たとえばギリシャ文字、日本語文脈中ではWideであり、ギリシャの標準フォントを指定するとNarrowになる。

つまり、ASCII文字は全角文字が別に定義されているために、幅の操作がとても不便なのだが、ギリシャ文字の幅の操作は簡単という、なんだか首尾一貫しないことになっている。

今後は、レガシーな文字集合(シフトJIS)において1バイト文字か2バイト文字のどちらに属しているかによって取りうる文字の幅に制限を設けるというEAWのような奇妙なやり方は廃止するほうが良いだろう。

〔追記〕
WideとNarrowの違いとして文字の幅という解釈を強調しすぎたようなので反省(次の項を参照)。定義にはあまり明確に書かれていないが、仕様書のOverviewでは、組版においてWideはIdeographのような挙動(1文字毎に改行ができ、縦組みで正立)を示す。一方、Narrowは、単語あるいは一連の文字の固まりを保持し、また、縦組みでは横倒しになる、とされている。このように、WideとNarrowの相違点は、文字の幅だけではなくて組版のときの文字としての挙動の違いという捕らえ方をするとわかりやすい。

また、勧告の項には、Wide/Narrowについて「データの処理と表示に際しての振る舞いについて」という項目があり、次のようになっている:
①Wide文字は表意文字のように振舞う。
②Narrow文字は、例えば改行において西欧の文字のように振舞う。また縦組みでは横倒しになる。
③曖昧な文字は、言語タグ、スクリプト識別、対応フォント、データのソース、マークアップなどのコンテキストに応じてWideまたはNarrowのように振舞う。コンテキストを確立できないときは、デフォルトではNarrow文字として扱われるべきである。

Basic Latinの文字はNarrowの値をとるのみとし、一方、ギリシャ文字やキリル文字は曖昧で、コンテキストによってNarrowになったりWideになったりするというような扱いの相違がある。

EAWでは、文字としての振る舞いの相違点の根拠は、Basic LatinはJIS X0201とJIS X0208の両方にあり、ギリシャ文字やキリル文字はJIS X0201になく、JIS X0208のみにあるということになる。しかし、これはレイアウトと改行処理における、文字の挙動の相違を説明する理由にはなりえないのではないか?

[*1]Unicode Standard Annex #11 East Asian Width

■CASオンラインショップでCAS-UBのユーザー登録することで、誰でも30日間だけ無償でご利用いただくことができます。
CAS-UB評価ライセンス

1950年代岩波文庫における英数字の扱い

一昨日に続き、昭和前半の岩波文庫の英数字表記を調べてみます。題材は、「歴史における個人の役割」(プレハーノフ著、木原正雄訳、昭和33年10月発行)です。

この本はロシアのマルクス主義者であるプレハーノフの哲学書を翻訳したものなので、ロシア語(キリル文字)、英語・フランス語・ドイツ語(ラテンアルファベット、補助記号)が入り乱れています。翻訳文中の人物名、原書名などに原文がラテンアルファベット(ASCII以外の補助記号を含む)やキリル文字の表記が注記されていることが多く、これらはすべて横倒しです。

ラテンアルファベット、キリル文字は大文字は幅が広く、小文字は幅が狭いのですが、総じて半角幅ではありません。ラテンアルファベットはプロポーショナルです。

ラテンアルファベットが正立するのは1文字で記号的に使用している箇所です。さらにその記号を使って数式表記する場合は、数式を横倒しとしています。正立する文字は横倒しの文字よりも少し大きい文字です。

本文中にアラビア数字が出現するのは、原著のページ番号参照(書名と一緒に横倒し)と、解説の中の箇条書きのみです。

1.ラテンアルファベットとキリル文字

(1)横倒し
横倒しの箇所の例を挙げる。キリル文字についてはうまく判読できていないところもある。大抵の箇所は、日本語訳の後ろに()内に原文を示すかたちで書かれている。一種の注である。原文は、英語、ドイツ語、フランス語が入り乱れている。本書では氏名の初出箇所にはキリル文字またはラテン文字の注がついておりそれらは横倒しである。以下、数が多いので例のみあげている項目がある。

ラテン文字を横倒しにしているとき、活字は半角幅ではない。プロポーショナルな幅をもつ。平均的にみてラテンアルファベット一文字の幅は和字の2/3幅程度で半角幅よりも広い。
キリル文字は大文字は幅が広く、小文字の幅は狭い。固定ピッチのように見える。半角幅よりも広い。

a) 訳文の原文例
わたくしがあらゆる動物の中でもっとも不活発なものだ(am not the most torpid and lifeless of all animals)
キリスト経的必然論者(christian necessarians)
とるにたりないもの(quantité négligeable)
歴史生活全体(das Ganze des geschichtlichen Lebens)
いまは亡き夫(feu monsieur mon mari)

b) 氏名例 
プレハーノフ(Г.В.Плеханов)
カブリツ(Каблиц,Осип Иванович)
スペンサー(Spencer, Herbert)
プリーストリー(Priestley, Joseph)
プライス(Price, Richard)
ランソン(Lanson, Gustaue)
カルバン(Calvin, Jean)
クセルクセス(Xerxes 原名 Khshayarsha)

c) 書名、雑誌名、論文の題名など例
『歴史における個人の役割』(К вопросу о роли личности в истории)
G. V. Plekhanov, The Role of the Individual in History, translated from Russian by J. Finebery, Foreign Languages Publishing House, Moscow, 1944
『キリスト教原理』〔Institutio〕[*1]
《Die Freiheit ist dies, Nichts zu wollen als sich》. Werk, B. 12, S. 98. (Philosophie der Religion).
『歴史評論』(《Revue Histrique》)
《Histoire de France》, 4-ème édition, t.XV, p.520-521 (『フランス史』第四版、十五巻、五二〇―五二一ページ)

[*2]

d) 社名

e) 引用段落

f) 引用文

(2)正立
条件Sが存在するばあい、現象Aがかならずおこる
一定時間Tにあらわれるだろう
諸条件の総量Sには、たとえば、aにひとしい…
諸条件の総量はすでにSではなくて、S-aになるだろう (1文字は正立、S-aの部分は横倒し)
もしaがbに等しい(a=b)とすれば (1文字は正立、a=bの部分は横倒し)

Aという才能ある人は一つの問題Xを… (p.70)

2.アラビア数字
(1)横倒し
ラテン文字などで表記した書籍のページ参照にアラビア数字が使われている。

(2)正立
解説中に箇条書き(1)~(3)(括弧を含む3文字で縦中横)が出てくるのみである。

本文中ではほとんど漢数字である。年月日、年齢など頻出するがすべて漢数字。目次のページ番号も漢数字。後注の合印や後注番号も漢数字である。
また、各ページの上に表示されるノンブルはアラビア数字。

3.書誌情報

書名:歴史における個人の役割
著者:プレハーノフ
訳者:木原 正雄
発行時期:昭和33年10月
体裁:文庫本、112頁
発行所:岩波書店

[*1]〔〕は『哲学著作選集』編者注
[*2] 《》の用途が理解できない。(フランス語やドイツ語の書名、論文やチラシなどの題名のようだが、《》で囲まれていない箇所もある)

■CASオンラインショップでCAS-UBのユーザー登録することで、誰でも30日間だけ無償でご利用いただくことができます。
CAS-UB評価ライセンス