縦書きにおける文字の方向について、UTR#50改訂版ドラフトの内容紹介

縦書きにおける文字のデフォルト方向を定義するUnicodeの技術レポートUTR#50の新しい草案(Revison 3)が2月10日に公開されています。

Working draft of Proposed Draft Unicode Technical Report #50
UNICODE PROPERTIES FOR VERTICAL TEXT LAYOUT
http://www.unicode.org/reports/tr50/tr50-3.html

まだ作業中のようですが、以下に内容のあらましを紹介します。

Revision 2からの変更点は次のとおりです。

  1. Revison 2の中のEAC(East Asian Class)が取り除かれました。
  2. 従来のEAO(East Asian Orientation)は名前がEAVO(East Asian Vertical Orientation)に変更されました。
  3. 新しい特性として、DVO(Default Vertical Orientation)が導入されました。

EACは「日本語組版処理の要件」をもとにした空き量の調整ですが、これは、「縦組みにおける英数字成立論」でも疑問を提示しました通り、横組みにも適用されるものですし、そもそも空き量の調整は綺麗な組版のためのものなのでUnicodeのような文字コードレベルで規定するのがふさわしいかどうか疑問があります。取り除いたのは賢明と思います。

Revision 2ではEAOがEACに依存していましたが、この依存性に関する記述はなくなりました。この結果、本文からは全角文字と半角文字に関する記述はなくなりました。

DVOは次のように定義されています:
「文字がほとんど直立する世界における縦書きに使うことを意図している」(5 Properties)

この文章の意味はあまり明確ではありませんが、次の例が挙がっています。

  1. 西欧の縦組みテキストの例(文字を正立させて縦組みしている案内版)
  2. 日本の頭字語(DVD、TV)の例

EAOとDVOをどのように組み合わせるか、あるいは、なんらかの規則を設けるかなどは今後の検討課題となります(Editorial Warningsより)。

縦組みのときの方向特性値は従来どおりで変わりません。次のような定義です。

U:文字コード表に現れるのと同じ方向で直立する
S:文字コード表の方向から右に90度回転する
SB:横倒しにする括弧類
T:直立・横倒しではなくて縦組み時に異なるグリフ(字形)にする必要がある

新しいデータファイルが用意されています。
データファイル

基本ラテンの文字コード別にどのような割り当てになっているかを調べて見ます。

文字コード, DVOの値, EAVOの値
0020(‘ ‘), S , S (空白)
0021(!), U , S
0022(“) , U , S
0023(#) , U , S
0024($) , U , S
0025(%) , U , S
0026(&) , U , S
0027(‘) , U , S
0028(‘(‘) , S , S (開き括弧)
0029(‘)’) , S , S (閉じ括弧)
002A(*) , U , S
002B(+) , U , S
002C(,) , U , S
002D(-) , S , S
002E(.) , U , S
002F(/) , U , S
0030…0039(0…9) , U, S
003A(:) , U, S
003B(;) , U, S
003C(<) , U, S 003D(=) , U, S 003E(>) , U, S
003F(?) , U, S
0040(@) , U, S
0041…005A(A…Z) , U, S
005B([) , S , S
005C(\) , U , S (バックスラッシュ)
005D(]) , S , S
005E(^) , U , S
005F(_) , S , S
0060(`) , U , S
0061..007A(a…z) , U , S
007B({) , S , S
007C(|) , U , S
007D(}) , S , S
007E(~) , U , S

EAVOでは基本ラテンの(~U+007Eまでの)文字はすべて横倒しとなりますが、DVOでは縦書きにおいて括弧類など一部の文字(表でSになっている文字)のみを横倒し、ラテンアルファベットとアラビア数字はデフォルトで正立となります。DVOを使うと「縦組みにおける英数字正立論」の主張と同じとなります。

ここで規定する方向特性の値は、あくまでデフォルト値です。英数字はマークアップで明示的に指定して横倒しにすることはできます。

「縦組みにおける英数字正立論」では記号類は未検討でしたので、これから記号類を含めてもう少し精密な検討をして改訂したいと考えています。

○「縦組みにおける英数字正立論」:http://www.cas-ub.com/project/index.html 

○UTR#50付属のデータファイルでは、EAVO-A方式とEAVO-B方式の二通りがあります。A方式とはすべての記号類に’U’を割り当てる方式、B方式は矢印、数学記号、罫線記号、括弧に’S’を割り当て、その他の記号を’U’とする方式です。どちらが良いか意見を求めています。

縦組み書籍における英数字の使われ方―その2

「縦組み書籍における英数字の使われ方」についての実態を調べています。前回(1月24日)は、小説などの文学系の例を3冊とりあげました。

今回は、編集者や記者のためのガイドブックとして、「記者ハンドブック 第12版」(共同通信社編著、2011年10月11日、ISBN978-4-7641-0619-2)を調べてみます。

まず、この本の構成ですが、全体740頁のうち、先頭から630頁までが横書きですが、資料編110頁が横書きです。外国の地名・人名の表記、新聞略語集などが資料編に収容されています。縦書きで表記しにくいラテンアルファベットの英語表記は横書き頁を設けているのです。

(1)数字について
目次は縦組ですが、頁番号は3桁までの縦中横です。
年月日、箇条書きの項目番号、数量(X個、Xつなど)はアラビア数字ですが、2桁までは縦中横、それ以上は正立して表記しています。箇条書きの項目番号を(1)のように表記する場合、括弧まで含めて縦中横としています。(15)という4文字組(115頁)の縦中横が出てきます。
投票の得票数の例では2桁でも縦中横を使わずに表記しています。(534頁。電文の例だから例外かもしれません。)

書籍の中にはアラビア数字はかなり頻繁にでてきますが、すべて正立です。2桁の縦中横数字の頻度が非常に多いのが特徴です。

(2)ラテンアルファベット
2-a. 正立:WHEN、WHERE、WHO、WHAT、WHY、HOW、5W1H、もうひとつのW、WORTH (10頁)、A欄、A+B、など(110頁)、GK、MFなど(125頁)、ウイリアム・J・クリントン(126頁)、AからBまで(127頁)、SLのかま(202頁)、CD(236頁、256頁)、DVD(256頁、276頁)、B5版(383頁)、JOC(408頁)、RSウイルス、IgA腎症(487頁)、E型肝炎、GVHD、A型、A群、HTLV1、HAM、ADH、LD、TSH、QT、IBS(488頁)、ACS、Q熱、ALS、CJD、DIC(489頁)、SARS(490頁)、PTSD、SAS、STD、ATL、GHD(491頁)、ADHD、TSH、H5N1(492頁)、SIDS、VRE、PRL、Bウイルス、ビタミンD(493頁)、CJD、GSS、FFI、CKD、CFS、COPD、MRSA、HUS(494頁)、VRE、O26、MRSA、BSE(495頁)(病気の名前はラテンアルファベット頭文字が多い)、AはBの、lockとrock(小文字だが、正立)、W杯、ASEAN(527頁)、AP、RP(528-529頁)、NHK(531頁)、JR(549頁)、CEO、COO、A氏(550頁)、A=当人、B=・・・、C=称号、D=当人(562頁)、START2、GIレース(570頁)、A340、F22、P3C(571頁)、ABCDのうち(574頁)、4WD(581頁)、SI(585頁)、kW(縦中横)(586頁)、特殊な場合のほかは、「C、F」は使わない。m、cm(縦中横)、km(同)、g、kg(同)、cc(同)、W、kW(同)を使っても良い(587頁)。これ以外にも1文字の例はいくつかありますが省略します。

2-b. 横倒し:(外来語の書き方の項)現音の語尾の―er, ―or, ―arなどは、-yは(461頁)、語尾の-umは、語尾が-tureの(462頁)、http://www.kyodo.co.jp/(改行)feedback@kyodo.news.jp(以上、全角形で横倒し)(560頁)、

以上は、ラテンアルファベットについて、割合規則が明確なように思います。つまり、原則正立です。外来語であることを明示的に示したとき、URLが横倒しです。つまり横倒しが例外です。かならずしも、全角形・半角形ではありません。

(3) 計量単位の項
ところが、主な計量単位と種類の項(590-597頁)にはラテンアルファベットの正立と横倒しが混在で出てきます。

3-a. 正立:E, P, G, M, k, h, da, d, c, m, μ, n, p, f, a(アト), a(アール),A, ac, LD50, Ω, Å, oz, nm, M, ct, K, Kt, 24K, cd, Ci, GW, kW, C/kg, Gy, K, G, COD, ppm, cc, Sv, J, pH, dB, eV, AU, t, tn, N, Kt, Kn, Pc, Pa, BOD, ppm, ppb, ppt, μs, bu, FLOPS, MFLOPS, Bq, Hz, μm, M, nm, MPH, M, μ, MIPS, lx, R

3-b. 横倒し:I.U., floz, cpm, car, Gal, gal, Kcal, MeV, GeV, TeV, lbt, Ltn, barrel, bit, byte, nsec, psec, (discomfort index, DI), hPa, MHz, kHz, rad, rem, lot

3-aを見ますと、どうも、1文字は正立、2文字も正立で縦中横として表記、3文字以上は大文字なら正立で縦に並べるという規則のようです。但し、3-aでppm, ppbが正立になっているのは例外ですが、これは定義箇条の見出しだからでしょうか。3-bで、小文字が混じった3文字となりこれは横倒し、( )内で英文表記とセットになっているときは大文字2文字(DI)でも横倒としているようです。全角形とか半角形の区別はないようです。

共同通信社のハンドブックは新聞の表記ともかなり類似していると思いますが、まとめると次のようになります。

(1)アラビア数字はすべて正立で横倒しはない。但し原則2文字まで(まれに年齢などで上下の括弧内3文字)が縦中横です。縦中横の頻度が多いと思います。

(2)ラテンアルファベットも原則として正立と思います。3-bでみるように単位が小文字交じりで3文字以上になったときのみ横倒し表記となります。

関連記事:
1.縦組み書籍における英数字の使われ方