縦書きにおける文字のデフォルト方向を定義するUnicodeの技術レポートUTR#50の新しい草案(Revison 3)が2月10日に公開されています。
Working draft of Proposed Draft Unicode Technical Report #50
UNICODE PROPERTIES FOR VERTICAL TEXT LAYOUT
http://www.unicode.org/reports/tr50/tr50-3.html
まだ作業中のようですが、以下に内容のあらましを紹介します。
Revision 2からの変更点は次のとおりです。
- Revison 2の中のEAC(East Asian Class)が取り除かれました。
- 従来のEAO(East Asian Orientation)は名前がEAVO(East Asian Vertical Orientation)に変更されました。
- 新しい特性として、DVO(Default Vertical Orientation)が導入されました。
EACは「日本語組版処理の要件」をもとにした空き量の調整ですが、これは、「縦組みにおける英数字成立論」でも疑問を提示しました通り、横組みにも適用されるものですし、そもそも空き量の調整は綺麗な組版のためのものなのでUnicodeのような文字コードレベルで規定するのがふさわしいかどうか疑問があります。取り除いたのは賢明と思います。
Revision 2ではEAOがEACに依存していましたが、この依存性に関する記述はなくなりました。この結果、本文からは全角文字と半角文字に関する記述はなくなりました。
DVOは次のように定義されています:
「文字がほとんど直立する世界における縦書きに使うことを意図している」(5 Properties)
この文章の意味はあまり明確ではありませんが、次の例が挙がっています。
- 西欧の縦組みテキストの例(文字を正立させて縦組みしている案内版)
- 日本の頭字語(DVD、TV)の例
EAOとDVOをどのように組み合わせるか、あるいは、なんらかの規則を設けるかなどは今後の検討課題となります(Editorial Warningsより)。
縦組みのときの方向特性値は従来どおりで変わりません。次のような定義です。
U:文字コード表に現れるのと同じ方向で直立する
S:文字コード表の方向から右に90度回転する
SB:横倒しにする括弧類
T:直立・横倒しではなくて縦組み時に異なるグリフ(字形)にする必要がある
新しいデータファイルが用意されています。
データファイル
基本ラテンの文字コード別にどのような割り当てになっているかを調べて見ます。
文字コード, DVOの値, EAVOの値
0020(‘ ‘), S , S (空白)
0021(!), U , S
0022(“) , U , S
0023(#) , U , S
0024($) , U , S
0025(%) , U , S
0026(&) , U , S
0027(‘) , U , S
0028(‘(‘) , S , S (開き括弧)
0029(‘)’) , S , S (閉じ括弧)
002A(*) , U , S
002B(+) , U , S
002C(,) , U , S
002D(-) , S , S
002E(.) , U , S
002F(/) , U , S
0030…0039(0…9) , U, S
003A(:) , U, S
003B(;) , U, S
003C(<) , U, S
003D(=) , U, S
003E(>) , U, S
003F(?) , U, S
0040(@) , U, S
0041…005A(A…Z) , U, S
005B([) , S , S
005C(\) , U , S (バックスラッシュ)
005D(]) , S , S
005E(^) , U , S
005F(_) , S , S
0060(`) , U , S
0061..007A(a…z) , U , S
007B({) , S , S
007C(|) , U , S
007D(}) , S , S
007E(~) , U , S
EAVOでは基本ラテンの(~U+007Eまでの)文字はすべて横倒しとなりますが、DVOでは縦書きにおいて括弧類など一部の文字(表でSになっている文字)のみを横倒し、ラテンアルファベットとアラビア数字はデフォルトで正立となります。DVOを使うと「縦組みにおける英数字正立論」の主張と同じとなります。
ここで規定する方向特性の値は、あくまでデフォルト値です。英数字はマークアップで明示的に指定して横倒しにすることはできます。
「縦組みにおける英数字正立論」では記号類は未検討でしたので、これから記号類を含めてもう少し精密な検討をして改訂したいと考えています。
○「縦組みにおける英数字正立論」:http://www.cas-ub.com/project/index.html
○UTR#50付属のデータファイルでは、EAVO-A方式とEAVO-B方式の二通りがあります。A方式とはすべての記号類に’U’を割り当てる方式、B方式は矢印、数学記号、罫線記号、括弧に’S’を割り当て、その他の記号を’U’とする方式です。どちらが良いか意見を求めています。
ピンバック: UTR#50: 文字の方向特性に関するカウンター提案の概要紹介 | 電子書籍、電子出版のCAS-UBブログ