CSS3のエディターズ・ドラフト
CSS3 Writing Modesの新しいEditor’s Draftでは、UTR#50を利用して縦組みのときの文字の挙動を指定しようとしているようです。
CSS Writing Modes Module Level 3 Editor’s Draft 5 January 2012([[http://dev.w3.org/csswg/css3-writing-modes/#vertical-typesetting-details]])
次は、http://dev.w3.org/csswg/css3-writing-modes/#vertical-typesetting-detailsの抄訳です((この文章はエディターズ・ドラフトというものであって、CSS3の正式なワーキング・ドラフトではありませんので注意してください。))。これを読むとCSS3の新しい草稿ではUTR#50の文字のスコープをUnicodeの全域に広げようとしているようです。そしてそのために文字のカテゴリーを少し詳しく定義しなおすことを試みています。
1月5日時点の定義概要
1.URT#50と次の規則により縦組みの時の文字の挙動を5つのクラスのどれかに分ける。
なお、‘upright-right’と‘upright’は、CSS Writeing Modeのtext-orientation特性で指定する値である。
- 直立upright (U) ‘upright-right’ と ‘upright’ 書記指定時で直立する
- 横倒しsideways (Sv) ‘upright-right’ と ‘upright’ 書記指定時で横倒し (時計回りに90度回転) (★SvとSBの違いが分かりにくい)
- 非ネイティブ non-native (Sh) ‘upright-right’ 書記指定時は横倒し、‘upright’ 書記指定時に直立
- 括弧brackets (SB) ‘upright-right’ と‘upright’ 書記指定時にともに横倒し。しかし、縦組みをサポートするOpenTypeフォントが直立の異形グリフをもつので、縦組みフォント設定オンで直立する。
- 変形transforms (T) 縦組みと横組みでグリフの形が大幅に変わるもの。‘upright-right’と‘upright’ 書記方向で直立するが、正しい組版では波形グリフを必要とする。
SvとShは、UTR#50執筆時ではSとなっている。‘upright’ 指定時の挙動の違いで分割した。
Svは、Sカテゴリーの次の文字からなる:
- 回転する縦組み言語に属する文字 (e.g. Mongolian)
- 空白 (Zs), 接続文字 (Pc), ダーシ (Pd) あるいは括弧のような句読文字 (Ps, Pe, Pi, Pf)(★←SBに入っていたのではないか?)
- Box Drawing、Block Element区域の文字
その他のS文字はShになる。
2.Unicode文字の分類は次のようになるだろう。(以下のa, b, cの分類はUTR#50によるものだと思う。英語の文章はそうは読めないけれども。)
a. 括弧類brackets (SB)には次が入る
- 東アジアのすべて全角(F) と広い(W) 括弧句読文字 (Ps, Pe, Pi, Pf)
b. 横倒しsideways (S)には次が入る
- Currency Symbols (Sc), Math Symbols (Sm), and Modifier Symbols (Sk)、Dashes (Pd)(全角のハイフンマイナスを除く)
- 東アジアの半角East Asian Halfwidth (H) 文字、上付き、下付き、 and non-Indic fractions from the Other Number (No) category.
- Aegean numbers and North Indic fractions from the Other Number (No) category.
- All characters from the Box Drawing and Block Elements blocks
- All directional arrows: the Arrows block, the Pointing hand symbols from the Miscellaneous Symbols block, any arrow from the Miscellaneous Symbols and Arrows block, any Dingbat arrows from the Dingbats block
- Other Symbols (So) from the Latin-1 Supplement and Letterlike Symbols blocks.
- Other Symbols (So) from the Aegean Numbers, Ancient Symbols, Common Indic Number Forms blocks
- Characters belonging to any horizontal-only or rotating vertical scripts.
c. 直立upright (U)には次が入る
- すべての東アジアの全角文字 (F) と広い (W) 文字でSBに割り当てられているものを除く
- Other Numbers (No) and Other Symbols (So) except those assigned to S
All letters (L*), marks (M*), and numbers (N*) belonging to any translating vertical scripts.
「以下のa, b, cの分類はUTR#50によるものだと思う」は、誤りです。
この分類は、UTR#50側ではなくてCSS Writing Modes側で、UTR#50の話がでてくる前にされてるもの(前のWDにあります)がもとです:
http://www.w3.org/TR/2011/WD-css3-writing-modes-20110901/
UTR#50の前にCSS側で決めたのは、(text-orientation:upright-rightのとき)正立・横倒し両方ありえる文字はほとんど横倒しまたはフォント依存(縦書き字形があるならそれを使う、なければ横倒し)となっていたのですが、UTR#50では、フォント依存は排除されて、正立が多くなっています。