いま、UnicodeでUTR#50という仕様が検討されていることは何回も書きました。
この仕様については、Forumでいろいろ議論がされています。論点がいろいろありますので、議論に参加するときりがないのですが、しかし、表題に書いたとおり、全角英数と半角英数の使い分けは日本語の文章を書いたり本を作る上で大変煩わしい問題です。
これは本を書く人だけではなくて詳細は割愛しますが、CAS-UBのようなサービスを開発する上でも大きな負荷になっています。
UTR#50が提案されたことで全角英数と半角英数の使いわけを解消するチャンスが来ているのも確かです。もし、UTR#50で全角文字正立、半角文字横倒しをデフォルトにされてしまうと、この煩わしさをなくすチャンスはほぼ永久になくなると思います。
ということで、この問題を何とかしたいと思っています。
UTR#50のエディターはEric MullerというAdobeの人物で、今朝は、UnicodeのForumでこんなことを言っています。
「DTP/Web users have taken advantage of the existence of the fullwidth characters, in the following way: they use the ASCII code points when they want a cl-27/sideways in vertical treatment, and they use the fullwidth code points when they want a cl-19/upright treatment. Tools such as Word and InDesign allow that usage, and I am pretty sure that a significant fraction of the users would complain if they were told “don’t use the fullwidth characters any longer, use styling instead to indicate if you want cl-27/sideways or cl-19/upright”」
(Eric Muller:http://www.unicode.org/forum/viewtopic.php?f=35&t=252 より引用)
簡単な訳:
「DTPとWebのユーザーは、次のように全角文字の利便を享受している:縦書きではASCIIのコードポイントを使って横倒しにして、全角のコードポイントを使って正立させている。WordやInDesignはこういう使い方を許しており、”もう全角文字は使わない、そして、横倒しと正立を示すにはスタイルを使いなさい”といったら多くのユーザーは不満をもつだろう」
でも・・・
全角文字と半角文字を文字コードで使いわけるのとスタイル指定で使い分けるのは論理的には等価です。しかし、実作業的には文字コードで使い分けるのは、混乱の元になります。マークアップしてスタイルで使い分けるほうが明確になりますし、また、文字コードはテキストに対するハードコードなので、同じテキストを横書きにすると破綻(アルファベットや数字の全角文字は横書きでは見にくい)してしまいます。スタイルを指定して使い分ける方が柔軟になるのです。
このことは、「ラテンアルファベットと数字を縦にするか、横にするか?UTR#50とCSSの関係」でも説明しました。
Mullerさんをうまく説得しないと・・・
Ellic→Ericです。
直しました。論敵にも敬意を払わないと・・・論敵がいなかったら人生がつまらない。
シフトJISの普及が1バイト2バイト混在を一般化させてしまったけれども、これはとっくに限界がきているので、全部マルチバイトの方が今後の発展につながると思います。過去の便利さばかり言っていても…