「縦組みにおける英数字正立論」0.4版発行。第1章、第2章を全面改訂しました。

この数ヶ月の調査結果と、Twitterなどでの議論を踏まえて、「縦組みにおける英数字正立論」を改訂して0.4版としました。

修正箇所: 第1章、第2章は全面改訂。第5章は入れ替え(旧第5章の内容は、新第2章に反映していますが文章は全部書き換え)

第1章は序論に近いので、重要性は低いですが、第2章に結論を持ってきました。

2.1 日本語縦組みの3つの方式

日本語の縦組みの典型には、新聞方式、伝統的方式、現代方式の3種類があること。その例と特徴を示しています。

2.2 欧字の和字扱い・和欧混植・縦中横

日本語の縦組みにおける英数字の扱いの特徴は欧字の和字扱い・和欧混植・縦中横の3項目にあること。3項目の説明を示し、新聞方式、伝統的方式、現代方式との関係を示しています。

特に欧字の和字扱いと和欧混植は、英数字に対する相反する取り扱いです。英数字の文字コード側からみてこの取り扱いを決定する方法がないこと、これについて記述した標準仕様が従来存在しなかったことが、UTR#50議論の混迷の原因と思います。

2.3 マークアップの必要性

日本語の縦組みを指定するには、マークアップが必須であること、その理由を示しています。

2.4 SVOをデフォルトとするマークアップの薦め

MVOをデフォルトとするマークアップとSVOをデフォルトとするマークアップの方法について比較検討します。
その結果として、SVOをデフォルトとするマークアップの方が優れていることを示します。

●PDF版とEPUB3版を作成して、こちらから配布中です。

http://www.cas-ub.com/project/index.html#Free

ぜひご高覧、ご意見を賜りたく存じます。よろしくお願いします。

「縦組みにおける英数字正立論」はCAS-UBで作成しています。便利ですよ~

■ご案内

CASオンラインショップでCAS-UBのユーザー登録することで、誰でも30日間だけ無償でご利用いただくことができます。
CAS-UB評価ライセンス

XMDFからEPUBへの変換プログラム

アンテナハウスでは、XMDFからEPUBへの変換プログラムを開発しました。

本プログラムは、シャープの電子書籍XMDFの記述形式を変換元として、バッチ処理でEPUB3形式に変換するものです。
XMDFがXML形式であることを利用して、スタイルシートによる変換を行ないます。

プログラムの簡単な紹介はこちらにございます。
http://www.antenna.co.jp/epub/xmdftoepub.html

関心をお持ちの方にはテスト変換サービスを致しますので、cas-info@antenna.co.jpまでお問合せください。

CAS-SUPPORTのブログ 7月分をEPUB3にしました

CAS-SUPPORTのブログ 7月分をEPUB3にして、サンプルページに追加しました。

CAS-SUPPORTのブログ7月分(epub)

ブログはWordPressで書いています。これをEPUBにする手順は次のとおりです。

1.ブログ記事のエクスポート(XMLファイル化)
1)WordPressの管理者でログイン
2)WordPressのツールメニューのエクスポート機能を選択
3)7月分の記事をエクスポート

2.CAS-UBにインポート
1)CAS-UBで新しい出版物を作成
2)出版物の一覧で「編集」を選択して編集画面に遷移。そこで「ドラフト」を選択。
3)インポートファイルの形式でWordPressのXML形式(WXR形式)を選択
4)1.で作成したXMLファイルを選択してインポートする。
5)ブログ記事が正しくインポートされていることを確認する
6)記事をすべて選んで「主原稿」に移動する
7)記事の編集
(1)WordPressのエクスポートでは画像がリンクになり、画像を取り出すことができないため、画像を手動でダウンロードして、記事の中にアップロードする。
(2)ブログの記事を参照している箇所を、EPUBの記事の参照に変更する

3.内容を確認してEPUBを作成

CAS-UBはほかのツールよりも生産性が高いと思いますが、それでも、1.~3.までの処理に1時間30分程度かかりました。なんとか、もっと短時間でできるようにしたいものです。

■ご案内

CASオンラインショップでCAS-UBのユーザー登録することで、誰でも30日間だけ無償でご利用いただくことができます。
CAS-UB評価ライセンス

日本語文書の組版方法 JIS X4051 における縦組みの英数字の向き

日本語組版に関するJIS規格としてJIS X4051[*1]があります。「日本語組版処理の要件」(JLReq)の文字クラス[*2]はJIS X4051を元にしていますが、ベーシックラテンの文字についての考え方は、かなり異なっています。

JIS X4051では日本語組版に使う文字としてはJIS X0213の文字を対象としています。JIS X0201の文字は空白を除いて記載されていません。

ラテンアルファベットの大文字と小文字は、欧文用文字とされており、和字には含まれていません。
また、アラビア数字は、欧文用文字、連数字中の文字、単位記号中の文字(1~4)とされていますが、和字には含まれていません。

このように、JIS X4051ではラテンアルファベットやアラビア数字は、和字クラスには入らないのが、JLReqとの相違点です。

では、ラテンアルファベットやアラビア数字が縦書きで正立しないかというとそうではありません。

4.7和欧文混植処理

備考 和文と欧文を区別する方法は、処理系定義とする。

4.19 b)では縦書きの行中では、欧文の文字の向きを右回りに90°回転して欧文を横書きにし、a)に従う。

備考 縦書きの欧字または数字を和字として扱う場合は、ベタ組みとし、次のように配置する

とあり、JISを正立で表記した例が挙げられています。

すなわち、和欧混植処理では横倒しですが、ラテンアルファベットや数字を和字として扱うこともできて、そのときは正立になります。

このように、JIS X4051ではラテンアルファベットやアラビア数字は和字クラスには入れていないのですが、和字として扱うこともできるとしています。

念のために定義を確認してみますと次のように欧字も縦書きで使う全角形は和字として扱うことになります。

定義)
・和文
 和字で構成される文章であって欧文を含まないもの
・和字
 和文を構成する漢字、仮名、数字、約物およびその他の記号。縦書きの場合、全角の欧字を含む。
・欧文
 欧文用文字および欧文間隔で構成される文章であって、横書きとし、欧文ピッチ処理の対象となるもの。
・欧文用文字
 欧文を書き表すときに主な構成要素となる表音文字(欧字)、数字および記号(コンマ、ピリオド、コロン、セミコロンなど)。縦書きで用いる全角の欧字は、和字として扱う。

[*1] 日本語文書の組版方法 JIS X 4051:2004 平成16年3月20日改正
[*2] 「日本語組版処理の要件」に見る英数字の扱い

■ご案内

CASオンラインショップでCAS-UBのユーザー登録することで、誰でも30日間だけ無償でご利用いただくことができます。
CAS-UB評価ライセンス