「日本語組版における行配置の課題」(第1版)を配布開始

4月19日より「日本語組版における行配置の課題 ― 行送り方向の組版処理の問題点 ― 」(小林 敏著、アンテナハウス株式会社CAS電子出版、ISBN978-4-900552-07-4)の第1版を公開しました。本書は、表紙から奥付けまでCAS-UBで編集・制作されており、CAS-UBのPDFレイアウト機能をご確認いただくことができます。但し、本文中に文字サイズ、字詰めについて言及している箇所が多いためEPUBの見本としては適切ではありません。

次のページから無償でダウンロードしていただくことができます。
http://www.cas-ub.com/project/index.html(無償配布の出版物の項)

本書は日本語組版における行方向の配置についての解説と課題を挙げています。

日本語の文字は、文字進行方向にはべたで並べていくだけで適切な読みやすさになるようにデザインされています。一方で行の進行方向には適切な空きが必要です。この空きを行間と言いますが、適切な行間の設定は版面の大きさ、一行の文字数や文字の大きさによって変わります。

本書ではこの行間の空きの取り方について整理して解説しています。

行間を見出し、図版や表、注、脚注などまで考慮して設定するのは専門のオペレータにとっても難しい問題ですが、これをプログラムで自動化するのはさらに難しくなります。

しかし、WebやEPUBのようなリフローする内容を画面に読みやすく表示するには行間設定をプログラムで自動的に最適化することが必須です。このように考えますと本書の内容こそが今後の自動組版に課せられた課題といえます。

本書はCAS電子出版シリーズ第3弾として制作したものですが、本書は「W3C技術ノート 日本語処理の要件」の補足的な資料としてもご利用いただくことができます。

日本語組版に関心をもつ方の参考にしていただければ幸いです。

中間交換フォーマットについての情報の公開を望む

電子書籍交換フォーマット標準化会議の「電子書籍交換フォーマット(ebformat:イービーフォーマット)」が1.1版に改訂されていますので、このフォーマットの表現力を評価してみたいと思っています。

うまく使えるようであれば、電子書籍の変換ツールを作ったり、あるいは、CAS-UBで作った電子書籍を「電子書籍交換フォーマット」形式で保存しようと考えています。

現在の時点では、仕様書が公開されているだけです。しかしこの仕様書では、フォーマットを評価するには不十分です。

仕様書の記述を読むだけでは要素の内容モデル(テキストと下位要素、その出現性)やとりうる属性が理解できません。また、仕様書には矛盾する記述や暗黙の前提があると見られる記述が沢山あります。ところがサンプル・ファイルもないので内容モデルや矛盾を解きほぐす手がかりがありません。

内容モデルは、DTDあるいはスキーマで厳密に規定するものなので、上の疑問はDTDあるいはスキーマファイルが公開されればわかるはずです。

昨年度の報告書の中ではDTDまたはスキーマを作るということになっています。しかし、現時点ではまた、eif.dtdもeif.xsdも公開されていません。

作成した文書が内容モデルに正しく沿っているかどうかはバリデータで検証することができます。本年2月20日に行なわれた「電子書籍交換フォーマット普及促進会議成果発表会」では、平成23年度に検証ツールを開発し、バリデータを作ったという報告もあります。セミナーのQ&Aではバリデータを公開するという回答もあります。

しかし、いまのところバリデータも公開されていません。

このため、プロジェクトに関係していない第三者にとっては、①「電子書籍交換フォーマット」が実際どういうものなのか、②その表現力はどこまであるのか、③果たして実用に使えるものなのかどうか、ということを判断することができません。

「電子書籍交換フォーマット」の作成過程は、W3C、IDPF、Unicodeなどの海外のフォーラム型標準化団体の標準作成過程と比べるとあまりにも密室過ぎるような気がします。民間企業がコンソーシアムを作っているのに、制定過程はデジュール型の密室標準に近いというと言い過ぎかもしれませんが。

標準化ではさまざまな関係者の利害が対立するので、全員の意見がそのまま採用されることはありえません。さまざまな意見がでてきて、それにどう対応したか、という議論の過程が重要です。議論の過程において、当初見えなかった問題点も出てきますし、それを汲み込むことでよりよいものになるからです。また、当社のようなツールベンダにとっては、その議論の過程・制定過程で、使えるか、使えないか、対応するかどうか、の判断ができます。

民間企業が独自に行なっているものであれば、ブログでとやかく言うことでもないと思うのですが、平成22年度、平成23年度のプロジェクトはいづれも総務省から資金が出ているわけですし、経産省の「コンテンツ緊急電子化事業」でもこの成果を使おうとしているので、プロジェクト成果はパブリックに共有されるべきものと思います。

フォーマットを評価可能な情報を早期に公開して欲しいものです。具体的には次のとおりです。
1) eif.dtd, eif.xsdなどの文書型を定義するもの
2) サンプルファイル
3) 検証ツールまたはバリデータ

あとは、仕様書を公開レビューにかけて、疑問点を集めて改訂することも必要です。

自動組版の強化とデジタルファーストへの道程

「日本語組版処理の要件」が4月10日にプリントされた書籍として発行されました。この書籍の本文は、4月3日に公開されたWeb版(日本語版)と同等であり、Webコンテンツをほぼそのまま書籍化したデジタルファースト出版の事例になります。

デジタルファーストによる商業書籍出版においては、自動組版の技術が重要なポイントになると考えていますので、その観点で以下に少し説明をします。

ワークフローの概要はまえがきなどに述べられている通りで、本書のプリント版の本文すべてをAH Formatter V6による自動組版で制作しています。AH Formatterで日本語の書籍を制作して商業出版を行なった例は過去にも多々あります。しかし、大きなコンテンツの書籍をデジタルファーストで出版するのにAH Formatterを使用した事例としては初めてになります。

本書は図版の数が膨大であるという点で、DTPで制作するとしても相当作業量がかかるはずですが、これを著者グループが自動組版で行なったことで出版社の負担は非常に小さくなっているはずです。また、自動組版を使うことでWeb版の内容をフィックスしてから極めて短時間にプリント版を出すことができているという点、デジタルファーストからプリント版を制作するワークフローに自動組版を組み込むことの有効性を示すことができたと思います。

プリント版とWeb版では図版の精度が違っていたり、索引などWeb版にはない内容をプリント版では付け加えていますので、まったく同じコンテンツということでもないのですが、このあたりの詳細は、4月23日にJAGATで開催される「電子書籍と日本語組版『W3C技術ノート 日本語組版処理の要件』出版記念」セミナーでもプレゼンが予定されています。

テキストと図版が混在する文書で図版がページに入りきらない場合、図版の前で改ページしてしまうと、そのページのテキストの後ろ側に大きな空きスペースができます。Microsoft Wordなどで文書を編集する際も同じことが起きますので、経験している人は多いと思います。DTPでも同じですが、こうした空きをなくすために、対話型WYSIWYG編集ソフトをつかって著者やオペレータが画面を見ながら図版とテキストの位置を調整するのが普通です。このため図版の多い書籍の組版はテキスト主体の内容の組版と比べると大変です。

AH Formatter V6では、この図版位置調整の操作をプログラムで自動的に行なう機能を備えています。これによって、今回「日本語組版処理の要件」のプリント版制作では調整の手作業は大幅に減っています。

AH Formatter V6の自動図版位置調整機能は、米国内国歳入庁の案件(下記ケーススタディ参照)のために間に合うように実装したものですが、「日本語組版処理の要件」でも有効性を発揮しました。

但し、「日本語組版処理の要件」は横組みで脚注がない一段組みという比較的シンプルなページレイアウトの書籍です。これが縦組みや大量の脚注がある書籍は図版の位置調整はさらに難しくなります。現在、CAS-UBでさらに様々な書籍を制作しながら図版の位置を自動的に調整する方法の改良をつづけています。

また、図版の多い2段組文書としては論文があります。米国内国歳入庁の帳票は多段組みなのですが、比較的シンプルでした。これに対して、複雑な論文への応用という点では、JATS(Journal Article Tag Suite)で記述された論文の自動組版があります。アンテナハウスでは、フルJATSで記述された論文の組版のためのスタイルシートを開発しましたので、これについては、5月24日のJATS解説セミナー(JATSによる日本語学術論文の標準化と自動組版)にて公開し、オープンソースとして配布する予定です。

こうしたことを通じて、さまざまなレイアウト・タイプのプリント版を自動組版で簡単に制作できるようにすることで、デジタルファーストの普及への道を切り拓きたいと考えています。

*「電子書籍と日本語組版『W3C技術ノート 日本語組版処理の要件』出版記念」セミナー
*JATSによる日本語学術論文の標準化と自動組版セミナー
*日本語組版処理の要件(日本語版)W3C 技術ノート 2012年4月3日
*「W3C技術ノート日本語組版処理の要件 美しく読みやすい文字組版の基本ルール」W3C日本語組版タスクフォース 編
*IRS:アメリカ合衆国財務省:内国歳入庁(PDF)
*時代を乗り越える日本語組版
*Page2012終了。いま、電子書籍制作のワークフロー論議をまとめると…
*NLM DTDからJournal Article Tag Suiteへの進展:これまでの経過整理

IDPFのEPUBサンプルページ

IDPFにEPUBのサンプルページができていました。

http://code.google.com/p/epub-samples/

機能別にサンプルを用意するようです。

機能別

最近話題のEPUB3固定フォーマットについては4種類のサンプルがあります。

1.XHTMLベース
2.SVGベース
3.Mixed reflowable/fixed (2種類)

(1) XHTMLベースのサンプルは表紙画像を含む9枚の画像(1200×1577ピクセル、300dpiのJPEG)を1枚ずつXHTMLのimg要素で外部オブジェクトとして指定したもの。

(2) SVGベースは、1ページづつの内容をSVGであらわしてXHTMLにそのSVGを埋め込んだものです。Adobe のDigital Editions 1.8.1はSVGの埋め込みに対応していないためか、死んでしまいます。iBooksやFireFoxのプラグインEPUBリーダではSVGのサイズが大きすぎてうまく表示できません。

ちなみにAdobe Digital Editionsは正式にはSVG未対応のようですが、img要素に外部オブジェクトとして指定すると表示できる場合が多くみられます。しかし、SVGをXHTMLに埋め込んだり、spineで直接SVGを指定するとリーダが死んでしまいます。

(3) Mixed reflowable/Fixed は2種類のサンプルが提供されています。
a. ひとつは、テキストと画像の通常のリフローページをXHTMLであらわしたもの(説明テキスト)と全頁のランドスケープ(横置き)画像をimgの外部オブジェクトとして指定したものを交互に表示するもの。後者に対して最近仕様がきまった固定レイアウトのプロパティを指定してあるのがミソのようです。

b. もうひとつは同じ内容なのですが、交互に表示する代わりに全頁ランドスケープの画像の上に、JavaScriptで説明テキストを重ねるようにしたものです。iBooksやFireFoxのプラグインEPUBリーダでは重なります、Adobe のDigital Editions 1.8.1では別のページになります。

固定フォーマットのサンプル4点についてだけいうならば、iBooks、Digital Edition、FireFoxのプラグインEPUBリーダではいづれも完全には満足に読めません。

作り方のサンプルとしては、どのリーダでも満足に読むことができる固定フォーマットのサンプルが欲しいものです。それともリーダのレベルが低すぎ?

サンプルがあると大変参考になりますので、さらに充実して欲しいものです。それにしても、IDPFは、もう少し、どのリーダでもうまく表示できるサンプルを出すほうが良いのではないでしょうか?それとも、リーダ開発者に全部をうまく表示できるようにして欲しいというのが狙いなのでしょうか?

「日本語組版処理の要件」W3C 技術ノート 2012年4月3日公開

「日本語組版処理の要件」の第2版が正式に公開されました。昨年11月に作業ドラフトとして公開されたものに対するコメント・意見を反映して正式版としたものです。

日本語組版処理の要件(日本語版)
W3C 技術ノート 2012年4月3日

第1版は2009年4月に公開され、欧米の専門家の間で高い評価を得ました。そして、CSS3の仕様に日本語組版の機能を盛り込む上で大きな貢献を果たしました。

第2版は、第1版で盛り込むことができなかった「第4章見出し・注・図版・表・段落の配置処理」を追加したもので、第2版をもって完結となります。

W3CのWebページで公開されているのはHTML版ですが、第2版の公開にあわせて4月10日にプリント版が東京電機大学出版局から発売になります。アマゾンで予約の受付が始まっています。

アマゾンの書籍案内ページ

このプロジェクトは日本語組版をプリントの世界からWebや電子書籍にまで広げていくためには、スタイルシートの仕様に日本語組版の指定機能を盛り込んでいく必要があり、そのためには、W3CのCSS(Cascading Style Sheets)やXSL-FOスタイルシートのワーキング・グループに日本語組版について理解してもらうための英文資料を用意する必要がある、というところから始まったものです。

プロジェクトが始まったのは、2006年の春ですので、ちょうど満6年かけて完成したことになります。長期間にわたり作業を続けてこられたタスクフォース・メンバーに敬意を表したいと思います。

CAS-UBは、この成果をソリューションとして実現することを目標の一つとしています。既に、CAS-UBのPDF生成のV2レイアウト指定で「日本語組版処理の要件」に沿ったページ組版を自動的に行なうような機能を組み込んでいます。しかし、まだ完全とはいい難いので今後もっと磨きをかけていく予定です。

○印刷技術協会において出版記念セミナーも開催予定です。
電子書籍と日本語組版
「W3C技術ノート 日本語組版処理の要件」出版記念

○関連Webページ
日本語組版処理の要件を作ったJapanese Layout Task Forceのホームページ:http://www.w3.org/2007/02/japanese-layout/