電子書籍フォーマットポリシー第1次案への感想―市場の変化に備えるには

出版デジタル機構から16日「電子書籍フォーマットポリシー第1次案」が公開されましたので、ざっと読んでみました。

リンク:電子書籍フォーマットポリシー第1次案

最初に私の理解したところを整理しておきます。

1.方針概要

電子書籍の数を増やすことを最優先とする。

2.フィックス型とリフロー型

フィックス型を大量に作成して市場に投入し、市場ができるにつれてリフロー型の点数を増やす。

3.フィックス型フォーマット

本文画像を600dpi程度の高品質でスキャンして蓄積する。
まず、XMDFかドットブックを作成し、様子を見ながらEPUB3の作成に切り替える

4.リフロー型フォーマット

当初はXMDFとドットブックを作成する
納品されるファイルの仕様を厳密に規定する
中間交換フォーマットもアーカイブする

以上の1~4の方針となっています。以下は感想です。

この方針は基本的に同意できる部分が多いし、まず大勢が支持するものと思いますが、それだけに、現状ベースでありかなり保守的です。しかし、市場の変化に対応できないのではないかという不安があります。たとえば、強力な市場=販売チャネルが登場したときに、それに迅速に対応できないと、せっかくためたデジタルデータが宝の持ち腐れになります。具体的には、この方式を利用する出版社にとっての当面最大のリスクはAmazonに対応できない事態が生じる可能性でしょう。Amazonと機構でどういう話し合いがなされたかは知りませんが。そう思ってみますと、角川グループはAmazonと契約したと伝えられますが、機構の賛同出版社に入っていませんね。邪推しすぎかな?

出版デジタル機構(仮称)準備会・賛同出版社:239社(2012.3.13現在)

では、このようなリスクに備える対策はというと、電子書籍を作るためのデータをコンピュータで100%自動変換できる形で蓄えることでしょう。つまり新しい形式の電子書籍を作り出すときには変換を100%自動で行なうことができることを保証しなければなりません。この実現はそう簡単ではないですが、「完全な」自動変換ができれば低コスト・短時間で新しい形式にできます。もし、そうでないと1点毎に変換後の書籍を検品・校正する作業が発生することになり、この作業にコストと時間がかかり、二重投資かつ時間的なボトルネックとなります。

自動変換を妨げるものはいろいろあります。

まず、外字です。この点からドットブックでオリジナルコンテンツを作るのはあまり推奨できません。ドットブックはシフトJISのため表現できる文字数が不足しており、外字を画像で表しているケースが多いためです。XMDFは理論上はUnicodeを使えるはずですが、実際はシフトJISにすることが多いようです。シフトJISを使うときは外字を画像で表しますが、その文字のUnicodeのコードポイントをかならずどこかに保持しておく必要があります。このあたりの取り決めが必須です。

自動変換を妨げるものの2つめは構造です。本文の見出し、図表のキャプション、上付き文字、下付き文字、注など最低限の必要な項目を調べてこれらをきちんと構造化しておく必要があります。現在のXMDFやドットブックは、見栄え優先、すなわち、フォントの大きさなどで見出しを示すといったタグの使い方をしているものが多いのですが、こういうタグの使い方は変換の自動化にあたっての阻害要因になりますので禁止しなければなりません。タグ付けのガイドラインの整備と準拠が必須です。

既存のDTPデータもPDFデータは無論ですが、私が調べた範囲では、既存のリフロー型ドットブックとXMDFでさえもソースをほかの形式に自動変換することは困難です。すなわち再利用性があまり高くありません。完全自動化ができないと人手による処理加工作業、それにともない検品・校正が必要になり再利用するときに新たなコストと日数が加わります。今回、あらたにリフロー型ドットブックとXMDFを作るときはこうした事態を繰り返さないように相当な注意が必要です。EPUBも不用意につくると同じ問題が起きます。つまり、タグをつけたら再利用性があるというわけではないのです。

中間交換フォーマットをアーカイブするといっています。「中間交換フォーマットV1.1(2月13日版)仕様書をざっとみたところではまだ実用的に完成していないのではないかと思います。完成度を高めるには、もっと徹底的に使ってみる必要がありますし、オープンな変換実証実験の繰り返しが必要と思います。