中間交換フォーマットについての情報の公開を望む

電子書籍交換フォーマット標準化会議の「電子書籍交換フォーマット(ebformat:イービーフォーマット)」が1.1版に改訂されていますので、このフォーマットの表現力を評価してみたいと思っています。

うまく使えるようであれば、電子書籍の変換ツールを作ったり、あるいは、CAS-UBで作った電子書籍を「電子書籍交換フォーマット」形式で保存しようと考えています。

現在の時点では、仕様書が公開されているだけです。しかしこの仕様書では、フォーマットを評価するには不十分です。

仕様書の記述を読むだけでは要素の内容モデル(テキストと下位要素、その出現性)やとりうる属性が理解できません。また、仕様書には矛盾する記述や暗黙の前提があると見られる記述が沢山あります。ところがサンプル・ファイルもないので内容モデルや矛盾を解きほぐす手がかりがありません。

内容モデルは、DTDあるいはスキーマで厳密に規定するものなので、上の疑問はDTDあるいはスキーマファイルが公開されればわかるはずです。

昨年度の報告書の中ではDTDまたはスキーマを作るということになっています。しかし、現時点ではまた、eif.dtdもeif.xsdも公開されていません。

作成した文書が内容モデルに正しく沿っているかどうかはバリデータで検証することができます。本年2月20日に行なわれた「電子書籍交換フォーマット普及促進会議成果発表会」では、平成23年度に検証ツールを開発し、バリデータを作ったという報告もあります。セミナーのQ&Aではバリデータを公開するという回答もあります。

しかし、いまのところバリデータも公開されていません。

このため、プロジェクトに関係していない第三者にとっては、①「電子書籍交換フォーマット」が実際どういうものなのか、②その表現力はどこまであるのか、③果たして実用に使えるものなのかどうか、ということを判断することができません。

「電子書籍交換フォーマット」の作成過程は、W3C、IDPF、Unicodeなどの海外のフォーラム型標準化団体の標準作成過程と比べるとあまりにも密室過ぎるような気がします。民間企業がコンソーシアムを作っているのに、制定過程はデジュール型の密室標準に近いというと言い過ぎかもしれませんが。

標準化ではさまざまな関係者の利害が対立するので、全員の意見がそのまま採用されることはありえません。さまざまな意見がでてきて、それにどう対応したか、という議論の過程が重要です。議論の過程において、当初見えなかった問題点も出てきますし、それを汲み込むことでよりよいものになるからです。また、当社のようなツールベンダにとっては、その議論の過程・制定過程で、使えるか、使えないか、対応するかどうか、の判断ができます。

民間企業が独自に行なっているものであれば、ブログでとやかく言うことでもないと思うのですが、平成22年度、平成23年度のプロジェクトはいづれも総務省から資金が出ているわけですし、経産省の「コンテンツ緊急電子化事業」でもこの成果を使おうとしているので、プロジェクト成果はパブリックに共有されるべきものと思います。

フォーマットを評価可能な情報を早期に公開して欲しいものです。具体的には次のとおりです。
1) eif.dtd, eif.xsdなどの文書型を定義するもの
2) サンプルファイル
3) 検証ツールまたはバリデータ

あとは、仕様書を公開レビューにかけて、疑問点を集めて改訂することも必要です。