『PDFインフラストラクチャ解説』のPDFの構造機能、タグ付きPDFの説明を強化。タグ付きPDFは固定レイアウトEPUBにも通じる。

『PDFインフラストラクチャ解説』を0.38版に改訂しました。

下記で公開しています。

PDF版
EPUB版

【追記:2016/1/21】
2016年1月に本書発売となり、無償配布を終了させていただきました。(『PDFインフラストラクチャ解説』POD版とKDP版が揃い踏みとなりました
【追記:ここまで】

今回の改訂箇所は次の節です。

9-2 PDFにおける構造表現
9-3 タグ付きPDF
14-3 透明テキスト付きPDF(新設)
22-2 PDF/A ファミリー
22-3 PDF/A-1
22-4 PDF/A-2
22-5 PDF/A-3
22-6 PDF/Aの作り方
22-7 スキャン画像からPDF/Aを作成する(新設)

スキャン画像を透明テキスト付きPDF、タグ付きPDF、PDF/Aにするための関連知識の説明を大幅に見直し・強化しました。

PDFにはXMLとは異なる方式の構造化の仕組みが用意されています。その仕組みは構造要素という辞書をツリー構造にするのですが、ツリー構造の中にはコンテンツ本体は含まれていなくて、他の構造要素またはコンテンツ項目へのIDが入っています。コンテンツ本体では、必要な箇所をマークオペレータで囲み、必要な箇所にはIDをつけます。コンテンツと構造のツリーはお互いをIDで関係付けるという仕組みです。

タグ付きPDFは、PDFに用意されている構造化の仕組みを使って実現するXHTMLのようなものと考えたら良いでしょう。
標準の要素型が規定されています。この要素型は簡単なXHTMLをそのままあらわすことができます。要素型には属性を着けることができますが、これは標準レイアウトを指定しています。

tag-example-xhtml
図1 簡単なXHTML

tag-example-pdf
図2 タグ付きPDFの構造ツリーと表示コンテンツのリンク

この仕組みを使うと、タグ付きPDFを使って、マルチレンディションのEUPBに似通った電子書籍を実現できそうです。