PDFのアクセシビリティ。ワンソースマルチユースのもう一つの応用。

PDFへのアクセシビリティとはPDFの形式で表された情報や知識の利用しやすさである。

1.PDF形式で表される情報の主な種類

・PDFは紙への印刷物をデジタル化したものであるが、最近は、印刷物ではない3D画像や動画を埋め込んだり添付することもできるようになっている。
・印刷物として表された知識は文字(テキスト)が中心であるが、写真や絵画のようにテキストで表せないものもある。
・テキストの一部にイラストのような図版、写真、表を含むことも多い。
・書物のような冊子を表すPDFについては、目次・索引・リンクなど必要な情報を探し、そこにたどり着くための仕組みもある。
・PDFはJavaScriptプログラムを使ってアクションを設定できる。

2.PDFのアクセシビリティについて定めた規格

PDFのアクセシビリティについて定めた規格には、PDF/UAとWCAGをベースとする規格の二つがある。

(1) PDF/UA(ISO 14289-1:2014)
ISO 32000-1:2008 をベースとして、アクセシブルなPDFのための要求項目を決めている。2008年に初版、2012年に改訂、2014年に再び改訂された。主な内容は、次の通り。
・ファイルの識別方法(5節)
・要求項目まとめ(6節)
・ファイル形式への要求項目(7節)
・準拠リーダーへの要求項目(8節)
・準拠支援技術への要求項目(9節)

7節のファイル形式への要求項目が中心である。1.で簡単に紹介したようにPDF中には多様な情報を含んでおり、要求項目は多岐に渡る。見出しだけを挙げると次のとおりである。
・一般(7.1)
・テキスト(7.2)
・グラフィックス(7.3)
・見出し(7.4)
・表(7.5)
・箇条書き(7.6)
・数式(7.7)
・ページのヘッダー・フッター(7.8)
・注釈と参照(7.9)
・オプショナル・コンテント(7.10)
・埋め込みファイル(7.11)
・アーティクル・スレッド(7.12)
・電子署名(7.13)
・非対話フォーム(7.14)
・XFA(7.15)
・セキュリティ(7.16)
・ナビゲーション(7.17)
・注釈(7.18)
・アクション(7.19)
・XObject(7.20)
・フォント(7.21)

PDF/UAは、まずタグ付きPDFでなければならない。特に本文については、7.2から7.9できめ細かくタグを付けることが要求されている。例えば、見出しはH1タグをルートとし、H2H3…と順を追って階層化した見出しタグを付けなければならない。図にはFigureタグを付け、図のキャプションにはCaptionタグを付けなければならない。

(2) Web Content Accessibility Guidelines (WCAG) 2.0(ISO/IEC 40500:2012)
  日本語版JIS X8341-3:2010
Web Content Accessibility Guidelines (WCAG) 2.0(原文)
WCAG 2.0 ガイドライン(日本語訳)

Webコンテンツ一般のガイドラインであり、PDFもその一種として対象としている。WCAG2.0は高レベル(抽象度の高い)ガイドである。

具体的なテクニック解説文としてPDFの作り方に関する説明がある。
Techniques for WCAG 2.0(原文)
WCAG 2.0 実装方法集(日本語訳)
PDF Techniques for WCAG 2.0(原文)

「WCAG 2.0 実装方法集」は、準拠基準ではなく実装の解説である。

例えば、文書をスキャンして画像化したPDFはPDF/UA準拠ではない。PDF/UA準拠にするには機械可読としてタグを付ける。WCAG 2.0 実装方法集にはその例が記載されている、という関係である。

3.ワンソースマルチユースの応用としてのアクセシブルPDF生成

全体として、PDF仕様の複雑さと、アクセシビリティ要求の難しさを考慮すると、アクセシブルレベルの高いPDFを手作業で制作するのはかなり難易度が高い。PDF/UA準拠にするために、できあがったPDFに後から手作業でタグ追加するのは効率を考えると良い方法といえない。オーサリングの段階で文書を構造化しておき、タグをPDFに自動的に埋め込む必要がある。

アクセシブルなPDFを自動的に作れないと製作コストが許容できないほど高くなってしまうだろう。このようにコンテンツから印刷用PDFと共にアクセシブルなPDFを自動生成することは、ワンソースマルチユースのもう一つの応用になるであろう。

[1] アクセシビリティとは(草稿)
[2] アクセシビリティという言葉がどのように使われているか
[3] PDFのアクセシビリティ。ワンソースマルチユースのもう一つの応用。
[4] EPUB3.0のアクセシビリティを高めるためのガイドライン