CAS-UBを利用してPDFと電子書籍の制作をしてみたい方向けに。トレーニングセミナー再開

CAS-UBトレーニングセミナー。しばらく中止していましたが、3月から新企画で再開します。

以前は、EPUBを制作を中心にCAS-UBの操作方法を説明していました。

新しいセミナーでは、

1.PDFとEPUBの両方を対象にします。

EPUB作成については市場一巡したと思われることから、PDFを作ることを追加しています。
プリントオンデマンドでの出版環境が整っていることもあり、最近、PDFが注目を集めています。

2.実践的に成果物を作ります。

前回は、説明が中心でした。今回は、参加者の方に実際にCAS-UBを操作していただきます。

今、CAS-UBをお使いになっている方や、あるいは、これまでに試用されたかたで使い方などで継続使用を断念された方も、改めてご参加いただければと存じます。

ご案内と参加申し込みは次のWebページをご覧ください。

セミナープログラム

『本をコンピュータで作る』のは、いま、どこまでできる? (5) 『PDFインフラストラクチャ解説』のプリントオンデマンド制作と販売

最初、PODで本にしてみたところ、PDFと紙での版面の印象の違いが大きいのに驚いた。本の内容をPDFにして画面で読むのと、同じPDFから印刷・製本して、本として読むのを実際に試してみると想像以上に印象が違う。どうやらPDFと紙の本は全く別物である。

POD版の試作とレイアウト改良

そこで、『PDFインフラストラクチャ解説』の制作中、PODで実際に本を作ってみて、基本版面や表などのレイアウト設定値をより読み易くなるように変更を重ねた。変更したレイアウト設定値を、CAS-UBの「PDFレイアウト設定」のデフォルト値として反映する。こうすれば、新しく本を作るときに、同じことを繰り返さなくて済む。

PODを3回試作した。
・初回のPOD試作 2013年2月 0.24版 256ページ (詳しくは
・第2回POD試作 2013年7月 0.33版 258ページ (詳しくは
・第3回POD試作 2014年3月 0.39版 268ページ (詳しくは

PODで作った本を外部の人などに評価してもらい、基本版面、見出しの文字サイズ・配置・番号の付け方、表の罫線の引き方・セルの空き・本文と表の文字の大きさの関係などを改良した。

基本版面

日本語組版におけるページの文字レイアウトは基本版面で設定する[1]。本書は、B5判型、横組・一段、文字サイズは10ポイント(pt)と決めていた。そのとき、行送り(文字サイズと行間を足した値)、字詰め数(一行の文字数)と行数(一頁の行数)を変更できる。この三つの設定を変更するだけでもページの印象はかなり変わる。

POD 判型 文字サイズ 行送り 字詰め数 行数
0.24版 B5

10pt 19pt 38 30
0.33版 B5 10pt 18pt 39 33
0.39版 B5 10pt 17pt 39 36
リリース版 B5 10pt 16.8pt 39 35

文字だけのページで四つの版面を比較してみる。
v024-1
図1 0.23版
v033-1
図2 0.33版
v039-1
図3 0.39版
v100-1
図4 リリース版

0.24版は行間の空きが広く、また上下の余白が広い。ページに余裕を感じる。
0.33版と0.39版を比較すると0.39版は印刷領域が上下に広く、上下余白がやや余裕がない印象がある。
リリース版は行間を少し詰めて、1行減らしたので上下の余裕を感じる。35行にするか、36行にするかは迷うところである。

表の組版

表のスタイルは当初は、すべてのセルの周囲に罫線を引き、ヘッダ行に網掛けする(レポートスタイル)としたが、最終的にはJIS X4151に定められているスタイルとした。CAS-UBでは、PDF生成時に、どちらかのスタイルを選択できる。また、表のセル内文字の大きさ、セル内のテキスト配置、テキストと罫線の間の空きについてもバージョンを重ねる毎に調整した。

v024-2
図5 0.24版の表

v100-2
図6 リリース版の表

図の大きさ

本書には図版が多数あるが、大きさは一律ではない。PDFを出力するとき、図の大きさはマークアップで指定できる。次は、図の幅を版面の60%にした例である(図8 リリース版)。

[[[:fig =コードポイント・字体・字形
{{:width=60% Unification-JIS.png | Unification-JIS.png}}
]]]

図のキャプションの位置も上と下を選択できる。リリース版では、図のキャプションは図の下に配置することとした。ちなみに、市販の書籍でもキャプションを図を下に置くことが多い。
v024-3
図7 0.24版の図

v100-3
図8 リリース版の図

PODのためのPDF仕様

PODのためのPDFは、アマゾンPOD仕様をベースとしている。

・PDFバージョンは1.3(透明を使えない)
・CAS-UBではPDF/X-1a:2001を指定する(PDF/X-1a:2001はPDF 1.3ベース)
・塗り足し(判型のサイズの外側に3mm)
・判型は新書~A4まで
・頁数は24~746
・ページには所定の余白が必要

POD用PDFとオンライン配布用PDFの比較

オンラインで読むためのPDFと、PODに使うためのPDFは別々に作成する必要がある。そこで、CAS-UBに、オンライン閲覧用PDF設定から、PODに使うPDF設定への変更メニューを追加した。次の点に注意が必要である。

・POD用PDFは周囲に3mmの余白が必要である。
・PDF/X-1aでは、印刷範囲(BleedBox)に注釈を置けない。
・PDFではリンクを注釈で扱うので、POD用PDFには次のようなリンクが出せない。
・目次から本文へのリンク、索引語から本文へのリンク、本部の参照リンクなど。
・POD用PDF(PDF/x-1a)では画像のカラー表現をCMYKに変換する
PODPDF-setting
図9 CAS-UB POD設定

POD版の本の販売

現在、PODで本を作る業者に依頼すれば、どこでも少部数でも製本した本を作れる。これまでにもCAS-UBで制作したレポート類を数冊、POD業者に外注して印刷・製本した実績がある。

こうして作成した本は、自社の直販と、アマゾンのe託を使って販売していた。電子版はインターネットでダウンロード販売できる。これに対して、紙の本は梱包して物流に乗せる必要がある。このため、低価格の書籍を、直接販売するのは手間とコスト面で難しい点がある。これまで出した本は、比較的高価格である。

もう少し割安になる流通手段を期待していたところ、2015年終わりにインプレスR&D社がPOD取次を始めたので、この機会に契約してPOD出版で販売することとした。

次の表はアマゾンのe託とPOD取次を比較したものであるが、e託と比べて、POD取次方式は各段に効率的である。

取り扱い POD製作 取り扱い費用 在庫負担
e託 街の業者 年会費9,000円。定価の40% 在庫負担あり。アマゾンの倉庫に納品するコストもかかる
POD取次 アマゾンが印刷製本 定価の38% PDFで取次に渡すので、在庫負担と納品コスト負担なし

e託は、常にアマゾンの倉庫の在庫をチェックして在庫がなくなったら倉庫に納める必要がある点、不便であり、コストも高い。POD取次ではPDF納品となるのがありがたい。

KPD用の書籍制作と販売

CAS-UBでは出版物の原稿を一回制作すれば、ワンボタンでEPUB、Kindle mobi形式にできる。Kindle mobi形式の販売はアマゾンKindle用のみであるが、EPUBにすればアマゾン以外の電子書店で販売できる。但し、取次を使わないのであれば個人出版を受け付けるストアのみで販売することになる。

KDPの方は、既にいろいろな本をKDPで販売していたので特段新しいことはなくスムーズに出版手続きを行えた。

PODとKDPの発売時期をできるだけ揃えたかったので、KDP登録作業は1週間後に行った。
無料配布版があることがひっかかってしまったが、無償版の配布を終了して翌日にはリリースとなった。POD版の方が発売まで予想外に日数がかかった。

販売促進

PODとKDPを使えば、誰でも、低コストで本を出版できる。大きな部数で印刷・製本して在庫を持たなくて済むのは助かる。しかし、出版したら売らなければならない。

出版社から出版される場合は、取次から書店に配本される。本自体が宣伝材料になる。しかし、個人で本を出版したら、まず、その存在を知ってもらわなければならない。存在を知られないかぎり出版していないのと同じである。

『PDFインフラストラクチャ解説』については、本を制作する段階からfacebookグループを作って参加者を募集してきた。しかし、トピックが一般大衆向けではないためか、参加者はまだ少ない。

PDFinterest facebook グループ

本を紹介するために簡単なWebページを作った。これだけでは不十分である。

『PDFインフラストラクチャ解説』Webページ

販促活動の一環として、2月16日に出版記念講演会を開催した。

『PDFインフラストラクチャ解説』出版記念 特別講演会のお知らせ

販売状況

PODで少部数の出版ができるといっても、ビジネスとして成立するかどうかは別である。まだ数字をまとめる段階ではないが、簡単にレポートする。

POD版の実績は、まだ不明である。

KDPでは、Kindle独占(セレクト)の選択ができる。現在のところ、セレクトとして登録・販売している。セレクトにするとロイヤリティ70%である。さらにアマゾンのプライム会員は毎月1冊を無料で読めるが、KDPセレクトで販売している本がその対象になるようだ。

多い日は1日500頁(KENP)以上読まれている。どうも、休日に読まれることが多いようなのは興味深い。KDPの販売部数に比べて、読まれるページ数がだんだん増えているようだ。これは、本の単価が高いことが原因かもしれない。

20160222
図9 販売部数(上)とプライムで読まれたKENPページ数(下)

現在までの実績は27部(KDP)であり、ロイヤリティは2万円強。KENPは、読まれたページ数を恐らく端末の差を調整した値のようだ。これがどのように金額に換算されるかは不明である。

いづれにせよ、単独のプロジェクトとして収支を計算すれば、制作・販売コストの回収はともなく、人件費の回収ができるかどうかはまだ分からない。長く売れれば、意外に売上が増えるかもしれない。

[1] 『日本語組版処理の要件(用語集)』では、組方向、段数、文字サイズ、字詰め数(文字数/一行)、行数、行間と段間で指定する。
[2] 『本をコンピュータで作る』のは、いま、どこまでできる?
[3] 『本をコンピュータで作る』のは、いま、どこまでできる? (2)紙の本と電子の本をワンソースで作りたい
[4] 『本をコンピュータで作る』のは、いま、どこまでできる? (3) 電子テキストは印刷ではなく、音声の暗喩と見る方が良い
[5] 『本をコンピュータで作る』のは、いま、どこまでできる? (4) 『PDFインフラストラクチャ解説』の実践例より
[6] プリントオンデマンドの本を作る デジタル書籍制作Webサービス CAS-UB

『本をコンピュータで作る』のは、いま、どこまでできる? (4) 『PDFインフラストラクチャ解説』の実践例より

はじめに

『PDFインフラストラクチャ解説』は、書籍編集制作システムCAS-UBによる制作と出版のケーススタディである。CAS-UBを使って、本格的な本を書き、プリントオンデマンド(POD)と電子書籍(KDP)で出版した。この経験を数回にわたり報告したい。

『PDFインフラストラクチャ解説』の紹介Webページ

CAS-UBはブラウザを使って原稿を執筆・編集し、原稿ができたらワンボタンでPDFとEPUB形式の本を作る仕組みである。2010年から開発を始めた。

CAS-UBの紹介Webページ

2011年の末頃からシステムの開発の一環として本格的な本の執筆を始めた。自分で実践することにより、多くのことを学んだ。もちろんその多くはCAS-UBの開発に反映している。

『PDFインフラストラクチャ解説』のPOD出版

2015年を振り返ると、EPUBによる電子書籍の話題が一段落した一方、PODによるセルフ出版が注目を集めた年であった。但し、POD本によるセルフ出版は、いまのところ小説やSFなど娯楽系の本が多いようである。

『PDFインフラストラクチャ解説』は娯楽系の本ではない。かといってエンジニアを対象とする硬い専門書というわけでもない。いわば、PDFに関する教養書であり、文字やデジタルの紙としてのPDFにまつわる技術的な内容をできるだけ判りやすく説明することを目指している。内容の性格上、横組で、図版や表が多い。図版は、行中のインラインのイメージと、ブロック配置のイメージで本文中に画像ファイルとして150個以上ある。表はCAS-UBでは画像ではなく、HTMLと同じように表(table要素)でマークアップしている。

紙版はB5判、268頁(表紙別)で、定価は2,698円(消費税込み)である。アマゾンで本を買う立場から見れば、通常のペーパーバックと変わらない。アマゾン・プライムで注文すれば翌日には配達される。

電子版はKindle Direct Publishing(KDP)で販売中である。価格は1,250円(消費税込み)と紙版と比べて大幅に安く設定した。紙の本は、やはり印刷・製本や物流の原価が高いので、原価積み上げ方式で価格を決める限り、電子版より高くならざるを得ない。

しかし、紙版を実際に手にもってみると、PDFで同じ内容を画面で見るのと比べ各段に読み易い。2010年頃から数年、本の出版は紙から電子へ変わるという予想が増えた。しかし、ここに来て紙への回帰が始まっているともいわれる[1]。PODで紙の本を手にしてみると、紙の良さを実感できる。やや陳腐だが、紙のすごさを見直しているところである。

PDF-infrustructure

本書の執筆・制作経過

原稿制作過程を簡単に説明する。

ブログの時代の原稿

2005年10月から2008年7月まで、「PDF千夜一夜」というPDFの技術周りの話題を中心とするブログを1000日間連続で書いた。ブログを継続することで多くの読者を集めることができるだろうと期待したのである。当初の狙い通り継続は成功であった。もうブログを終了して7年以上経つが、いまでも、「読んだよ」と言っていただける。読者に記憶に残る印象をもっていただけたのは継続によるものだろう。

ブログの記事の一覧表はこちらにある。毎日完結した話題ではないが、1日1ファイルとすると1000件のファイルがある。

PDF千夜一夜 全記事一覧

本書の内容の多くは、ブログの記事から選択して編集した。ブログを書いていたときは、内容を本にすることを想定してはいなかった。ブログの記事は本の構成を考えて書いたわけではないので、トピック(テーマ)がかなり乱雑に並んでいる。

本のアウトライン

ブログの記事を本にする整理を始めたのは2011年暮れである。本にするにあたり、ブログの記事をテーマ別に分類整理した。テーマを元に、本の目次でいうと章と節にあたる大雑把なアウトラインを作った。アウトラインをCAS-UBの構成編集画面で、章や節のタイトルとした。

各節の記事内容をCAS-UBの編集画面にコピー&ペーストした。ブログの記事の中で使ったのは3割以下であろう。ブログは「です・ます」文体であったので、「である」文体に変更した。

そして、2012年の1月に最初のバージョンを公開した。当時はPDFの自動組版によるレイアウトが十分成熟しておらず、最初はEPUB版のみであった。PDF版を公開したのは、1年後の2013年2月である。2015年12月まで、随時、完成途中のPDFとEPUB版を無償でダウンロード提供した。無償版は2015年12月が最終版である[2]

  • 2005年10月~2008年7月まで「PDF千夜一夜」ブログ
  • 2011年末~2012年1月 アウトラインを決めて記事を整理
  • 2012年1月EPUB版を初公開ダウンロード配布
  • 2013年2月からEPUB版、PDF版を同時配布
  • 2015年12月の0.55版まで随時更新(無償ダウンロードは2016年1月15日に終了しました)

CAS-UBで記事を追加

2013年から2015年までの間に、不足している部分をオリジナルで書き足したり、社内・社外の協力者に書いてもらった。

内容の見直し・推敲

ブログを書き始めたのが2005年であり、本にする作業は実質的に2012年~2015年である。PDFの技術的な基本は次のようなことである。

① フォント技術
② オブジェクト表現のシンタックス
③ PDF文書構造とファイル構造

これらは1990年代には完成しており、この10年間で本質的な変化は少ない。しかし、仕様はISO 32000-8となり、また、OS、ブラウザ、ワープロアプリが標準でサポートするようになるなど、利用環境はかなり変化している。

こうしたことで情報が古くなってしまったところが多い。古くなった内容は、記録上の意味をもつ部分はそのままとしたが、そうでない内容はできるだけ最新情報に更新した。

CAS-UBの構成編集機能で、章の順序を、なんども入れ替えしたり、章を予定していたところを削除したり追加した。CAS-UBでは章・節番号、図番号などを、PDFやEPUBを作るときに自動的につける。記事順序の入れ替えや挿入・削除をしても文中の番号を付け変える必要がないので便利である。

内容の仕上げ

2015年11月から12月末までにかけて推敲・校閲して仕上げた。Redmineというプロジェクト管理システムに、書記方法や用語統一のための項目・用語一覧表を作った。最後に、まとめてCAS-UBの検索・置換機能で作業した。検索・置換は誤って不要な箇所まで置換してしまう危険がある。そこで、作業後の推敲を行った。

  • 漢数字とアラビア数字の使い分け見直し
  • 原語で末尾がer、or、arで終わる単語は長音符号(ー)で終わるように
  • 「・」の使用。2語は原則として中黒無し
  • 箇条書きの末尾には読点を付けない
  • カタカナ語と和文語を統一
  • 全角・半角(括弧、数字、ラテンアルファベット)
  • 英単語間の空きは半角スペースにする
  • 送り仮名の付け方統一

文章の推敲は、説明の重複部分を削除し、また説明文が分散しているとき、できるだけ一箇所にまとめた

索引

書籍の性格上索引が重要なので、索引の作成は索引を専門としている外部の方に協力いただいた。索引語は最終的に約600語、750箇所と充実した。CAS-UBでは、通常の索引の他、親子索引、兄弟索引のマークアップができる。索引の頁はプログラムで自動生成するので、索引語として拾う語を増やしたり減らしたりするのは自由自在である。

(続く)

[1]アメリカで電子書籍の売上が大失速!やっぱり本は紙で読む?
[2]改訂版の公開経過
[3] 『本をコンピュータで作る』のは、いま、どこまでできる?
[4] 『本をコンピュータで作る』のは、いま、どこまでできる? (2)紙の本と電子の本をワンソースで作りたい
[5] 『本をコンピュータで作る』のは、いま、どこまでできる? (3) 電子テキストは印刷ではなく、音声の暗喩と見る方が良い
[6] 『本をコンピュータで作る』のは、いま、どこまでできる? (5) 『PDFインフラストラクチャ解説』のプリントオンデマンド制作と販売

『PDFインフラストラクチャ解説』公開履歴(ブログ)

『PDFインフラストラクチャ解説』のfacebookグループ:
PDFinterest:「PDF」に関する本について議論するために開設しました。
どなたでもお気軽にご参加ください。

【制作途中の日記】(ブログ)
2012年1月3日 「PDFインフラストラクチャー解説」EPUB本の0.1版を公開
2012年1月10日 「PDFインフラストラクチャー解説」EPUB本の0.12版を公開
2012年1月16日 「PDFインフラストラクチャ解説」EPUB/0.14版(1/16)を公開しました
2012年1月23日「PDFインフラストラクチャ解説」EPUB・0.15版を公開しました。
2013年2月11日 『PDFインフラストラクチャ解説』1年振りに改訂しました。PDF版も配布開始です。(0.23版)
2013年2月27日 『PDFインフラストラクチャ解説』をプリントオンデマンドで本にしてみました
2013年3月18日 『PDFインフラストラクチャ解説』更新、0.28版にしました。
2013年5月19日 『PDFインフラストラクチャ解説』を0.30版に改訂。「PDF長期署名(PAdES)」の節を追加しました。
2013年5月27日 『PDFインフラストラクチャ解説』を0.31版に改訂。「PDFの真性性・証拠性の確保」の章を記述しました。
2013年6月2日 『PDFインフラストラクチャ解説』を0.32版に改訂。PDF/Aの解説を改訂し、PDF/Aの作り方の節を追加しました。
2013年7月2日 『PDFインフラストラクチャ解説』第2回目の試作BODできました。電子出版EXPOにてご覧いただくことができます。
2013年7月23日 『PDFインフラストラクチャ解説』0.34版としました。PDFの注釈についての説明を書き直し。
2013年8月6日 『PDFインフラストラクチャ解説』の0.35版を公開しています。PDFにおけるJavaScriptの節が追加になっています。
2014年1月7日 『PDFインフラストラクチャ解説』0.37版をリリースしました。Flashの概要を追加しています。
2014年3月24日『PDFインフラストラクチャ解説』のPDFの構造機能、タグ付きPDFの説明を強化。タグ付きPDFは固定レイアウトEPUBにも通じる。
2014年7月3日『PDFインフラストラクチャ解説』第3回目POD本の組版レイアウトを評価していただける方を募集しています。
2015年11月27日 『PDFインフラストラクチャ解説』 0.55版を公開。無料配布の最終版となります。
2016年1月6日 近日発売!『PDFインフラストラクチャ解説』出版記念 特別講演会のお知らせ
2016年1月21日『PDFインフラストラクチャ解説』POD版とKDP版が揃い踏みとなりました

EPUB3.0のアクセシビリティを高めるためのガイドライン

EPUB3.0形式の電子書籍のアクセシビリティについては、EPUB3.0を制定した団体であるIDPFが制作して配布している「EPUB 3 Accessibility Guidelines」[1]を紹介する。

EPUB3.0のパッケージ中は、XHTML5、CSS、SVGとJavaScriptというWebコンテンツ形式で構成する。従って、アクセシビリティの基本はWebアクセシビリティ、つまり、WCAG(Webアクセシビリティガイドライン)とWAI-ARIA(アクセシブルなリッチインターネット・アプリケーション)である。但し、EPUB3.0には、PLS辞書(発音辞書)、ナビゲーション文書のような独自の機能もある。

EPUB3.0では、音声読みあげツールなどの支援技術を使ったときにも、本の読み順が分かりやすいようにマークアップしなければならない。EPUB3.0のアクセシビリティを高めるポイントは非常に多岐にわたる。

EPUB 3 Accessibility Guidelinesは、次の構成になっている。

1. 意味
・論理的な読み順
・epub:type属性
・スタイルの分離
2. XHTMLコンテント文書
2.1 一般
・言語
・ページ番号
・インライン・フレーム
2.2 整形
・ボールドとイタリック
・リンク
2.3 前付
・出版された仕事
・目次
・イラストの一覧
・表一覧
2.4 本文
・部・章・節
・見出し
・表
・箇条書き
・説明
・図
・画像
・画像マップ
・オーディオ
・ビデオ
・脚注・後注
・注釈
・文脈の区切り
2.5 後付
・文献一覧
・索引
3. MatML
・説明
4. SVG
・言語
・タイトルと説明
・部品
・テキスト内容
・リンク
・スタイル
・対話性
5. EPUB スタイルシート
・色
・背景とイメージ
・隠れた内容
・重要なルール
・CSSのプロパティ参照表
6. 固定レイアウト
・XHTML
・イメージ
7.ナビゲーション
・目次
・ランドマーク
・ページリスト
・図一覧
・表一覧
8.メタデータ
・ONIXコードリスト196
・Schema.orgアクセシビリティ・メタデータ
9.メディアオーバレイ
・概要
・ハイライト
・箇条書き
・表
10. テキストから読み上げ
・概要
・PLS辞書
・SSML
・CSS3スピーチ
11. スクリプトに依る対話性
・プログレッシブ・エンハンスメント(UAの能力に応じて機能を拡張)
・コンテンツの妥当性
・WAI-ARIAとカスタムコントロール
・フォーム
・ライブ領域
・キャンバス
12. 準拠
・参考資料:セクション508

[1]EPUB 3 Accessibility Guidelines(このWebページもEPUBも、最初の「Getting Started」の見出しがO’Reilly本の広告へのリンクになっているので注意)。この資料は、Webページとして閲覧できるほか、EPUB形式でも無料でダウンロードできる。
[2] アクセシビリティとは(草稿)
[3] 著作権法とアクセシビリティ(草稿)
[4] アクセシビリティという言葉がどのように使われているか
[5] PDFのアクセシビリティ。ワンソースマルチユースのもう一つの応用。

PDFのアクセシビリティ。ワンソースマルチユースのもう一つの応用。

PDFへのアクセシビリティとはPDFの形式で表された情報や知識の利用しやすさである。

1.PDF形式で表される情報の主な種類

・PDFは紙への印刷物をデジタル化したものであるが、最近は、印刷物ではない3D画像や動画を埋め込んだり添付することもできるようになっている。
・印刷物として表された知識は文字(テキスト)が中心であるが、写真や絵画のようにテキストで表せないものもある。
・テキストの一部にイラストのような図版、写真、表を含むことも多い。
・書物のような冊子を表すPDFについては、目次・索引・リンクなど必要な情報を探し、そこにたどり着くための仕組みもある。
・PDFはJavaScriptプログラムを使ってアクションを設定できる。

2.PDFのアクセシビリティについて定めた規格

PDFのアクセシビリティについて定めた規格には、PDF/UAとWCAGをベースとする規格の二つがある。

(1) PDF/UA(ISO 14289-1:2014)
ISO 32000-1:2008 をベースとして、アクセシブルなPDFのための要求項目を決めている。2008年に初版、2012年に改訂、2014年に再び改訂された。主な内容は、次の通り。
・ファイルの識別方法(5節)
・要求項目まとめ(6節)
・ファイル形式への要求項目(7節)
・準拠リーダーへの要求項目(8節)
・準拠支援技術への要求項目(9節)

7節のファイル形式への要求項目が中心である。1.で簡単に紹介したようにPDF中には多様な情報を含んでおり、要求項目は多岐に渡る。見出しだけを挙げると次のとおりである。
・一般(7.1)
・テキスト(7.2)
・グラフィックス(7.3)
・見出し(7.4)
・表(7.5)
・箇条書き(7.6)
・数式(7.7)
・ページのヘッダー・フッター(7.8)
・注釈と参照(7.9)
・オプショナル・コンテント(7.10)
・埋め込みファイル(7.11)
・アーティクル・スレッド(7.12)
・電子署名(7.13)
・非対話フォーム(7.14)
・XFA(7.15)
・セキュリティ(7.16)
・ナビゲーション(7.17)
・注釈(7.18)
・アクション(7.19)
・XObject(7.20)
・フォント(7.21)

PDF/UAは、まずタグ付きPDFでなければならない。特に本文については、7.2から7.9できめ細かくタグを付けることが要求されている。例えば、見出しはH1タグをルートとし、H2H3…と順を追って階層化した見出しタグを付けなければならない。図にはFigureタグを付け、図のキャプションにはCaptionタグを付けなければならない。

(2) Web Content Accessibility Guidelines (WCAG) 2.0(ISO/IEC 40500:2012)
  日本語版JIS X8341-3:2010
Web Content Accessibility Guidelines (WCAG) 2.0(原文)
WCAG 2.0 ガイドライン(日本語訳)

Webコンテンツ一般のガイドラインであり、PDFもその一種として対象としている。WCAG2.0は高レベル(抽象度の高い)ガイドである。

具体的なテクニック解説文としてPDFの作り方に関する説明がある。
Techniques for WCAG 2.0(原文)
WCAG 2.0 実装方法集(日本語訳)
PDF Techniques for WCAG 2.0(原文)

「WCAG 2.0 実装方法集」は、準拠基準ではなく実装の解説である。

例えば、文書をスキャンして画像化したPDFはPDF/UA準拠ではない。PDF/UA準拠にするには機械可読としてタグを付ける。WCAG 2.0 実装方法集にはその例が記載されている、という関係である。

3.ワンソースマルチユースの応用としてのアクセシブルPDF生成

全体として、PDF仕様の複雑さと、アクセシビリティ要求の難しさを考慮すると、アクセシブルレベルの高いPDFを手作業で制作するのはかなり難易度が高い。PDF/UA準拠にするために、できあがったPDFに後から手作業でタグ追加するのは効率を考えると良い方法といえない。オーサリングの段階で文書を構造化しておき、タグをPDFに自動的に埋め込む必要がある。

アクセシブルなPDFを自動的に作れないと製作コストが許容できないほど高くなってしまうだろう。このようにコンテンツから印刷用PDFと共にアクセシブルなPDFを自動生成することは、ワンソースマルチユースのもう一つの応用になるであろう。

[1] アクセシビリティとは(草稿)
[2] アクセシビリティという言葉がどのように使われているか
[3] PDFのアクセシビリティ。ワンソースマルチユースのもう一つの応用。
[4] EPUB3.0のアクセシビリティを高めるためのガイドライン

アクセシビリティという言葉がどのように使われているか

国連の「障害者の権利に関する条約」をみると、原文では“access”という単語は63か所出てくる。普遍的な用語である。

原文では“accessibility”は9か所に出てくる。しかし、日本語訳にはアクセシビリティという単語は出てこない。原文の“accessibility”が出てくる箇所の対訳を下記に示す。

《まとめ》
「障害者の権利に関する条約」において、アクセシビリティは障害者にとっての施設やサービスの利用のしやすさを意味する言葉として使われている。

《記》

1.前文(V)

(v) Recognizing the importance of accessibility to the physical, social, economic and cultural environment, to health and education and to information and communication, in enabling persons with disabilities to fully enjoy all human rights and fundamental freedoms,

【訳文】
(v) 障害者が全ての人権及び基本的自由を完全に享有することを可能とするに当たっては、物理的、社会的、経済的及び文化的な環境並びに健康及び教育を享受しやすいようにし、並びに情報及び通信を利用しやすいようにすることが重要であることを認め、

2.第3条
Article 3 General principles
The principles of the present Convention shall be:

(f) Accessibility;

【訳文】
第三条 一般原則
この条約の原則は、次のとおりとする。

(f) 施設及びサービス等の利用の容易さ

3.第9条 見出し
Article 9 Accessibility

【訳文】
第九条施設及びサービス等の利用の容易さ

4.~8.第9条本文
1. To enable persons with disabilities to live independently and participate fully in all aspects of life, States Parties shall take appropriate measures to ensure to persons with disabilities access, on an equal basis with others, to the physical environment, to transportation, to information and communications, including information and communications technologies and systems, and to other facilities and services open or provided to the public, both in urban and in rural areas. These measures, which shall include the identification and elimination of obstacles and barriers to accessibility, shall apply to, inter alia:
(a) Buildings, roads, transportation and other indoor and outdoor facilities, including schools, housing, medical facilities and workplaces;
(b) Information, communications and other services, including electronic services and emergency services.
2. States Parties shall also take appropriate measures:
(a) To develop, promulgate and monitor the implementation of minimum standards and guidelines for the accessibility of facilities and services open or provided to the public;
(b) To ensure that private entities that offer facilities and services which are open or provided to the public take into account all aspects of accessibility for persons with disabilities;
(c) To provide training for stakeholders on accessibility issues facing persons with disabilities;
(d) To provide in buildings and other facilities open to the public signage in Braille and in easy to read and understand forms;
(e) To provide forms of live assistance and intermediaries, including guides, readers and professional sign language interpreters, to facilitate accessibility to buildings and other facilities open to the public;
(f) To promote other appropriate forms of assistance and support to persons with disabilities to ensure their access to information;
(g) To promote access for persons with disabilities to new information and communications technologies and systems, including the Internet;
(h) To promote the design, development, production and distribution of accessible information and communications technologies and systems at an early stage, so that these technologies and systems become accessible at minimum cost.

【訳文】
1.締約国は、障害者が自立して生活し、及び生活のあらゆる側面に完全に参加することを可能にすることを目的として、障害者が、他の者との平等を基礎として、都市及び農村の双方において、物理的環境、輸送機関、情報通信(情報通信機器及び情報通信システムを含む。)並びに公衆に開放され、又は提供される他の施設及びサービスを利用する機会を有することを確保するための適当な措置をとる。この措置は、施設及びサービス等の利用の容易さに対する妨げ及び障壁を特定し、及び撤廃することを含むものとし、特に次の事項について適用する。
(a)建物、道路、輸送機関その他の屋内及び屋外の施設(学校、住居、医療施設及び職場を含む。)
(b)情報、通信その他のサービス(電子サービス及び緊急事態に係るサービスを含む。)

2 締約国は、また、次のことのための適当な措置をとる。
(a)公衆に開放され、又は提供される施設及びサービスの利用の容易さに関する最低基準及び指針を作成し、及び公表し、並びに当該最低基準及び指針の実施を監視すること。
(b)公衆に開放され、又は提供される施設及びサービスを提供する民間の団体が、当該施設及びサービスの障害者にとっての利用の容易さについてあらゆる側面を考慮することを確保すること。
(c)施設及びサービス等の利用の容易さに関して障害者が直面する問題についての研修を関係者に提供すること。
(d)公衆に開放される建物その他の施設において、点字の表示及び読みやすく、かつ、理解しやすい形式の表示を提供すること。
(e)公衆に開放される建物その他の施設の利用の容易さを促進するため、人又は動物による支援及び仲介する者(案内者、朗読者及び専門の手話通訳を含む。)を提供すること。
(f)障害者が情報を利用する機会を有することを確保するため、障害者に対する他の適当な形態の援助及び支援を促進すること。
(g)障害者が新たな情報通信機器及び情報通信システム(インターネットを含む。)を利用する機会を有することを促進すること。
(h)情報通信機器及び情報通信システムを最小限の費用で利用しやすいものとするため、早い段階で、利用しやすい情報通信機器及び情報通信システムの設計、開発、生産及び流通を促進すること。

9 第31条 
3. States Parties shall assume responsibility for the dissemination of these statistics and ensure their accessibility to persons with disabilities and others.

【訳文】
3 締約国は、これらの統計の普及について責任を負うものとし、これらの統計が障害者及び他の者にとって利用しやすいことを確保する。

[1] アクセシビリティとは(草稿)
[2] 著作権法とアクセシビリティ(草稿)
[3] PDFのアクセシビリティ。ワンソースマルチユースのもう一つの応用。
[4] EPUB3.0のアクセシビリティを高めるためのガイドライン

著作権法とアクセシビリティ(草稿)

以前に書いたアクセシビリティとは(草稿)は、まだ十分にカバーできていない範囲があるようです。原稿提出を(勝手に)延期して、もう少し調べています。

その一つは、著作権法です。著作権法は、書かれたテキストだけではなく、音楽のようにもっぱら聞くだけの著作物、映画や演劇のような見て聞く著作物、プログラム著作物など幅広い著作物をカバーしています。

まず、印刷などで出版されている著作物を読むことができない(プリントディスアビリティ)人々向けには、著作権法第37条の例外規定があります。そこでは、①点字の作成と送信ができ、②政令で認められた者は文字を音声にするなど必要な方式で複製して公衆通信を行うことができます(第37条3項)。

また、聴覚で認識する方式で発表されているものについては、聴覚障害者向けに、著作権法第37条の2での例外規定で、政令で認められた者は音声のテキスト化や複製、貸出を行えます。

政令で認められた者には、障害者向け福祉施設・団体などの他、大学図書館、国会図書館、図書館法・学校図書館法などで定める図書館が該当します。

第37条および第37条の2に定める例外規定は、いずれも著作権者や著作権者の許可を受けたものが行っていないときに限ります。そこで、出版元が制作・販売を開始したときや、障害者向けに制作したものを一般に販売するときには別途取り決めが必要になります。

著作権法は日本の国内法ですが、国際的な利用を推進するために、2013年にマラケシュ条約が制定されています。マラケシュ条約は、2016年1月現在では発効していませんが、批准する国が増えていますので遠からず発効するでしょう。

第二の追加ポイントですが、プリントディスアビリティな人々向けの情報提供の仕組みとしては、点字システムが古くから使われていますが、近年はデジタル録音方式(音声DAISY)の利用が増えています。さらに、画面上で読み上げている箇所をハイライト表示するなど、音声・画像・テキストを同期できるマルチメディアDAISYの普及が始まっています。マルチメディアDAISYは、現在、日本国内ではDAISY2仕様によるものが多いようです。

DAISY4仕様は制作のために使うものとなり、配布形式はEPUB3と統合されました。EPUB3出版物には印刷物を読むことに困難な人にとってアクセシブルでないものも多く含まれますが、配布形式としてEPUB3を採用することで、アクセシブルな出版物の総数が増えることが期待されています。

[1] アクセシビリティとは(草稿)
[2] アクセシビリティという言葉がどのように使われているか
[3] PDFのアクセシビリティ。ワンソースマルチユースのもう一つの応用。
[4] EPUB3.0のアクセシビリティを高めるためのガイドライン

『本をコンピュータで作る』のは、いま、どこまでできる? (3) 電子テキストは印刷ではなく、音声の暗喩と見る方が良い

さて、前回の続きとして、紙の本と電子の本には本質的な相違があるという点について、別の論点を見てみます。

ミシガン大学のThe Journal of Electronic Publishing誌が創刊20周年の特集を組んでいますが、その中で過去20年の人気記事のリストがありました。“Writing Electronically: The Effects of Computers on Traditional Writing”という、電子テキストと紙のテキストの相違に関する論点を整理した記事が、アクセス数の第3位です。

以下、著者の論点を簡単にまとめます:

印刷による本は個人で所有するという概念を形成しました。人々は個人的に読む本を所有したいと望み、それが出版産業を形成するベースになりました。

コンピュータは印刷に原点をもっていますが、コンピュータを媒介とする情報伝達では、印刷のように文章を連ねるのと違って、読者に内容の操作を許します。書き手と読み手の差異が曖昧です。

大きな差異としてハイパーテキストがあります。従来の紙のテキストは順番に意味がありました。これに対して、コンピュータではハイパーテキストによって順番の意味が薄くなります。また、理路整然とした物語が推奨されなくなり、単なるリンクのルーズな集合となります。

紙では文字がページの上に固定されます。電子テキストは常に流動的です。

紙は一方的であり受け身のコミュニケーションなのに対し、電子テキストは積極性と対話性があります。

電子テキストの時代には、インターネットにアクセスできる人は誰でも出版ができます。何世紀にもわたって、散文、詩、学術情報などは、それぞれに紙の上に表現する標準を作ってきました。しかし、電子ではこれらはすべて見直しになり、伝統的な質から、価値への転換となります。

著者は、結論として次のように述べています:
電子テキストは文字によるコミュニケーションの拡張に位置づけられ、印刷と比較される傾向がある。しかし、対話性において従来とは大きな相違があるので、むしろいままでの印刷の暗喩ではなく、音声コミュニケーションの暗喩と見る方が良いのではないか。

この文章は、2002年に書かれたものですが、その後のfacebookのようなSNSの進展を考え合わせますと深くうなずけるところがあります。電子書籍を紙の書籍の延長上で考える電子と紙のワンソースマルチユースは再考する必要がありそうです。

[1] 『本をコンピュータで作る』のは、いま、どこまでできる?
[2] 『本をコンピュータで作る』のは、いま、どこまでできる? (2)紙の本と電子の本をワンソースで作りたい
[3] Ferris, Sharmila Pixy. Writing Electronically: The Effects of Computers on Traditional Writing この論文の電子テキストとは、ネットワーク化されたコンピュータというメディアで書かれるテキストであり、ウェブ上のテキストに焦点をあてている。

『本をコンピュータで作る』のは、いま、どこまでできる? (2)紙の本と電子の本をワンソースで作りたい

『本をコンピュータで作る』のは、いま、どこまでできる?の続きです。前回は紙の本と電子の本を同時に作りだすのが目的とお話しました。

紙の本と電子の本を、コンピュータで作るならば、コンテンツを1回作成したら両方の形式を自動的に作りたいと考えるのは自然です。つまりワンソースマルチユースの実現が課題となります。

ワンソースマルチユースについて考えてみます。主に、CAS-UBや電子出版の関連プロジェクトに5年ほど取り組んだ経験から、最近は、次のように考えています。

紙の本と電子の本には本質的な相違がある (そんなのはあたりまえだろ! って?)

紙の本と電子の本を完全にワンソースで作るのは不可能です。可能なことを示すには、実際にやってみる必要がありますが、不可能なことを示すのはできない例を示せばよいので簡単です。

できない例を幾つか示してみます。簡単で判りやすい例から行きます。

1.まず、表紙についてはどうでしょうか。

紙の本は、本文を綴じたうえに包みのカバーをかけます。カバーは表表紙、裏表紙、背表紙から構成します。しかし、電子の本には背表紙はありえません。なにしろ厚さがないのですから。紙の本の表紙は、飾りだけではなく、本文の紙を保護したり、手にもって開いたり読んだりするために有用です。その点、紙の本には裏表紙は欠かせませんが、また、電子の本に裏表紙を付けることは意味がないでしょう。

表表紙も違います。紙の本では表1、表2(通常は白)があります。電子の本では、表1だけは紙の本と類似にする意味があります。表2はあまり意味がありません。

2.紙の本は、表紙以外にも伝統的な構成、つまり、本扉、前付、本文、後付という大構成、さらに細分化すると、前付は前書、目次、献辞、権利(英語の本)といった構成があります。

この構成について、電子の本を紙の本と同じ構成にするかどうか? このあたりはまだあまり議論がなされていないように思います。もし、構成を変える方が良いということになりますと、ワンソースではできないことになります。

最近、『PDFインフラストラクチャ解説』という本をCAS-UBでプリントオンデマンドとKindleで発売しました[1]。この本のKindle版には図表一覧があります。しかし、POD版は図表一覧は省略しました。販売価格を抑えるためページ数を減らして、コストを抑えたのです。

紙の本はページ数に応じてコストが増えるのですが、電子の本はその心配がありません。このように紙と電子ではコスト構造が違いますので、電子の本で一部を省略したり、入れ替えることは十分合理的です。

3.レイアウト依存の内容があります。ひとつの例は、見開きのページでしょう。

見開きページは、紙という固定サイズをもつ用紙を左右の中央で綴じたメディアで意味があります[2]。電子の画面に見開きという概念は存在しないのではないでしょうか。見開きは単に大きな画面ではないでしょう。

本文がすべて見開き単位でレイアウトされているのであれば、紙の見開きページを電子の1画面に対応つけることになるでしょう。こうしたときは関係はシンプルです。

リフロー形式の本で、大きな画像ページが見開きになっているときは、紙のページと電子の画面では、テキストと画像の位置対応関係が難しくなります。テキストの流れの中の画像の位置と、紙にレイアウトして見開画像のページを挟んだときとでは、テキストの流れと画像の位置の相対関係が変わります。

こうしたとき、ワンソースで紙と電子で最適な本を自動的に作りだすのは、それなりのアルゴリズムが必要です。

4.3項と前後しますが、ページという概念の紙と電子(画面)での違いは、本質的です。

次回は、この点をもう少し、考えてみたいと思います。(「『本をコンピュータで作る』のは、いま、どこまでできる? (6) 紙のページと電子の画面の違い」をご参照ください。)

[2]上下で綴じた場合も見開きというのかどうかは、まだ調べていません。