索引の作り方を考える。一歩進んで、本文に出てこない索引語や、索引語の階層化の試み。

ここしばらくの間、CAS-UBで「ECMJ流Eコマースを勝ち抜く原理原則 シリーズ第三弾」を編集していました。いよいよ大詰めで索引を作成しています。本書はインターネットマーケティングの実践法について紹介する目的で、株式会社 ECマーケティング人財育成の石田社長が毎日書いているブログ[1]をトピック別に整理して書籍の形式とするものです。ブログの形をとっていますが、世の中に星の数ほどあるぬるいブログではなく石田社長の実践経験が力を抜くことなく100%語られるという日本でもめずらしいものです。すでに、第一弾[2]、第二弾[3]はKindle版とプリントオンデマンド版で発売しています。

第三弾は、Eコマースサイトへの集客や広告の成果データを分析して広告の選択や効果を高めるためのさまざまな話題を含んでいます。ブログは1本が1,500文字の読み物なのですが、元原稿の性格上、同じトピックの記事が何回か取り上げられています。また、役に立つ内容がいろいろな箇所にちりばめられています。

そこで、索引を少し工夫してみました。ここで索引の工夫について具体的に説明する前に、書籍の巻末索引の役割や目的を考えてみましょう。

索引の役割

1.用語や固有名詞について本文中にでてきた場所を示す

索引の普通の目的は、紙の本を読んでいる途中で、ある用語の説明、土地の名前や人物の名前などの固有名詞が既に読んだページにあったような気がするけど、どこだっただろうか? と思って探すことにあります。索引がないと該当しそうなページに立ち返って探すわけですが、巻末索引があれば索引語でその記述位置を簡単に探すことができます。

この場合、索引語としては、本文中に登場する用語や固有名詞をそのまま採用し、巻末索引では、索引語について一番詳しく記述されている箇所を索引のページ番号として示すでしょう。

2.本の内容を理解する

では巻末索引を、著者の主張や本の内容について探す手がかりにできないでしょうか? これは、巻末索引を一種の目次としても使えるようにするということです。ポイントとなる概念を索引語として用意し、巻末の索引ページには、本文中の索引語に関連する位置を示すことになります。本の中に書かれている言葉でなく、書かれている言葉の上位概念を索引語としても良いでしょう。この場合、巻末索引は階層構造となります。

上位概念を索引語として階層構造とする

本の中で頻出する用語をビッグワードと呼ぶことにします。ビッグワードを索引語として採用しますと、出現するページの数が多くなります。索引で一つの用語の参照先ページの数が多くなると、探したい箇所を見つけるまでに索引から本文を探す回数が多くなり、探したい場所を見つけるのが難しくなります。

その場合、上位概念と下位概念に分けて索引を階層化すると便利になるでしょう。

さらに、これを追求すると索引を本の内容をたどる目的で使えるかもしれません。

例えば、本の内容によって「検索」という言葉がビッグワードになってしまった場合、検索を上位概念として、その下位の用語として「検索キーワード」、「検索順位の変化」、「検索エンジン対策」などを索引語として、親子関係で表すと良いでしょう。これを追求しますと、巻末索引をタクソノミーにする、という方向に行くかもしれません。

実際の例

とりあえず、今回は、幾つか大きなキーワードを、本の内容を探すことができる分類を示す用途として使って索引を作ってみました。次ができあがった本の索引ページです。うまく使えると良いですが。

ecmj-books-3_181

ecmj-books-3_182

ecmj-books-3_183

[1]株式会社ECマーケティング人財育成(トップがブログページ)
[2]『E コマース成功のための土台づくり~ネットのマーケティングを徹底的に理解せよ~』
[3]『おにぎり水産 鬼切社長のEコマース奮闘記: ~とある地方の笹かまぼこ工場がネットショップを成功させるまで~』

ワンソース・マルチユース実現の難しさ

ワンソース・マルチユースという言葉はかなり長く使われています。テクニカルドキュメントなどでは大きなシステムを構築して実現しているケースもいろいろ報告されています[1]。しかし、書籍の出版や学術誌の出版ではワンソース・マルチユースはまだ大きな流れにはなっていません。ここではワンソース・マルチユースがなかなか普及しないのはなぜかを考えてみます。

※本ブログをもう少し加筆して次に掲載しています。この続きは下記でどうぞ:
「ワンソース・マルチユース実践の難しさを考える」

ワンソース・マルチユースの仕組み

ワンソース・マルチユースを実現するには、まずソースの形式を決める必要があります。ソースの形式としては、DocBook、DITA、JATS、HTML5などXML/HTMLによるドキュメント形式を採用するのが便利です。XMLはもともとドキュメントをデバイスやアプリケーションから独立の形式で記述するために設計されたものです。

ソースの形式をどのようにするにせよ、ワンソース・マルチユースの出版工程は二つのステップに分けられます。第一はソースとなるドキュメントを用意する工程です。第二は、それをいろいろな目的に出版する工程です。ソースの形式をどう選択するかで、ソースドキュメントの制作の方法が影響を受けます。もちろん、出版工程も影響を受けます。

第一のステップ

ソースとなるドキュメントを執筆、校正して完成する工程です。XML/HTMLではテキストにマークアップ[2]する工程が必須です。マークアップが正しくないと第二ステップの処理ができません。執筆、校正を初めとして、第一のステップは、人手で行うのが主体です。

ドキュメントを制作する工程は、まだコンピュータで処理できるようになっていません。もっとも、現在、いま問題になっているDeNAのキュレーションサイトのコンテンツの収集についての記事を読むと、文章をリライトするコンピュータ処理は、驚くほど進歩しているようです[3]ので、将来は自動的にできるようになるかもしれません。恐ろしいことです。

第二のステップ

第二ステップはソースを加工処理してWebページ、PDF、各種のHELPなどを作成する工程です。XMLはもともとドキュメントをコンピュータで処理するための技術です。ソースドキュメントをXMLで用意することができれば、プログラムで様々な成果物を用意するのは容易です。

例えば、DITAではあまりレイアウトなどに拘らなければDITA-OTを使うだけで、HTML、PDFを初めとする多種類の出力が得られます。このように、ソース文書さえXMLあるいはHTMLで作ることができれば、いまの技術を使えば多種類の出力を作成するのは比較的容易です。

問題はなにか?

ワンソース・マルチユースの難しさはソースをどのように用意するかというプロセスにあり、マルチ出力は大きな問題ではありません。

これはXMLやHTMLが技術的に難しいということではありません。上で説明しましたように、第一ステップは人手で行われます。これを担当する執筆者・制作者は、現在、すでに一定のツールを使って一定の手順により作業を行っています。その作業のワークフローをそれまで慣れ親しんできた方法から変更するように説得するのが難しいのです。

特定の企業が主体性をもって限られた数のドキュメントを制作しているテクニカルマニュアルなどの分野でさえもなかなかワークフローの転換は難しいのです。多品種少量制作の典型である商業書籍の出版や事務局が責任をもった意思決定をしにくい学会などはさらに難しくなります。

[1] SAPの大規模DITA導入事例の進展(2016年11月)
[2] マークアップ
[3] DeNA「サイト炎上」MERY、iemoの原罪とカラクリ

CAS-UB 操作紹介ミニ動画が20本になりました。

CAS-UBはデジタル技術を活用して本を作るWebサービスです。その特徴は、次のような点にあります。

(1)小説のようなほぼ文字だけの本ではなく、図版や表などを多用する専門書も編集・制作できること
(2)EPUBだけではなく、プリントオンデマンドのためのPDFを簡単なパラメータ設定のみで作ることができること

特に紙の本は、できあがったものを見ますと、一見簡単にできていそうに見えます。しかし、実際に本を作ってみますと、まず本の編集・制作作業はかなり複雑です。紙の本には長い歴史があり、表紙・扉・前書・目次・本文・後書・索引などの多くの構成要素があります。さらに日本語の本は横組・縦組があり、綴じ方(開き方)が反対になります。他にどんな点が難しいかは下記の参考資料(本のワンソースマルチユース制作〜その理論・実践・未来)をご覧ください。本の制作にあたっては、このような諸要素を予め配慮する必要があります。

こうしたことから、商業出版社では、専門的な知識をもつDTP制作者や制作会社に制作作業を外注していることが多いようです。しかし、本の制作を外注して行うと日程や費用が掛かってしまいます。さらに、DTPで制作するとPDFに特化してしまうため、EPUBなどの電子書籍にするのに別途の日にちがかかります。

CAS-UBは、コンピュータを使って、本の編集・制作作業をできるだけ自動的に行い、知識の伝搬・技術・産業の発展に欠かせない専門的な本の生産性を高めるのが目標です。

やや複雑なCAS-UBの編集操作やPDFの作成を、直感的に理解していただくために、次のミニ動画を用意しています。それぞれ1~2分ですので、ぜひご覧ください。なお、この中の動画の多くは、ECMJ石田社長のブログを、ECMJ流Eコマースを勝ち抜く原理原則 シリーズという本にする過程を録画したものです。

CAS-UB紹介動画一覧

新しい出版物の作成
編集機能について
図版と画像の扱い
本の構成を編集する
PDF生成

なお、動画の内容は随時追加・改訂していく予定です。

参考資料
本のワンソースマルチユース制作〜その理論・実践・未来
CAS-UB Webページ
ミニ動画作成のきっかけになった10月24日セミナーのプレゼンテーション

注の配置:縦組の本の傍注 

縦組の本では、本文への注を傍注とする場合、左ページ(奇数ページ)の左側に付けるのが良いと思います[1]

ときに、下の図のように右ページ(偶数ページ)の左側に傍注を付けている本を見かけます。

IMG_20161126_070918
(『プーチンの国家戦略 岐路に立つ「強国ロシア」』(小泉 悠、東京堂出版、2016年10月)より。本書には数カ所このような傍注配置があります。)

上のような配置はあまり良い配置とはいえないと思います。

その理由としては次のことがあります。特に縦組は、見開きページの右ページから左ページへのテキストの連続性を横組よりも強く配慮する必要性があると思います。

(1)本文の間に傍注が配置されることとなり、右ページから左ページに読み進めるときの文章のつながりを分断してしまいます。
(2)視覚的には注と本文を混同する可能性は少ないと思いますが、読み上げなどでは途中に入ってしまう可能性があります。

[1] 日本語組版処理の要件(日本語版)4.2.6 縦組の傍注処理

CAS-UBのデモ動画 新ファイル : POD用PDFを用意して出版する

ブログの記事を整理したPDFができあがりました。プリントオンデマンド用のPDFを用意して出版します。

【シナリオ】
(1) 通常のPDFでは、CAS-UBで自動生成した簡易表紙とタイトルページが付きます。
(2) POD用では、表紙・背表紙・裏表紙をデザインして別途制作します(必須)。
(3) POD用では、タイトルページもデザインして制作します(オプション)。
(4) その他PDFの仕様は、CAS-UBの「POD版設定」で自動的に調整します。
(5) PDFの生成設定では、POD版用設定を別の名前で保存できます。

【デモ動画】
POD用PDFを用意して出版する

【デモ動画一覧】(それぞれMP4ファイルを表示します)
(1)新出版物を作り『蕎麦の味と食い方問題』(青空文庫)をコピーする
(2)ルビ、縦中横、リンクをマークアップする
(3)Wordからの外部入力の操作例
(4)PDF生成の基本設定
(5)PDF生成のレイアウト調整
(6)PDFの後書きのページ内配置と見出しの指定変更
(7)『XSL-FOの基礎』サンプルレイアウト改善の例
(8)ブログをコピーして節の本文に貼り付け、項の見出しを付ける
(9)目次に出す見出しのレベルを二つから一つに変更する
(10)検索、検索・置換する、記事の先頭はそのままにする
(11)Word文書で作成した「前書」を追加します。
(12)索引を追加する
(13)奥付を追加する

CAS-UBの編集デモ動画 新ファイル : 奥付を追加する

ブログの記事を整理した本文ができあがりました。索引もでき、残りは奥付です。

【シナリオ】
(1) 奥付の内容は、書誌編集で入力します。
 a. タイトル
 b. サブタイトル
 c. 著者プロフィール
 d. 著作権情報
 e. ISBN
 f. 奥付の出力項目を設定する
 g. 奥付は横組がデフォルト
(2) 奥付の出力項目を設定する

※PDFの生成設定は本文二段組みとなっている。

【デモ動画】
奥付を追加する(mp4動画です)

【デモ動画一覧】(それぞれMP4ファイルを表示します)
(1)新出版物を作り『蕎麦の味と食い方問題』(青空文庫)をコピーする
(2)ルビ、縦中横、リンクをマークアップする
(3)Wordからの外部入力の操作例
(4)PDF生成の基本設定
(5)PDF生成のレイアウト調整
(6)PDFの後書きのページ内配置と見出しの指定変更
(7)『XSL-FOの基礎』サンプルレイアウト改善の例
(8)ブログをコピーして節の本文に貼り付け、項の見出しを付ける
(9)目次に出す見出しのレベルを二つから一つに変更する
(10)検索、検索・置換する、記事の先頭はそのままにする
(11)Word文書で作成した「前書」を追加します。
(12)索引を追加する

CAS-UBの編集デモ動画 新ファイル : 索引を追加する

ブログの記事を整理した本文ができあがりました。本には索引が必要ですので、簡単な索引を設定します。

【シナリオ】
1.索引を設定します
(1) 本文で索引項目を選定します。日本語の漢字を含むときは、索引の読みを入力して、「CAS記法」をクリックすると索引がマークアップされます。
(2) アルファベット・カタカナ・ひらがなは読みの入力は不要です。
(3) 本文中に表示されない索引項目は位置だけ指定し、索引語と(必要なら)読みを入力します。索引のマークアップには:nodisp属性が付きます。
(4) PDFに索引を「出す」「出さない」を設定します。(索引項目が一つもないと、「出す」としても索引ページはできません。)
(5) 目次に索引ページが追加されています。
(6) 索引項目には本文へのリンクが設定されます。

※PDFの生成設定は本文二段組みとなっている。

【デモ動画】
索引を追加する(mp4動画です)

【デモ動画一覧】(それぞれMP4ファイルを表示します)
(1)新出版物を作り『蕎麦の味と食い方問題』(青空文庫)をコピーする
(2)ルビ、縦中横、リンクをマークアップする
(3)Wordからの外部入力の操作例
(4)PDF生成の基本設定
(5)PDF生成のレイアウト調整
(6)PDFの後書きのページ内配置と見出しの指定変更
(7)『XSL-FOの基礎』サンプルレイアウト改善の例
(8)ブログをコピーして節の本文に貼り付け、項の見出しを付ける
(9)目次に出す見出しのレベルを二つから一つに変更する
(10)検索、検索・置換する、記事の先頭はそのままにする
(11)Word文書で作成した「前書」を追加します。

『本をコンピュータで作る』のは、いま、どこまでできる? (6) 紙のページと電子の画面の違い

『本をコンピュータで作る』のは、いま、どこまでできる? (2)紙の本と電子の本をワンソースで作りたいの最後で「ページという概念の紙と電子(画面)での違いは、本質的です。」と書きました。

今日は、紙のページと電子の画面の違いについて考えてみます。

相違点1.紙の判型と電子の画面で寸法の考え方が違う

紙の本には判型(物理的なサイズをもつ)があり、判型の上に版面(本文をレイアウトする領域、基本版面)があります。紙では絶対寸法で表される大きさをもつ版面が必然であり、紙の制約条件とも言えます。版面の上に配置されるオブジェクトも絶対寸法をもち、一旦印刷されると拡大、縮小ができません。

電子では画面の大きさがあります、画面の大きさも物理的な制約なのですが、画面の上に配置されるオブジェクト(テキスト、図版、表など)は、絶対的な寸法を持ちません。拡大、縮小が自由です。

相違点2.裏表

紙には裏表があります。電子には裏表がありません。

本で裏表を考えて配置されるものに、扉があります。
扉の表に印刷される内容と裏に印刷される内容は役割が違います。例えば、本のタイトルを印刷するのは扉の表であり、扉の裏面ではありません。

電子の画面には裏表がありません。あるのは表示の順番だけです。

例えば、紙の本で書名扉の裏を空白ページにするのは珍しくありません。しかし、画面で空白のページを配置してもあまり意味がないように思います。

また、ページ番号は紙では奇数が表、偶数が裏になります。横組でも縦組でも奇数ページの方が表になり、開始位置として重要度が高くなります。偶数ページは裏になり、続きという意味合いになります。

相違点3.製本と見開き

紙の本は両面に印刷した紙を製本して作ります。すると、見開きページができます。

見開きのページは、片面に印刷して、片方を綴じたレポートのような印刷・製本では存在しません。従って、印刷・製本の仕方によるものです。

電子の画面で見開きのような表示はできますが、紙の本の見開きとは本質的な相違があります。

これを理解しやすい例として、縦組における脚注の配置を示します。
脚注をページ毎に示すと、次の画面のようになります。電子の画面でみるときは1画面=1ページ毎脚注を示すべきでしょう。
20160306
図1 1ページ毎に脚注を配置(注[1]

しかし、縦組の紙の本では、脚注を1ページ毎に配置するのはあまり行われません。次のように見開きの左ページに脚注を置くのが一般的です。
20160306d
図2 見開き毎に脚注を配置(注[2]

相違点4.ページを読み進める(開く、表示する)方向

製本した紙の本は紙のページを開く(捲る)操作と読み進める操作が分れています。画面ではページを順番に表示します。

この相違が一番問題になるのは、たとえば、本文が縦組で、索引が横組で、これが一冊の本として製本されているときです。

紙では本文は、本文の先頭ページから順に2ぺージづつ紙を捲りながら、右から左に読み進めていきます。索引を読む時は、索引の先頭頁を開いて、そこから左から右に読み進めます。

同じことは電子は実現するのは難しいと思います。

本文が縦組で、索引が横組のPDFを作成し、PDFをAdobe readerを使ってWindows PCのウインドウ上で表示してみます。PDF表示ではPDFファイルの中に物理的に登録されているページ順に表示するだけです。結果として索引のページは後ろのページから逆順に表示してしまいます。索引の先頭ページにしおりを設定してジャンプはできますが、そこから読み進めるには逆順にページを表示します。

Adobe Readerでは紙を捲るのと同じ操作は実現できていないようです。

[1] 『PDFインフラストラクチャ解説』をCAS-UBで縦組でPDF化。脚注をページ単位に配置するオプションを選択。
[2] 『PDFインフラストラクチャ解説』をCAS-UBで縦組でPDF化。脚注を奇数ページに配置するオプションを選択。
[3] 『本をコンピュータで作る』のは、いま、どこまでできる?
[4] 『本をコンピュータで作る』のは、いま、どこまでできる? (2)紙の本と電子の本をワンソースで作りたい
[5] 『本をコンピュータで作る』のは、いま、どこまでできる? (3) 電子テキストは印刷ではなく、音声の暗喩と見る方が良い
[6] 『本をコンピュータで作る』のは、いま、どこまでできる? (4) 『PDFインフラストラクチャ解説』の実践例より
[7] 『本をコンピュータで作る』のは、いま、どこまでできる? (5) 『PDFインフラストラクチャ解説』のプリントオンデマンド制作と販売

『本をコンピュータで作る』のは、いま、どこまでできる? (4) 『PDFインフラストラクチャ解説』の実践例より

はじめに

『PDFインフラストラクチャ解説』は、書籍編集制作システムCAS-UBによる制作と出版のケーススタディである。CAS-UBを使って、本格的な本を書き、プリントオンデマンド(POD)と電子書籍(KDP)で出版した。この経験を数回にわたり報告したい。

『PDFインフラストラクチャ解説』の紹介Webページ

CAS-UBはブラウザを使って原稿を執筆・編集し、原稿ができたらワンボタンでPDFとEPUB形式の本を作る仕組みである。2010年から開発を始めた。

CAS-UBの紹介Webページ

2011年の末頃からシステムの開発の一環として本格的な本の執筆を始めた。自分で実践することにより、多くのことを学んだ。もちろんその多くはCAS-UBの開発に反映している。

『PDFインフラストラクチャ解説』のPOD出版

2015年を振り返ると、EPUBによる電子書籍の話題が一段落した一方、PODによるセルフ出版が注目を集めた年であった。但し、POD本によるセルフ出版は、いまのところ小説やSFなど娯楽系の本が多いようである。

『PDFインフラストラクチャ解説』は娯楽系の本ではない。かといってエンジニアを対象とする硬い専門書というわけでもない。いわば、PDFに関する教養書であり、文字やデジタルの紙としてのPDFにまつわる技術的な内容をできるだけ判りやすく説明することを目指している。内容の性格上、横組で、図版や表が多い。図版は、行中のインラインのイメージと、ブロック配置のイメージで本文中に画像ファイルとして150個以上ある。表はCAS-UBでは画像ではなく、HTMLと同じように表(table要素)でマークアップしている。

紙版はB5判、268頁(表紙別)で、定価は2,698円(消費税込み)である。アマゾンで本を買う立場から見れば、通常のペーパーバックと変わらない。アマゾン・プライムで注文すれば翌日には配達される。

電子版はKindle Direct Publishing(KDP)で販売中である。価格は1,250円(消費税込み)と紙版と比べて大幅に安く設定した。紙の本は、やはり印刷・製本や物流の原価が高いので、原価積み上げ方式で価格を決める限り、電子版より高くならざるを得ない。

しかし、紙版を実際に手にもってみると、PDFで同じ内容を画面で見るのと比べ各段に読み易い。2010年頃から数年、本の出版は紙から電子へ変わるという予想が増えた。しかし、ここに来て紙への回帰が始まっているともいわれる[1]。PODで紙の本を手にしてみると、紙の良さを実感できる。やや陳腐だが、紙のすごさを見直しているところである。

PDF-infrustructure

本書の執筆・制作経過

原稿制作過程を簡単に説明する。

ブログの時代の原稿

2005年10月から2008年7月まで、「PDF千夜一夜」というPDFの技術周りの話題を中心とするブログを1000日間連続で書いた。ブログを継続することで多くの読者を集めることができるだろうと期待したのである。当初の狙い通り継続は成功であった。もうブログを終了して7年以上経つが、いまでも、「読んだよ」と言っていただける。読者に記憶に残る印象をもっていただけたのは継続によるものだろう。

ブログの記事の一覧表はこちらにある。毎日完結した話題ではないが、1日1ファイルとすると1000件のファイルがある。

PDF千夜一夜 全記事一覧

本書の内容の多くは、ブログの記事から選択して編集した。ブログを書いていたときは、内容を本にすることを想定してはいなかった。ブログの記事は本の構成を考えて書いたわけではないので、トピック(テーマ)がかなり乱雑に並んでいる。

本のアウトライン

ブログの記事を本にする整理を始めたのは2011年暮れである。本にするにあたり、ブログの記事をテーマ別に分類整理した。テーマを元に、本の目次でいうと章と節にあたる大雑把なアウトラインを作った。アウトラインをCAS-UBの構成編集画面で、章や節のタイトルとした。

各節の記事内容をCAS-UBの編集画面にコピー&ペーストした。ブログの記事の中で使ったのは3割以下であろう。ブログは「です・ます」文体であったので、「である」文体に変更した。

そして、2012年の1月に最初のバージョンを公開した。当時はPDFの自動組版によるレイアウトが十分成熟しておらず、最初はEPUB版のみであった。PDF版を公開したのは、1年後の2013年2月である。2015年12月まで、随時、完成途中のPDFとEPUB版を無償でダウンロード提供した。無償版は2015年12月が最終版である[2]

  • 2005年10月~2008年7月まで「PDF千夜一夜」ブログ
  • 2011年末~2012年1月 アウトラインを決めて記事を整理
  • 2012年1月EPUB版を初公開ダウンロード配布
  • 2013年2月からEPUB版、PDF版を同時配布
  • 2015年12月の0.55版まで随時更新(無償ダウンロードは2016年1月15日に終了しました)

CAS-UBで記事を追加

2013年から2015年までの間に、不足している部分をオリジナルで書き足したり、社内・社外の協力者に書いてもらった。

内容の見直し・推敲

ブログを書き始めたのが2005年であり、本にする作業は実質的に2012年~2015年である。PDFの技術的な基本は次のようなことである。

① フォント技術
② オブジェクト表現のシンタックス
③ PDF文書構造とファイル構造

これらは1990年代には完成しており、この10年間で本質的な変化は少ない。しかし、仕様はISO 32000-8となり、また、OS、ブラウザ、ワープロアプリが標準でサポートするようになるなど、利用環境はかなり変化している。

こうしたことで情報が古くなってしまったところが多い。古くなった内容は、記録上の意味をもつ部分はそのままとしたが、そうでない内容はできるだけ最新情報に更新した。

CAS-UBの構成編集機能で、章の順序を、なんども入れ替えしたり、章を予定していたところを削除したり追加した。CAS-UBでは章・節番号、図番号などを、PDFやEPUBを作るときに自動的につける。記事順序の入れ替えや挿入・削除をしても文中の番号を付け変える必要がないので便利である。

内容の仕上げ

2015年11月から12月末までにかけて推敲・校閲して仕上げた。Redmineというプロジェクト管理システムに、書記方法や用語統一のための項目・用語一覧表を作った。最後に、まとめてCAS-UBの検索・置換機能で作業した。検索・置換は誤って不要な箇所まで置換してしまう危険がある。そこで、作業後の推敲を行った。

  • 漢数字とアラビア数字の使い分け見直し
  • 原語で末尾がer、or、arで終わる単語は長音符号(ー)で終わるように
  • 「・」の使用。2語は原則として中黒無し
  • 箇条書きの末尾には読点を付けない
  • カタカナ語と和文語を統一
  • 全角・半角(括弧、数字、ラテンアルファベット)
  • 英単語間の空きは半角スペースにする
  • 送り仮名の付け方統一

文章の推敲は、説明の重複部分を削除し、また説明文が分散しているとき、できるだけ一箇所にまとめた

索引

書籍の性格上索引が重要なので、索引の作成は索引を専門としている外部の方に協力いただいた。索引語は最終的に約600語、750箇所と充実した。CAS-UBでは、通常の索引の他、親子索引、兄弟索引のマークアップができる。索引の頁はプログラムで自動生成するので、索引語として拾う語を増やしたり減らしたりするのは自由自在である。

(続く)

[1]アメリカで電子書籍の売上が大失速!やっぱり本は紙で読む?
[2]改訂版の公開経過
[3] 『本をコンピュータで作る』のは、いま、どこまでできる?
[4] 『本をコンピュータで作る』のは、いま、どこまでできる? (2)紙の本と電子の本をワンソースで作りたい
[5] 『本をコンピュータで作る』のは、いま、どこまでできる? (3) 電子テキストは印刷ではなく、音声の暗喩と見る方が良い
[6] 『本をコンピュータで作る』のは、いま、どこまでできる? (5) 『PDFインフラストラクチャ解説』のプリントオンデマンド制作と販売

『本をコンピュータで作る』のは、いま、どこまでできる? (2)紙の本と電子の本をワンソースで作りたい

『本をコンピュータで作る』のは、いま、どこまでできる?の続きです。前回は紙の本と電子の本を同時に作りだすのが目的とお話しました。

紙の本と電子の本を、コンピュータで作るならば、コンテンツを1回作成したら両方の形式を自動的に作りたいと考えるのは自然です。つまりワンソースマルチユースの実現が課題となります。

ワンソースマルチユースについて考えてみます。主に、CAS-UBや電子出版の関連プロジェクトに5年ほど取り組んだ経験から、最近は、次のように考えています。

紙の本と電子の本には本質的な相違がある (そんなのはあたりまえだろ! って?)

紙の本と電子の本を完全にワンソースで作るのは不可能です。可能なことを示すには、実際にやってみる必要がありますが、不可能なことを示すのはできない例を示せばよいので簡単です。

できない例を幾つか示してみます。簡単で判りやすい例から行きます。

1.まず、表紙についてはどうでしょうか。

紙の本は、本文を綴じたうえに包みのカバーをかけます。カバーは表表紙、裏表紙、背表紙から構成します。しかし、電子の本には背表紙はありえません。なにしろ厚さがないのですから。紙の本の表紙は、飾りだけではなく、本文の紙を保護したり、手にもって開いたり読んだりするために有用です。その点、紙の本には裏表紙は欠かせませんが、また、電子の本に裏表紙を付けることは意味がないでしょう。

表表紙も違います。紙の本では表1、表2(通常は白)があります。電子の本では、表1だけは紙の本と類似にする意味があります。表2はあまり意味がありません。

2.紙の本は、表紙以外にも伝統的な構成、つまり、本扉、前付、本文、後付という大構成、さらに細分化すると、前付は前書、目次、献辞、権利(英語の本)といった構成があります。

この構成について、電子の本を紙の本と同じ構成にするかどうか? このあたりはまだあまり議論がなされていないように思います。もし、構成を変える方が良いということになりますと、ワンソースではできないことになります。

最近、『PDFインフラストラクチャ解説』という本をCAS-UBでプリントオンデマンドとKindleで発売しました[1]。この本のKindle版には図表一覧があります。しかし、POD版は図表一覧は省略しました。販売価格を抑えるためページ数を減らして、コストを抑えたのです。

紙の本はページ数に応じてコストが増えるのですが、電子の本はその心配がありません。このように紙と電子ではコスト構造が違いますので、電子の本で一部を省略したり、入れ替えることは十分合理的です。

3.レイアウト依存の内容があります。ひとつの例は、見開きのページでしょう。

見開きページは、紙という固定サイズをもつ用紙を左右の中央で綴じたメディアで意味があります[2]。電子の画面に見開きという概念は存在しないのではないでしょうか。見開きは単に大きな画面ではないでしょう。

本文がすべて見開き単位でレイアウトされているのであれば、紙の見開きページを電子の1画面に対応つけることになるでしょう。こうしたときは関係はシンプルです。

リフロー形式の本で、大きな画像ページが見開きになっているときは、紙のページと電子の画面では、テキストと画像の位置対応関係が難しくなります。テキストの流れの中の画像の位置と、紙にレイアウトして見開画像のページを挟んだときとでは、テキストの流れと画像の位置の相対関係が変わります。

こうしたとき、ワンソースで紙と電子で最適な本を自動的に作りだすのは、それなりのアルゴリズムが必要です。

4.3項と前後しますが、ページという概念の紙と電子(画面)での違いは、本質的です。

次回は、この点をもう少し、考えてみたいと思います。(「『本をコンピュータで作る』のは、いま、どこまでできる? (6) 紙のページと電子の画面の違い」をご参照ください。)

[2]上下で綴じた場合も見開きというのかどうかは、まだ調べていません。