Wordに埋め込まれたイメージ画像の解像度はどうなるか?

Microsoft Wordで原稿を書くとき、イメージ画像(イメージ)をWord文書の中に埋め込むことが多い。そのWord文書をCAS-UBに取り込んで、特にPDFを生成してプリントオンデマンド(POD)で印刷本にするとイメージの解像度が低くてぼやけてしまう経験がある。こうしたイメージはできればベクトル図形にするべきだが、画面のスナップショットなどはそうもいかない[1]

PODで本を作るときなど、これは大きな問題なので対応策を考える必要がある。

そこで、Wordに埋め込まれたイメージの解像度の扱いについて調査してみた。なお、以下の調査結果は次の条件による。
・PNG形式とJPEG形式についての調査結果を説明する。以下の調査結果は、JPEG、PNGとも共通である。
・Wordのバージョンは2013(32ビット)、動作環境はWindows10(64ビット)で調査した。

なお、解像度は縦横のピクセル数(px)とインチあたりのピクセル数(ppi)という2つの意味で用いているので注意(参考資料[2]を参照)。

Wordに埋め込まれたイメージの解像度の扱いは、Wordの内部でのイメージの持ち方に依存する。Office Open XML(OOXML)[3]でWordの内部のイメージはVMLのシェープ形式(旧形式)またはOOXMLのシェープ形式(新形式)のどちらかである。

(1) Wordの編集の画面に、イメージファイルをドラッグ&ドロップするとイメージは旧形式として保存される。
(2) イメージファイルをコピーしてWordの編集画面にペーストするか、Wordの「挿入」の「画像」で表示されるダイヤログでイメージを編集中の文書に挿入すると新形式として保存される。

Wordの「ファイル」「オプション」には、ファイル内のイメージの扱いについての設定がある(次の図)。この設定は新形式で保存されたときのみ有効である。

・「ファイル内のイメージを圧縮しない」にチェックがない状態(デフォルト)では、イメージの解像度は次の条件で圧縮される。
取り込んだイメージの解像度をZ0pxとする。
文書の中のイメージの幅をXmmに編集したとする。オプションで設定した既定の解像度をRppiに設定しているとき、その幅に入るイメージの解像度Z1pxは次のようになる。
Z1=X/25.4(mm/inch)*R(ppi)
Wordの中のイメージの解像度Zpxは、Z=min(Z0,Z1)

例えば、A4用紙(幅210mm)に左右各30mmの余白を設定しているとき、版面の幅は150mmである。150mmの幅は既定の解像度220ppiのとき、150mm/25.4*220=1299pxに相当する。

このため横幅がそれよりも大きい解像度のイメージは圧縮される。横幅は1299よりも小さい解像度のイメージはそのままの解像度でファイルに保存される。厳密には多少の許容範囲があり、例えば横幅1300pxのイメージは圧縮されない。

もし、Wordの編集画面でイメージの表示幅を55mm設定にして保存すると、元のイメージの解像度が55mm/25.4*220=477pxよりも大きなとき、477pxに圧縮されてしまう。
Wordで保存したファイルには圧縮された画像だけが保存されるので元に戻せない。

・「ファイル内のイメージを圧縮しない」にチェックすると、Word上でのイメージの表示幅にかかわらずイメージは圧縮されない。

イメージの解像度をWordに勝手に変更されたくない場合は、「ファイル内のイメージを圧縮しない」にチェックしておく必要がある。

なお、ドラッグ&ドロップで配置したイメージは旧形式となるが、旧形式に対しては、「ファイル」「オプション」の、ファイル内のイメージの扱いについての設定は影響を与えない。つまりドラッグ&ドロップで配置したイメージはWordの編集でサイズを表示サイズを変更しても影響を受けない

旧形式で保存されるイメージを圧縮するには、イメージを選択して表示される「図ツール」「書式」タブの「図の圧縮」ボタンをクリックして表示される「図の圧縮」ダイヤログで設定する。

【参考】
1.『XSL-FOの基礎』画像制作のこと。Word経由でインポートした画像は印刷品質の劣化が激しいため、第2版ではできるだけSVG形式に変更した件。
2.解像度とは
3.Office Open XML(OOXML)

関連記事
1. Office Server Document Converter Word文書(docx文書)に埋め込まれたイメージ画像はどのように扱われているか
2. Wordに埋め込まれたイメージ画像の解像度はどうなるか? Word2019の場合

本はWeb化するか? (続き)Webアプリケーション化したオンライン版の本 vs シンプルなHTML+CSSの本

先日、姉妹ブログサイトに「本はWeb化するか? PDFとブック型WebページとEPUBを考える」で、本の中には技術や考え方の啓蒙・普及を目指すタイプがあり、こうしたタイプの本はWebページで提供すると大変便利と述べました。CAS-UBの次バージョンでは、本のWebページ版生成機能をより強化したいと考えています。今日は前回のブログの続きとして本のWeb化について考えてみます。

購読モデルのオンライン本
一冊の本の内容を全部そのままWebページとして提供する例を幾つか示します。まだあまり一般的ではないようですが、探せばもっとたくさん見つかるでしょう。

米国のO’Reilly MediaのSafari Books Onlineは2001年創業で、2014年にO’Reilly Mediaの傘下にはいりました。Webページとして提供する本の草分けといえるでしょう[1]

『Chicago Manual of Style』は100年以上の歴史をもつ、編集者のための制作ガイドです。最新は2010年発行の16版です。15版と16版はオンライン化されています[1]

それから同じ版元の『Science Style and Format』[3]も全文がオンラインで提供されています。

こうしたオンライン本は無料公開ではなく、購読制のビジネスモデルを取っています。ここで紹介したような本を作るのは非常に大きな時間と労力がかかりますし、内容をアップデートする作業も大変です。購読制にしないと維持できないということはよく理解できます。

無料モデルのオンライン本
一方、Webページ版を無償で公開している本もあります。『Web Style Guide』は、プリント版は第4版ですが、第3版以前は全文がWebページとして無料で公開されています[5]。第4版も作業中ということですので、いずれは全文がWebページとして公開されるのでしょう。

第4版を紙で出版したのは、2016年夏です。まだ作業中って随分のんびりですね。CAS-UBを使えば紙版と当時に(ボタンを押すだけで)Webページ版もできるのですが。それとも全文公開すると紙が売れなくなるので、わざとのんびりしているんでしょうか? 

本のWebアプリケーション化
購読制・有償・無償というビジネスモデルとは別の側面として、本のWebアプリケーション化という観点があります。

現在のWebプラットフォームは、JavScriptを使って対話的な操作を付けるのが流行です。「2012年8月時点で、上位100万件のWebサイトのほぼ半数でjQueryが使われているとの推計があります」[6]とのことですから、現時点では恐らく上位Webページの大多数にjQueryが組み込まれていると思われます。これによりメニューのプルダウンやアコーディオン表示などを行います。特にレスポンシブなWebページをモバイルで表示するときはメニューを畳んでおいてタップで開くという対話的表示が有効です。

オンライン版の本については、特に目次のアコーディオン表示が典型的な応用です。大きな本では、章と節の2段階目次でも100項目を超えることもありますから[7]、アコーディオン表示が便利です。但し、階層が深いと操作の繰り返し回数が多くなりますので注意が必要です。

さらに、『Chicago Manual of Style』と『Science Style and Format』のオンライン版(CMSO・SSFO)は、コメントの記入やしおり設定ができるようになっています。

ナビゲーション機能・目次機能も含め、全体としてみますと、CMSO・SSFOは、それ自体が、EPUBリーダーやKindleなどの電子書籍アプリ並の機能をもっています。CMSO・SSFOのWebページはホスト型Webアプリケーションになっているとも言えます。

シンプルなHTML+CSSによるオンライン本
一方で『Web Style Guide』のオンライン版は、HTML+CSSで作られた静的なWebページです。また、本ではないですが、米国で2008年から続いているXMLカンファレンスである「Balisage」の講演録のシリーズは、HTML+CSSのみで記述されたトラディショナルかつ静的なWebページです。こうした静的なWebページは現時点では非常にレガシーな印象を受けます。

未来の本
本のWebページ化は、ここで紹介したようなガイドブックなどの実用的なものが先行しながら、今後着実に進んでいくことでしょう。

では、本をWebページとして作るとき、jQueryを初めとするJavaScriptを多用することについてどういう方針とするべきでしょうか? これは大きな問題です。本をWebアプリケーション的に作ろうとすれば、必然的に制作コストは大きくなります。もっと大きな問題はメンテナンスコストです。何百点、何千点もの本をアプリケーション的にしてしまうと、そのメンテナンスコストが膨大になることは避けられないでしょう。

JavaScriptがWebサイトで多用されるようになってから経過した年月と、その間の変化の激しさを見ますと、本のような多品種ジャンルでアプリケーション化を推進するのは躊躇したくなります。一方で、現在のWebプラットフォームは、HTML+CSS+JavaScriptが基本となり、ますますリッチな表現と便利な機能を備える方向に向かっています。そうしますとレガシーなWebページとして表現された本には魅力がなくなる可能性があります。

このあたりは思案しどころです。

[1] Safari Books Online
[2] Chicago Manual of Style Online
[3] Science Style and Format Online
[5] Web Style Guide
[6]『モダンWeb』(Peter Gasston著・牧野聡訳、オライリー・ジャパン、2014年発行)
[7] 例えば、『PDFインフラストラクチャ解説』は章・節を目次に掲載しており、目次項目は延べ122です。
[8] BalisageのProceedingsページ

■関連記事
「ワンソースマルチユースで拓く、ブック型Webページの未来」(2回のブログをまとめて整理し直しました)

【お詫びと訂正】
最初に公開した文章に下記の記述がありましたが間違いでした。訂正致します。
「米国の大学で使われる研究レポートの書き方についてのガイドとして有名な『AMA Manual of Style』も全文オンライン化しています[4]

[4] AMA Manual of Style
正しくは、
「米国の大学で使われる研究レポートの書き方についてのガイドとして有名なのは、『MLA Handbook』(Modern Language Association刊行)です。こちらは、紙版の他にKindle、Apple、等で電子版を販売していますが、Web版はありません。」

申し訳ございません。

『XSL-FOの基礎』画像制作のこと。Word経由でインポートした画像は印刷品質の劣化が激しいため、第2版ではできるだけSVG形式に変更した件。

『XSL-FOの基礎』は初版は2016年5月に初版をリリースしましたが、今回は大幅に改訂して第2版となります。改訂の一部として、多くの画像をラスターからベクトル(SVG形式)に変更しました。以下、このことを少し説明します。

本書にはXSL-FOのオブジェクトとプロパティの説明の一部として組版結果の紹介をしています。例えば、こんな感じです。

組版結果はPDFです。初版では、組版結果の多くはPDFを表示して画像スクリーンキャプチャしていました。最初のうち原稿をWordで書いていましたので、スクリーンから切り取ってWordに貼り付けていたものもあります。原稿のWord文書をCAS-UBで取り込んだとき、このラスター画像もCAS-UBに取り込まれます。途中からはCAS-UBで原稿を直接書いて編集しましたので、スクリーンをキャプチャしてPNGファイルとして取り込んだものもあります。初版の画像制作は、主に次のようなフローになります。

こうした画像を画面で見ている限りでは、それほど見栄えに差がないのですが、プリントオンデマンドで紙に出力しますと画像の品質の差が歴然となります。Wordに貼り付けて(CAS-UBのWordインポートで)CAS-UBに取り込んだ画像は品質が非常に悪くなります。一方、PNGファイルをCAS-UBに取り込むときは、印刷したときの画像の品質はPNGの精度(ピクセル数)次第です。特に、文字がはいっているような画像は品質が低いと問題があります。

ということで第2版ではできるだけPDFからベクトル画像(SVG)を作ることにしました。SVGを作る方法はいろいろあると思いますが。今回は自社開発のPDFビューアのSVG切り出し機能を使いました[PDF加工画像化ツール]。この操作は次のようになります。


図1 PDFを開く


図2 SVGにしたい範囲を選択


図3 SVG形式で保存

SVGにした画像はPNG形式も用意しています。PDF生成時はSVG形式を使い、EPUB生成時にはPNGに差し替えるようにしました。残念ながらKindleではSVGを正しく表示できないことがあるためです。

SVGからPNGへの変換は「置換」機能を使います。

複数の画像ファイルを用意しておき、出力形式によって画像を使い分ける機能はCAS-UBのWeb制作サービスの中に取り込んでいきたいものです。これは次のバージョンアップの課題の一つといたします。

参考資料
1. 技術書典2と『PDFインフラストラクチャ解説』第1.1版、『XSL-FOの基礎 第二版』のご紹介
2. 『XSL-FO の基礎 – XML を組版するためのレイアウト仕様』
3.Wordに埋め込まれたイメージ画像の解像度はどうなるか?
4. Office Server Document Converter Word文書(docx文書)に埋め込まれたイメージ画像はどのように扱われているか
5. Wordに埋め込まれたイメージ画像の解像度はどうなるか? Word2019の場合

本のかたちを考える Webページのシリーズ

www.cas-ub.com で、今年から、本を考えるというテーマで、シリーズのWebページを作っています。全体としてのテーマは本の編集・制作・流通にコンピュータを使ってどのような技術革新ができるかということです。本による出版は、デジタル化の波に洗われて、大きな変貌の過程にあります。あと何年あるいか何十年続くか今後の展望が見えないところですが、根本的に考えなければならないところです。本Webページは毎週1回更新しています。個別ページは断片的にはなりますが、全体としてテーマに肉薄できればと期待しています。結論が見えていないのですが、今後の進展にご注目ください。

ブログと違ってWebページの方がやや全体の構成考えてまとめやすいかなと思っています。下に現在までのWebページと概要をご紹介しますので、興味をお持ちの方は覗いてみてやってください。よろしくお願いします。

流通によるプリントオンデマンドでの出版が現実のものとなった今、その活用の課題を考える。
プリントオンデマンド(POD)は印刷技術の革新ですが、これを製本システムと合体すると本を自動的に生産するシステムとなります。さらに、こうした仕組を使って本の流通をになう書店やオンラインストアがPODで本を作るようになってきました。本の流通における大きな革新が始まったといえます。PODの場合は、紙が前提になりますので、制作という点では今の延長で、流通の面での革新です。

ワンソース・マルチユース実践の難しさを考える
ワンソース・マルチユースはもう随分長いことスローガンとして使われて手垢がついた言葉となっています。しかし、実際のところ、広く普及するには至っていません。どこに難しさがあるかを考えています。ワンソース・マルチユースは編集という点でも課題があります。

本のかたちを考える―その1
本とはなにか? を大枠で考えました。このHTMLページは抽象的なので、もっと考え直す必要があるかと思っております。

本のかたちを考える―その2 ページって何? 「ページ」と本のかたちとの関係
日本語でのページということばが使われるようになった由来、英語のページの概念を考えてみました。明治時代に洋装本で出版が始まるまで、日本にはページという言葉がなかったと思いますが、その理由も考えてみました。紙でも電子でもページという言葉が使われるのですが、今後はページという言葉の使い方も変わるかもしれません。

本のかたちを考える―その3 主にプリントオンデマンドの本を想定したときの本の大きな構造
主に紙に印刷して製本した本の構造を整理しています。紙に印刷した本の製本の仕方にはいろいろあります。書店で売っている本は流通での取り扱いや、書店での陳列を考えて作られています。PODで作り、オンラインで販売する本はそれと比べるともっと簡素です。POD用の本には少なくとも帯は要らないと思うのですが。

CAS-UBによる本の制作工程の実例:「ECMJ流! Eコマースを勝ち抜く原理原則 シリーズ」編集・制作作業(上)
CAS電子書籍の「ECMJ流! Eコマースを勝ち抜く原理原則 シリーズ」の制作実践の報告です。(上)はプロジェクトの狙い、概要、編集の方法を整理しました。

CAS-UBによる本の制作工程の実例:「ECMJ流! Eコマースを勝ち抜く原理原則 シリーズ」編集・制作作業(中)
続いて(中)では、CAS-UBによる本の中身作り=内容の編集操作を紹介しました。

CAS-UBによる本の制作工程の実例:「ECMJ流! Eコマースを勝ち抜く原理原則 シリーズ」編集・制作作業(下)出版までの処理
続いて(中)では、CAS-UBによる本の中身作り=内容の編集操作を紹介しました。

参考リンク
デジタル書籍制作Webサービス CAS-UB
「ECMJ流! Eコマースを勝ち抜く原理原則 シリーズ」

ページって何? 「ページ」と本のかたちとの関係、「ページ」と「頁」の関係、ブラウザと電子書籍の未来

英語のPageとは?

西洋の古い図書の形式には、コデックス(冊子状)とスクロール(巻物状)があり、いずれにもページという言葉が適用されています。コデックスのページは現在の洋装本(洋本)のページと似ています。それに対してスクロールは羊皮紙・パピルスのシートをのりで貼ったり、端を糸で縫って左右につなげたもので、そのシートをパネルまたはページというようです(この部分は現在のWikipediaの記事によります。古代にも同じように表現していたかは分かりません)。

Scroll(Wikipedia)
A scroll is usually divided up into pages, which are sometimes separate sheets of papyrus or parchment glued together at the edges, or may be marked divisions of a continuous roll of writing material.

Scroll(聖書)A scroll is usually divided up into panels, which are sometimes separate sheets of papyrus or parchment glued or stitched together at the edges.
Introduction to biblical studies. James E. Smith, Ph.D, 2013

Wikipediaの資料にでているスクロールの写真では、文字はページの上に横書きされており、そのページを左右につなげています。

左右に巻き取る芯があり、横方向にスクロールする巻物の上に横書(行は上から下に進む)の文字を書くので、必然的にページに区切ることになります。ここから、英語のページは、図書の装丁あるいは本のかたちから独立した概念のように見えます。

日本語の「ページ」

『言葉に関する問答集 総集編』(文化庁編集、2015年11月16日版、全国官報販売協同組合発行)のpp. 476~477によるとページが日本で使われ始めた時期については、次のように書かれています。

・ヘボンの『和英語林集成』の初版・再版は「ページ」の見出しがなく、明治19年刊の第三版に至って「PEIJIペイジ」としてある。
・明治22年1月の『言海』の予約募集に「紙数、概算一千ページ」とある。
・新聞広告でも明治21年の書物の広告でページという言葉が使われている。
・明治22年から明治31年刊行の国語辞典の見出しにはページという言葉はない。
・明治41年刊の『ことばの泉 補遺』には見出しに「ぺえじ」とあり、以降、見出しはページになったが、現在まで辞書の見出しにページが出ている。

これから見ますと、ページという言葉は、明治20年過ぎ頃から出版界で使われはじめて、明治40年頃迄に辞書の見出し語になる程度まで一般に普及したようです。

ちなみに、『新しきことばの泉』(小林花眠著、博進館、大正10年)p.1163には次のようにありました。

見出し語:ページ、Page(英)
説明:頁。書籍・帳簿などの紙の片頁。頁刷(ページずり)といふは活版で、棒組み一定框に入れて、頁に刷り得るようにしたもの。頁附(ページづけ)といふは、ページ数を記しつけること。これを丁附ともいふ。

「頁」と「ページ」

『言葉に関する問答集 総集編』には、「ページ」を「頁」と表記することについて、次のように書いてあります。

・『言海』の内容見本明治24年のものには、「洋装大本紙数一千二百五十頁」として、「ページ」が「頁」に変わっている。
・他の書物も明治21年のものは「ページ」が使ってあり、明治23年以降は「頁」が圧倒的に多い。
・昭和21年内閣告示の「当用漢字表」、昭和56年内閣告示の「常用漢字表」には「頁」がない。従って、国語施策に従うときは、「頁」ではなく、「ページ」を使う。
・実際は現在でも書物の広告や内容見本には広く「頁」が使われている。

「頁」という文字をあてた理由は定説がないのですが、葉と中国語の発音が似ていたからという説が「新明解漢和辞典」に紹介されています。

ここから分かることは、ページという概念は、日本では明治の初め頃に洋装本が販売されてから広まったものであり、和本にはページに相当する概念はなかったのだろう、ということです。

以上を整理して、図に表すとこんな感じでしょうか。

20170204

和本にページに相当する概念がなかった(仮説ですが)ことには、二つの理由が考えられます。

(1) 巻物は横スクロールに縦書き(左から右に行が進む)していたので特に区切りが必要なかったこと
(2) 和本では1枚の和紙の片面に木版で刷ったり、あるいは手書きで書いて、それを二つに折って綴じていた。そのため洋装本のように紙をシートとして裏表を使うという発想がなかった。

現在の話に戻りますと、現在Webブラウザはページに区切る機能は弱いようです。これは、横書き文書を縦スクロールで表示するときは、行の進行方向とスクロールする方向が同じなので、ページに区切る必要性が小さいためでしょう。日本に昔はページの概念がなかった(仮説ですが)のと似ていませんか?

ところで、現在、ブラウザで縦組みができるようになりつつあります[1]。現在、ブラウザの縦組は横スクロールです。ブラウザで縦組みし、縦スクロールしようとすると、次の図のようにページに区切ることが必須となります。

20170205

CSSレベル3にはページドメディアという仕様案があります[2]。これはまだドラフトです。電子書籍(リフロー型EPUB)のページ区切りは、それぞれのEPUBリーダーの独自実装であり標準化されていません。

今後は、ブラウザや電子書籍でのページをもっと考えて行く必要がありそうです。

【参考】
次の写真は、古本屋で1冊200円で購入した和本(奥付には、安政4年(1857年)となっています)をバラした1枚の和紙の表と裏です。

20170205a
20170205b

和紙は薄いので文字が裏まで透けてしまいます。しかし、160年前の和紙が虫に食われているところを除けばあまり劣化していないのは驚きです。

『和本のすすめ』(中野三敏、岩波新書、2011年)によると江戸の本では、この1枚を「丁」というそうです。右は丁のオ、左は丁のウと言い、一ノオ、一ノウという風に数えていくそうです。従って、江戸の冊子本ではページという概念はなかったと言えるでしょう。

[1] CSS Writing Modes Level 3 W3C Candidate Recommendation, 15 December 2015
[2] CSS Paged Media Module Level 3 W3C Working Draft 14 March 2013

★本ブログの内容をもう少し整理して、次のWebページとしましたので、ぜひご一読ください。
本のかたちを考える ― その2 ページって何? 「ページ」と本のかたちとの関係

★ページに関連する過去記事の一覧
[1] ページってどういう意味? 紙のページ、Webページ (memo)
[2] ページってどういう意味? 続編 Kindleの紙の本の長さと、KENPについて
[3] Kindle Unlimited問題とKENPの関係について(続き)
[4] Amazonでは本のページの数え方が三つある。Kindle Unlimitedは第三のKENPで著者への支払いが行われ、KENP相場が基準になる。
[5] ページっていったい、どういう意味なんだろう? ――Webページ

索引について―階層化索引を簡単に作る方法を考えました。

前回[1]は、主に索引の目的について考えてみました。

今回はちょっと実践的に、ECMJ流!のシリーズの制作の際に階層化索引を簡単に作る方法を考案しましたので、それについてご紹介します。

階層化索引というのは例えば次のような形式です。この例では親階層が「Eコマース」、「Eコマース革命」です。その子供の索引として「大企業のEコマース」、「中小企業のEコマース」などがあります。Eコマースが共通ですので、表示を簡素化するためダッシュで代替しています。

○PDFのとき巻末に索引を自動生成し、ページ番号から本文の索引語位置への内部リンクを設定
20170131

○PDFのとき巻末に索引を自動生成し、索引語または(複数箇所あるとき)索引語のカウンターから本文の索引語位置への内部リンクを設定
20170131c

CAS-UBの編集画面には簡単な索引を作る対話式のダイヤログがあり、これを使えば1階層の索引を簡単につくることができます[2]

残念ながら、現在のところ、編集画面のダイヤログでは階層化索引を作ることができません。そこで、CAS-UBの編集画面で手入力でCAS記法のマークアップすることになります。

CAS記法のマークアップの説明はこちら:CAS記法リファレンス

親子の索引は本文に次のようにマークアップします。
[[[:mindex [[[:prim:key=xxx 親の索引語]]][[[:second:key=yyy 子供の索引語]]]]]]
xxxに親の索引語の読み、yyyに子供の索引語の読み

しかし、どうもまだるっこしいので、テキストファイルとして索引を用意する方法を考えてみました。

上の図の例の索引を作るには、次のようなテキストファイルを用意します。

[[[:nodisp:mindex [[[:prim Eコマース]]][[[:second:key=だいきぎょうの―― 大企業の――]]]]]]
[[[:nodisp:mindex [[[:prim Eコマース]]][[[:second:key=ちゅうしょうきぎょうの―― 中小企業の――]]]]]]
[[[:nodisp:mindex [[[:prim Eコマース]]][[[:second パソコンでの――]]]]]]
[[[:nodisp:mindex [[[:prim Eコマース]]][[[:second モバイルでの――]]]]]]

[[[:nodisp:index:key=Eコマースかくめい Eコマース革命]]]
[[[:nodisp:mindex [[[:prim:key=Eコマースかくめい Eコマース革命]]][[[:second:key=――いこうの2ねんかん ――以降の2年間]]]]]]

(:nodispは索引語をPDFとEPUBの本文に表示しないという指定です)

それで索引語検索して、ヒットしたところに、索引のマークアップを貼り付けていきます。こんな感じです。

(1)「大企業のEコマース」を検索します。
20170131a

(2)ヒットした中で索引を付ける箇所を選択します。この場合は(9,76)の位置に付けますので、(9,76)をクリックします。

(3)すると編集画面で(9,76)の位置にジャンプします。テキストファイルから

[[[:nodisp:mindex [[[:prim Eコマース]]][[[:second:key=だいきぎょうの―― 大企業の――]]]]]]

をコピーして、索引語の前に貼り付けます。

(4)貼り付けた結果は次の図のようになります。

20170131b

(5)PDFとEPUBを作成すると索引のページが自動的に作られ、索引の各項目から本文へのリンクが設定されます。本文の索引語が非表示でもリンク先としては有効ですので、索引のマークアップは索引からジャンプしたい箇所に設定して置くのが良いです。

[1] 索引論再訪ー索引の目的とは。索引をどうやってつくるか?
[2] 1階層の索引の作り方は、動画とブログで紹介しています。動画とブログは下記の過去記事をご覧ください。

CAS-SUPPORTブログの索引関連その他の過去記事
[1] CAS-UBの編集デモ動画 新ファイル : 索引を追加する
[2] EPUB・PDFで索引や親子索引を作るためのCAS記法の例
[3] CAS-UBではEPUBに索引を自動的に出力できます。
[4] 索引の作り方を考える。一歩進んで、本文に出てこない索引語や、索引語の階層化の試み。

CAS-UBによる本の制作工程: ECMJ流!  巻末に出典記事のリストを作成する例のご紹介 

ECMJ流! Eコマースを勝ち抜く原理原則を編集中です。

昨年の10月頃から初めて4巻までは既にリリース済み[1]。昨日までに5巻目が大方できました。現在、著者に幾つか不明点を問い合わせていますのでそれが決着すれば完成です。

5巻目は、人財育成とか仕事の仕方とかに関係する記事を整理しています。記事を各巻にどのように割り当てるか、どのように章建てするかとか、節の並び順の整理とか、用語の統一、言い回しの統一など細かいことを直すのに、文章を平均すると3回くらいは読んでいます。内容に感心することが多い!

5冊目はあまりEコマースのテクニカルな話が出てこなくて考え方に関する内容です。著者の石田麻琴さんは1980年生まれですので、まだお若いのに、考え方には私が師と仰ぐ稲盛 和夫(盛和塾)塾長とかなり通じるところがあります。つまり哲学があるということなのですが。第5巻はお勧めです。

さて、前置きが長くなりましたが、第5巻の本文を編集し終わり、索引を作ろうという段階で、はたと困りました。この巻は考え方に関する記事が多いので索引の作りようがないような気がします。もちろん無理して用語を拾って索引を作ることはできますが、そもそも記事を丸ごと読まないとあまり意味がありません。用語単位で拾う索引はそれほど意味がないような気がします。

本書の章建ては次のようになっています。
20170117-mokuji

第1章は次のように24本のブログ記事から構成されています。
20170117

そうしますと記事単位で読み直したいときに、目次からその記事を簡単には探せません。CAS-UBでは目次の生成時に、章だけにするか、節までにするかなどのレベルを設定できます。仮に、節まで目次に出しますと次の図のようになります。

20170117-mokuji-2

これでは、目次の項目が多すぎて全体像をつかみにくくなります。

そこで、参考文献の形式で元記事(出典ブログ)のリストを作ることにしました。

次のようにします。
1)参考文献を用意します。これは、新規記事作成で、「記事の種類」に参考文献を指定します。

20170117-reference

2)参考文献にブログの一覧をテキストで入力します。
これは元のエクセル表からでも良いですし、節まで出力した目次からテキストをコピーして貼り付けても出来ます。

3)各項目に箇条書きに指定します。次の図の行頭「*」が箇条書きのマークアップです[2]

4)参考文献の項目から本文の節へのID参照を設定します。
・CAS-UBでは各記事、見出し、キャプションには自動的にIDがふられます。
・ID参照メニューで、そのIDの一覧を表示します。
・参照元にID参照を設定します。ID参照設定は図のアンダーラインです。

20170117-id

5)ブラウザで内容表示しますと次のようになります。

20170117-preview
収録ブログ一覧の各記事から節へのリンクが張られていることが確認できます。

6)PDF生成時に、このリンクをどのように表示するかは、「PDFレイアウト詳細設定」の参照先表示方法で選択できます。ここでは参照先をページ番号だけにします。

20170117-ref-disp

7)PDF生成をしますと次のようになります。

20170117-final
参照先のページ番号が自動的に設定されます。デジタルデータとして使うときのためにPDFのリンクも設定されています。

本書は本文が二段組みですので、参考文献も二段組みにする方が良いかもしれません。

(1/31追記)
最終版では、参考文献を二段組みとしました。

1月31日にPODの本が届きました[3]ので、早速、写真にしてみました。次のようになっています。

20170117

[1] ECMJ流! Eコマースを勝ち抜く原理原則 シリーズ
[2] 参考文献では箇条書きが独自形式(固定)になっています。番号なし箇条書きの行頭の記号はなくて各行がハンギングインデントとなります。
[3] ECMJ流!Eコマースを勝ち抜く原理原則シリーズ第5弾 『Eコマース”売れる”チームづくりのポイント! ~着実に成長するための考え方、取り組み方~ 』発売になりました。
[4] アンテナハウス書籍・総合目録

CAS-UBによる本の制作工程: ECMJ流!  編集・制作作業の中途ふりかえり 

本企画の概要
目的
CAS電子出版の「ECMJ流!Eコマースを勝ち抜く原理原則 シリーズ」[1]は、ECマーケティング人財育成の石田社長が毎日書いているECMJブログ[2]を整理してプリントオンデマンド(POD)で本として出版するプロジェクトです。元のブログは2013年8月8日スタートから毎日更新されており、2016年6月18日に1000本に到達しています。POD本にする企画は2016年10月頃に決まり、現在は9月までの約1,100本を書籍の形式にすることに取り組んでいます。

Webページとして提供されているブログを原則として内容には手を加えずに、紙・電子書籍の形でも提供します。Webページは端末のディスプレイで読まれるものですので、POD本として紙にレイアウトした本とすることでディスプレイで読むよりは理解度が高まるでしょう。また、ブログの中で、飛び飛びに書かれている文章を一続きに整理することにも意味があると考えています。

ECMJ流! シリーズの構成

2016年9月までの1100本の記事はECMJサイトで大きくカテゴリーに分かれています(なお、このカテゴリーは2016年12月時点で刷新されましたので、現在は、当時とは異なっています。以下のカテゴリーは2016年11月時点のものです)。

編集・制作の工程
本書の編集・制作の流れは次のようになっています。

1.ブログ記事を仮に整理してPDFとして読む

(1) カテゴリーをベースにしてボリューム(巻)構成と章構成を仮に決めました。
(2) CAS-UBでは巻を1つの出版物として作成します。
(3) 各巻の章建てに従って、元のブログから記事毎にコピーして、CAS-UBにペーストして取り込みます[3]。元のブログ記事とCAS-UBの記事は1対1対応です。
(4) 各巻を仮に組版してPDFを作成、PDFをプリントアウトして目を通します。記事毎に何を言いたいかのポイントをEXCELに記入します。

2.ボリュームと章建ての見直し

前項のEXCEL表を見直し、記事の巻と章への割振を見直し、改めて各巻の章建てを決めました。

3. CAS-UBで、章建て-節建てを編集する

CAS-UBのアウトライン編集機能を使って、巻に章や節の追加をしたり、章や節の順番の入れ替えを行いました[4]。なお、巻の間の記事の入れ替えもあります。このときは、CAS-UBで2つの出版物を開いて行います。

20170113-outline

4. 各節の文章の編集

(1) ブログ特有の記述を書籍向けの記述に変更します。特に連載ものでは、ブログには「次回は」とか「前回はこちら」などのナビゲーション用リンクがあります。本にするときは続きものを連続して配置しています。本をページ順に読み進めてもらえば上述のナビゲーションは必要ありません。紙の本として違和感を感じないように、ブログ特有の書き方に関する部分はできるだけ無くします。
(2) 用字・用語の統一をします。用字用語は主に講談社発行『日本語の正しい表記と用語の辞典』を参考にしながら独自の規則も作成してエクセル表にまとめて処理しました。
(3) そのほか、各社のサービスの名前などを確認して正式表記に変更するなどの編集を行います。

5.POD本の本体版面

アマゾンのPODはページ当たりの印刷コストが2.5円であり、インクでの印刷と比べて高いため、ページ数の増加が販売単価アップに直結します。そこで、ページ数を減らすために判型を大きくしたいのですが、大きいと手にとってみたりするとき扱いにくくなります。扱い易さを考えると判型はB5判が上限ではないでしょうか。

小さくてハンディな判型とする方が持ち運びやすくて親しみ易いでしょう。しかし、小さくすると総ページ数が増えます。

本シリーズはそのバランスを考えて、1つ下のA5判に設定ししました。

縦組か横組かは迷うところです。一般に日本語の文章は縦組の方が読み易いでしょう、しかし、ブログ原文にはアラビア数字やアルファベットがかなり出てきます。また内容的にもビジネス書ということで横組としました。

PDFの版面は最終的に次のようになりました。なお、この版面レイアウトは一番最初に決めました。

・B5判
・横組二段組。章見出しは段抜き
・文字のサイズ 本文9ポイント。行送り15ポイント
・1行の文字数38。段間2文字(段内文字数:18文字/行)
・1頁の行数:33文字(1188文字/頁)

さらに1ページに出来るだけ多くの文字数を収録することができるように、文字サイズを9ポイントを小さめにします。二段組としたのは文字が小さめで、1行の文字数が多いので読み手が文字を追いかけるのに負担を感じないようにしたためです。

このレイアウトでは本文の先頭ページは次のようになります。

ecmj-books-5-0107_007

6.索引作り

本書の成り立ちはブログのため、同じようなテーマの文章が随所に現れます。本文を読み進める過程で、あとで振り返って確認したい用語などが出てくることがあります。そこで索引から内容を見つけられるようにする、ということが重要です。索引作りにつきましては、ブログで紹介しています。本書の索引作りについては、別途、紹介しました[5]

7. タイトル・副題の決定、ISBN

・書名(タイトル)、副題、ISBNなど書誌情報を決定して設定します。
・著者名、著者のプロフィール、発行元情報などはシリーズ共通です。
・CAS-UBでは共通項は新しい出版物作成のときに、著者名、著者プロフィール、版面レイアウト設定などは、既存の出版物の設定をコピーできますので新しく入力する必要はありません。最初の出版物で共通項を決めておくと効率が上がります。

8.タイトルページ・前書・目次・奥付

・タイトルページはカバーを開いたときの最初のページです。ノンブルは振られませんが総ページ数にはカウントします。タイトルページはCAS-UBで自動的に作成できますが、PODに出すPDFはタイトルページをデザインしたものに差し替えています。なお、タイトルページは必須ではありませんが、タイトルページがないと表紙を捲ると前書になりますのであった方が良いでしょう。
・前書は目次の前に配置します[6]
・目次は本文の章タイトルのみから作成します。章と節を目次にすることもできますが、本シリーズはブログの1記事を節にしているため節も目次項目とすると、目次の項目数が多くなりすぎます。
・章の番号は自動的に設定します。
・総ページ数が奇数になった場合、改丁を改ページに変更し、偶数にする調整を行います(必須ではありませんが、奇数ページでは無駄な空白ページが追加されるのでこれを避けるため)[6]

9. POD用PDFの生成

POD用PDFは5項のPDFの生成設定を元に「POD用PDF」ボタンで設定を作って保存するだけです。

10. カバーの完成

POD本では表ー背-裏に跨がって包むカバーが必要です。これは別途PDFを作成します。

次は第4巻のカバーの例です。
20170113-cover

11. POD登録データの作成

POD取次に提出する登録データ(エクセル表)を作成します。
特に重要なのは、次のことです。
・販売価格
・宣伝文

12.POD登録

POD取次に本体PDF、カバーのPDF、POD登録データ(エクセル表)を提出します。

13.EPUB生成

CAS-UBではEPUB生成のホタンがあり、そこでEPUB生成の設定を指定してEPUBを生成します。Kindleのmobi形式を作ることもできます。これも最初の出版物で決めておけば2冊目から同じ設定でEPUBを作れます。

14.Kindle登録

できあがったEPUBまたはmobiをAmazon KDPに登録します。
KDPでは、セレクト(Kindle独占、ロイヤリィティ70%)を選択するか、非独占(35%)にするかを選択します。
セレクトを選択すると自動的にKindleアンリミテッドの対象となります。
セレクトの期間は3ヶ月間でその間は変更できません。デフォルト(既定値)では自動延長になっていますので注意してください。

まとめ

振り返ってみますと、CAS-UBを使えば、ECMJ流!シリーズのような簡単なレイアウトであれば、POD用PDFの生成と、Kindle用EPUBまたはmobiの作成はほとんど手間がかかりません。

生産性を上げるとしますと1~4項となります。これは結構労働集約的なので、今後、ソフトウェアによる支援を検討しないといけない工程です。

参考資料
[1] ECMJ流! Eコマースを勝ち抜く原理原則 シリーズ
[2] 株式会社ECマーケティング人財育成
[3] 取り込みの様子例を説明する動画を作りました:
ブログの記事を出版物の記事にする(タイトル、本文をコピー、本文に見出し)
ブログの記事を出版物にコピペ。見出し・箇条書きのマークアップ。段落先頭の空白を削除)
[4] アウトラインの編集例を説明する動画を作りました:
章の最後に、新しい記事で節を追加し、節の位置を移動する
節の直後に新しい節(3本)を挿入、ブログの記事をコピー&ペーストする
[5] 索引作りの説明
索引論再訪ー索引の目的とは。索引をどうやってつくるか?
索引の作り方を考える。一歩進んで、本文に出てこない索引語や、索引語の階層化の試み。
[6] 前書をWordで作って追加する例を説明する動画を作りました:本文と目次の前に前書を追加。Word文書で作成した「前書」を追加する
[7] 索引を改丁から改ページに変更する例の動画を作りました:PDFの総ページ数が奇数となった。索引が改丁で開始・前に空白頁があるので、索引の開始を改丁から改頁に変更する

索引論再訪ー索引の目的とは。索引をどうやってつくるか?

先月(2016年12月11日)索引についてのブログを書きました[1]。これは、「ECMJ流Eコマースを勝ち抜く原理原則 シリーズ第三弾」の索引作りに際していろいろ考えたことをまとめたものです。本書は12月中旬に『今日からできるEコマースの集客戦略!: ~広告予算がなくても、アクセスは伸ばせる~』として無事発売されました[2]

さて、今度はシリーズ第四弾の索引作り中です。シリーズ第四弾はほとんど編集完了して、現在、索引の調整を中心に最終調整中です。タイトルは『Eコマース「勝者の秘訣」はデータ活用にあり!~「データをとって毎日改善」を繰り返そう~』です。発売されましたら、ブログなどでご紹介しますのでしばらくお待ちください。なお、アンテナハウス書籍・総合目録には出版済みのすべての本を紹介していますので、関心をお持ちのかたはぜひチェックしてみてください。

さて、索引についてまた考えてみます。

索引の目的は

これは前回も書きましたが、第一は用語や固有名詞について本文中にでてきた場所を示すですが、これが索引の一般的用法でしょう。
・こんなことが書いてあったな? どこにあったかだろうか? と思って探す。
・本を読み進めて人物が出てくる。同じ名前が前に出てきたな? どこにあっただろうか? と思って探す。

第二は、本の内容を理解する。通常の本ではこの用途は少ないと思います。編集がしっかりしていて、目次もしっかりできていれば、内容を理解するために索引をたどっていく必要はないように思います。しかし、全体の構成を考えて執筆されているわけではない本もあります。ブログ本はその一つです。もともとは日記のようなものですので全体の構成を考えられているわけではありません。

そういえば、現在、『米欧回覧実記』(久米邦武編著、慶應義塾大学出版会、2008年6月刊)を読んでいるのですが、これは一種の旅日記ともいえます。本シリーズは全5巻ですが、別冊で総索引があります。総索引はテーマ別事項索引、人名索引、地名索引に分かれています。テーマ別事項索引はこの第二の目的にも使えるものです。例えばテーマのひとつに「音楽会」があります。索引の中見出しが音楽会、項目は「プロイセン王立劇場におけるオペラ」、「ボスtンの太平楽会」、「リヴァプールのパイプ・オルガンの演奏」、「ワシントンの国立劇場のオペラ招待」となっています。

索引語

さて、索引にどんな言葉を選ぶかのが適切か? 本文に出てこない言葉を索引語にするのはどうか? が次の疑問です。 これは索引の目的にも関係するでしょう。索引を階層化する場合は、第一階層の索引語は見出しとしての役割も担いますので、抽象度が高い用語、あるいは、本文に出てこない用語が多くなりそうです。

索引の形式は

索引のレイアウト形式ですが、索引は二段組が主流です。現在、本文二段組は少数派ですので、多くの場合索引と本文の版面は異なることが多いでしょう。また、本文が縦組でも索引は横組が多くなっています。

索引の構成方法

索引の作成方法の一つに構成方法があります。例えば、まず、索引自体を事項索引、人名索引、地名索引のように大分類する。それから索引の中で親子の索引、兄弟の索引を作ることは一般的です。

先達の索引作成例

先達の索引例として、まずは、上に述べた『米欧回覧実記』をあげておきます。

関連
[1] 索引の作り方を考える。一歩進んで、本文に出てこない索引語や、索引語の階層化の試み。
[2] ECMJ流!Eコマースを勝ち抜く原理原則シリーズ第3弾 『今日からできるEコマースの集客戦略!: ~広告予算がなくても、アクセスは伸ばせる~』

CAS-SUPPORTブログの索引関連その他の過去記事
[1] CAS-UBの編集デモ動画 新ファイル : 索引を追加する
[2] EPUB・PDFで索引や親子索引を作るためのCAS記法の例
[3] CAS-UBではEPUBに索引を自動的に出力できます。

CAS-SUPPORT ブログより6年間を振り返る(2)

前回は、CAS-SUPPORT ブログから6年間を振り返るの前半でした。今回は後半2014年~2016年を振り返ってみたいと思います。

2014年

毎年一番最初に開催される大きな展示会はPageです。Page 2014での第一印象は電子書籍ブームは去ったということでした[1]。ちなみに、ブームが去ったということは、電子書籍がビジネスとして成長していないということを意味するわけではありません。むしろ、興味本位というと言い過ぎかもしれませんが、新たなビジネスチャンスを探して電子書籍界隈に大勢の人が集まった時期が終わり、地道なビジネスとしての取り組みのフェーズに移行したということを表します。

2014年はEDUPUBへの取り組みが注目された年でもあります[2]、[3]

2013年のEPUBマニュアル研究会は2014年も継続して行い報告書を発行しました[4]

2015年

2014年でEPUBに対する新規需要の盛り上がりが一段落したこともあり、2015年のCAS-UBプロジェクトでは、本をプリントオンデマンドで作るための最適なPDFレイアウトの検討に重点的に取り組みました。

まずは、基本版面の見直しを行いました[5]、[6]。日本語の本の場合、特に本の構成や扉の設定があまり標準化されておらず大きな構造がバラバラです。CAS-UBでは、記事の種類毎に、部分的にレイアウトを変更できます。この機能を強化してプリントオンデマンド用のPDFをより複雑なレイアウト構成にできるようにしました。例えば縦組の本に横組のページをいれるなどになります[7]

2015年末には過去に出版した報告書や本をアマゾンのプリントオンデマンドによって販売を開始しました。

2016年

2016年前半は、主に自社の製品や技術に関連する啓蒙書を、プリントオンデマンドで出版することに積極的に取り組み、例えば次のようなタイトルを発行しました。

『PDFインフラストラクチャ解説』POD版とKDP版が揃い踏みとなりました。
『XSL-FOの基礎 – XML を組版するためのレイアウト仕様』POD出版顛末記

2016年後半も、CAS-UBでプリントオンデマンドで本を出版するためのPDF生成技術の開発に重点的に取り組んでいます。

現在は、POD出版の実践として、ECMJ流! インターネットマーケティングのシリーズを出版しています。POD本を出す実践を積み、同時に開発課題の整理・CAS-UBの機能拡張を行っています。

[1] Page2014 終了しました。電子書籍のブームは去り、組版ソフトに注目があつまりました。
[2] EDUPUB プロファイル仕様 (5/28ドラフト) のあらまし
[3] EPUB標準化関連活動のアップトゥデイト 2014/9/15
[4] 『マニュアルEPUB化ハンドブック2015年版』紙版もアマゾンで販売開始。制作期間等を整理しました。
[5] 本のかたちを考える:基本版面のパラメータ設定の考え方を整理してみました
[6] 本のかたちを考える:四六判・基本版面の推奨値を検討する(案)
[7] CAS-UB V3.0をクラウドサービスにて提供開始。PDF縦組を大幅に強化しました。