『本をコンピュータで作る』のは、いま、どこまでできる?

最近、プリントオンデマンド(POD)が流行っているようです。流行っているといっても全国的な流行なのか、私の周りだけの流行なのか、いまのところ、まだはっきりとは見極めがつきませんが。

CAS-UBの目標は、紙の本と電子の本の両方を同時に作りだすことです。

さて、そうしますと、紙の本と電子の本があります。で、この両者について『本をコンピュータで作る』ということをもう少しブレークダウンして考えてみます。

紙の本を作るには、印刷と製本の工程が欠かせません。しかし、これをCAS-UBで完結するのは無理です。そこで、1冊から印刷・製本ができるPODの普及を期待し、また、その使いこなし術を会得したいところです。

一つの論点=課題として、PODに使えるデータをコンピュータで作れるかどうか? があります。ここをもう少し、ブレークダウンすると次の3項目になるでしょう。
・本文のPDF
・包みの表紙のPDF
・POD用のメタデータ(表形式が多い)

電子の本は、現在、EPUB3.0がデファクトスタンダードになっています。

と言ってしまうと話が終わりそうです。しかし、もう少し現実に戻りますと、最近、弊社の電子出版サービスにEPUBを作ってもらえないかという引き合いが増えてきています。その内容を聞いてみますと、EPUB3.0ではなく、電書協ガイドだったり、別のガイドだったりします。EPUB2をベースにした独自仕様もあります。そうそう、Kindleも独自仕様だったりします。

EPUB3.1の標準化が進みつつあります。EPUB3.1ができても、それで終わりではなく、今後も変化するでしょう。

そうしますと、電子の本についての論点=課題の一つは多様なフォーマットにどう対応できるか? ということになるのでしょうか。

まだ、タイトル課題への回答にはなっていませんが、今日は、この辺で。

続きは:『本をコンピュータで作る』のは、いま、どこまでできる? (2)紙の本と電子の本をワンソースで作りたい

■PDF関連情報
流通によるプリントオンデマンドでの出版が現実のものとなった今、その活用の課題を考える。(2017年1月時点)

『PDFインフラストラクチャ解説』POD版とKDP版が揃い踏みとなりました

『PDFインフラストラクチャ解説』ですが、1月21日にPOD版が発売となり、紙(POD)版+電子(KDP)版が揃いました。

amazon-20160121

アマゾン 
POD版の紹介ページ
KDP版の紹介ページ

POD版は1月6日にストアに納品されていますので、発売まで2週間かかっています。どうやら新年営業開始直後で本が溜まっていたために遅れたようです。

KDP版は1月14日に登録したところ、15日に「お客様が提出されたKDPコンテンツを調査させていただいたところ、ウェブ上で無料公開されているコンテンツが含まれていることが判明しました。(略)」の連絡が来ました。どうやら、無料配布版(未完成版)が引っかかったようです。そこで、無料配布版を削除して、再登録し1月16日発売となりました。

このあたりのスピード感は、自動化度の度合ではないかと想像します。本をPODで作るのは完全な自動になっていない(できない)?

■PDF関連情報
流通によるプリントオンデマンドでの出版が現実のものとなった今、その活用の課題を考える。(2017年1月時点)

出版のワークフローは、ブラウザベースのCSS組版エンジンで変わるか? その2 HTMLを主なコンテンツ形式にすること

先日紹介した「出版のワークフローは、ブラウザベースのCSS組版エンジンで変わるか? その1 発表の概要紹介」の論点について順番に検討してみる。今日は、HTMLを主なコンテンツ形式にすることを取り上げる。

以下の原-番号は、先日のブログで段落に付加した番号である。

1.論旨の混乱

原-2.(1)、(2)で、Webベースのコンテンツ・ソリューションについて、HTMLを主なコンテンツの形式(main content file format)とするとメリットが大きいと主張する。
原-3.でHTML/CSSセントリックな組版ソフト、原-4.でブラウザ上で動くHTMLベースのJavaScript印刷レイアウトシステムについて解説する。

原-2の主張は、ソリューションの中核であるコンテンツ形式としてHTMLを使うということであるので、HTMLをどのように入力するか、そのどのように加工・蓄積するか、どのように出力するかが検討項目となるはずだ。

原-3、4ではHTMLを印刷することを議論しているのである。主なコンテンツ形式がHTMLである必要はなく、主なコンテンツ形式からHTMLに変換した上で印刷すれば良い。

このように原-2の主張と原-3、4の主張とは一見関係ありそうだが別の話題である。分離して考えないと混乱してしまう。本発表はかなりミスリーディングな部分が多いが、そのひとつはここだ。[1]

2. HTMLを主なコンテンツの形式にすること

さて、原-2のHTMLを主なコンテンツの形式にするという主張について考える。つまりこういうことだ。

まず、ある出版社が(原-1(1))と同じようにテキスト中心の内容を、印刷した本、電子書籍、Webなどのメディアで出版をめざすソリューションの開発を企画したとする。そして、あなたが出版社の社長から新しい出版ソリューションの設計を依頼されたとしよう。そのときコンテンツの中核形式を何にするかは重要なポイントになる。

まずは、現在のワークフローを分析する必要がある。原-1(1)の(a)~(d))に4つのワークフローの記述があるが、ここで、現在もっとも普及していると思われる、最初にInDesignで印刷本のための版を作るというフローの検討が抜けている。現状分析において、現在の主要ワークフローを無視してしまうというのは、ソリューションの提案を作るためにスタートから落第点だろう。

次に、この原-2の冒頭の(1)項であるが、「出版の既存ソリューションは一つとして完全に動いていないし、自動化もされていない。」( 原文はit was clear to us that none of them function perfectly, nor automatically. )という主張は誤りである。この反例としては、CAS-UBを挙げるだけで足りる。

DITA-Usersでも、この部分についての指摘があった[2]。ここでの議論を見ると、どうも著者達は自分が何を主張しているかを理解できていないように見える。

原-2(2)では「HTMLを主なコンテンツ形式にすれば変換プロセスは少なくなるか、完全になくなるだろう。」と言っている。

この発表では、XML[3]、XHTML、HTMLが出てくる。XMLを否定してこれからはHTMLだと主張したいようだが、そもそも用語の定義が曖昧である。とりあえず、原-1(2)には「XHTMLはXML準拠でないHTML5に置き換えられつつある。」(XHTML is being replaced by the non-XML-conforming HTML5)という表現があるので、XHTMLを否定しているように見える。従って、主なコンテンツ形式は、HTML5であってXHTML5を含まないと推論できる。

そうすると、原-2(2)(a)の主張は誤りである。EPUB3.0のコンテンツ文書はXHTML5であってHTML5ではない。このため「HTMLを主なコンテンツ形式にすると変換プロセスは多くなる。」のである。

こうしてみるとわかるとおり、本発表は技術的にずさんすぎる。技術論というよりプロパガンダであると言うのが適切だろう。

原-2の「2. Webベースのコンテンツソリューションの必要性」での主な論点であるHTML5を中核フォーマットとするワークフローが本当に最適なのかどうか、ここのところには大きな疑問がある。

著者達を含め、HTML5+JavaScriptでXMLを置き換えることができるということを主張する論者が多い。確かに一部はそうかもしれない。しかし、すべてを置き換えるのはおそらく不可能だろう。

XMLは「成熟しており、多数の実証された実装をもつ柔軟な技術、無数のツールがあり、XMLベースのシステムを実装できる技術者が大勢いる」(it is a mature, flexible technology with many proven implementations, and a huge set of tools for working with it, and there are many people knowledgeable about it who are available to implement XML-based systems)[4]のである。

原-1、原-2では出版ワークフローの自動化を議論している。ワークフローの自動化を進める際に、HTML5+JavaScriptを採用するか、XML技術を採用するかは極めて大きな選択肢なのである。twitterやDITA-Usersでの議論を含めて判断すると、どうも、著者達は基本的な論点であるはずのところを全く理解できていないようだ。

[1] 論より証拠でXHTML is simple, but also other XML-formats such as DocBook/DITA can be styled with CSS via XSLT transform to HTML or directly. あたりで混乱が起きている。DITAを直接CSSでスタイル付けても無意味である。もし、DITAのtopicをCSSで、直接、組版レイアウトするというのであれば、その発言者はDITAの組版について無知であるという推論が成り立つ。(参考のため:DITA組版についての簡単な解説文)
[2] https://groups.yahoo.com/neo/groups/dita-users/conversations/messages/38075
[3] XMLとはなにかについて簡単な解説はXMLを参照。このようにXMLとは膨大な技術体系を意味するのであって、XHTMLやHTMLと比較できるものではない。
[4] https://groups.yahoo.com/neo/groups/dita-users/conversations/messages/38077

出版のワークフローは、ブラウザベースのCSS組版エンジンで変わるか? その1 発表の概要紹介

2015年8月11日~14日にワシントンDCで開催されたBalisageマークアップカンファレンスで、Vivliostyleの村上真雄氏とJohannes Wilm氏の共著による“Vivliostyle – Open source, web browser based CSS typesetting engine”という発表が行われた。

Twitterやメーリングリストを見るとこの発表はかなり人気をあつめたようである[2]

早速、一読したが、なかなか興味深い発表である。まず大筋を紹介する。次の回でいくつかの問題について一緒に検討してみたい。

(追記) レビュー: HTMLを主なコンテンツ形式にすること

Ⅰ 発表文の要約

オリジナル発表文はCC BY 4.0で公開されているので、最初に英語に詳しくない読者のために適当に要約する。詳しい方はぜひ原文をお読みいただきたい。なお、番号は次回以降で検討を加えるために段落毎に私が付加したものである。

1.マルチメディア出版のワークフローを促進する

(1) テキスト中心の内容を、印刷した本、電子書籍、Webなどのメディアで出版しようとすると多数の挑戦に直面する。ほとんどの出版のワークフローは、一般的な出版ワークフローの一部または全部を合体している。

(a) 小規模の商業出版では、原稿を主にMicrosoft Wordで書き、HTMLにエクスポートしている。Web版ではそれをクリーンアップし、テキストを埋め込むサイトで使うタグ、属性、クラスに変換する。EPUBにするときはHTMLファイルをさらに変換する。印刷版を作るときはテキストをInDesignのようなDTPに取り込んで設定する。WordでPDFにするかもしれない。

(b) 小規模の学術出版では、LaTeXとpdfTeXのようなツールでPDFを作る。LaTeXは参考文献の管理や数式に強い。EPUBやWebを作るときは、最初にTeXからHTMLに変換する段階がある。この変換は完全にはできないので大抵手作業が必要である。同じような問題は入力でも起きる。原稿がWordで書かれているとTeXにするのが大変だ。

(c) 大きな出版社や組織ではXMLを経由する。WordからXMLに変換し、手作業でクリーンにする。次に各種の変換ツールでPDF、HTML、EPUBにする。PDFは例えばXSLTでXSL-FOに変換し、フォーマッタで解釈してPDFにする。Webは他のXSLTでHTMLに変換して得る。HTMLからEPUBを変換して得る。理論的には、これらのプロセスは完全自動化が可能だが、実際には沢山の手作業と手による編集が必要である。それは、内容には出版物の種類に特化した要素を含んでおり、そうした要素が変換ソフトの作者が予期しなかった、ためである。

(d) XMLを中核とする他のワークフローでは、XMLを直接変換する代わりに、InDesignにインポートして印刷用に調整する。このときは、XMLが変更されたらInDesignでの変更が再度必要になるという問題がある。

(2) 上記の変換システムの問題は、手作業が多いこと、異なる出力媒体毎に異なるワークフローのステップが必要なことだ。XMLを含む専門的なソリューションでは理論的にはワンソースでできるはずだ。しかし、XMLは編集し難い。また、XHTMLはXML準拠でないHTML5に置き換えられつつあるようだ。

(3) XMLをスタイル化するもっとも一般的な方法はXSL-FOである。XSL-FOを使う出版物は依然として増えており、CSSよりも進んだ機能をまだ持っている。しかし、XSL-FOの標準化への関心は少なく、W3CはCSSがXSL-FOを置き換えると信じたため無期限に停止されたという問題がある。

2. Webベースのコンテンツソリューションの必要性

(1) 出版の既存ソリューションは一つとして完全に動いていないし、自動化もされていない。また、多くの出版のワークフローの中心部にはXMLが置かれているが、それはHTMLがXHTMLに置き換えられようとした20世紀末の歴史的な人工遺物である。XMLは最終出版形式ではなく、Webには存在しない。XMLをWYSIWYGで編集できるエディタはHTMLについてよりも少ないので、不必要な変換プロセスが多く必要である。

(2) HTMLを主なコンテンツ形式にすれば変換プロセスは少なくなるか、完全になくなるだろう。

(a) EPUBはHTMLの制限付きのバージョンであり、スタイル付けは限定的なCSSである。従って、HTMLソースファイルからEPUBへの変換は多くの場合自動的にできるだろう。もし、タグ、属性、CSSの規則を制限するならば、変換プロセスは完全に自動化できるだろう。

(b) Webに出版するときは、ソースファイルはそのままで良い。さらに追加が必要であれば単純なコンバータを追加できるだろう。

(3) WebやEPUBの出版では、変更は必要ないかもしれないが、印刷の状況はかなり異なる。標準的な印刷組版はどれもHTMLを中心としてその周りに作られていない。ソースファイルはMicrosoft Word, Adobe InDesign, XMLファイルである。

(4) 多くの出版社はワークフローをHTMLに変更することでメリットがあるだろう。また、XSL-FOで定義されるスタイリングをCSS組版に切り替える利益があるだろう。なぜならば、すべての出力形式のために類似のスタイル定義を使えるからである。

3.既存のHTML中心のプリント組版

(1) AH FormatterとPrinceXMLというHTML/CSSを使う二つの組版ソフトがある。

(2) 両社はCSSとHTMLを入力とするスタンドアロン版である。少なくとも二つの大きな出版社(O’Reilly MediaとHachette Book Group)が採用している。組版ソフトは普通に使うHTML要素を受け付けるが、両者の実装は少し異なる。Webベースのコンテンツ制作者や編集者は、Webの仕様に準拠するだけでなく、普通のWebブラウザの実装に従う必要がある。さらにWebのコンテンツがブラウザで問題なく可視化できるとしても、上記のCSS組版ソフトで組版する前に余計な注意を払う必要がある。組版ソフトは、ブラウザとは多少違うし、そのCSS仕様の実装は比較的ゆっくりしている。これが現在の印刷出版業界が直面している問題の一つである。他の問題は標準CSSが、本のスタイル付けのために必要な規則のすべてを実装しているわけではなく、本の出版のためのスタイル付け機能の開発は始まったばかりであることだ。

4. WebブラウザとJavaScriptを印刷出力作成のために使う

(1) 2012-14年に開発されたPagenation.jp, simplePagenation.jsの二つは、ブラウザで走るHTMLベースの印刷レイアウトシステムである。JavaScriptで書かれており、印刷する本に特有のスタイルを付けることができる。但し、ブラウザのprint-to-pdf機能を使っておりApple Safariでしか動かない。

(2) 二つのJavaScriptパッケージはすべてのページを通じて特別なルールに従って繰り返す一般的な本の印刷専用である。雑誌やページ毎のレイアウトをする本用ではない。

(3) 二つのJavaScriptパッケージはコンセプト実装であり、特別なレイアウトタイプの本には良いが、応用性がない。

5.必要なこと:印刷のための共通のスタイル仕様

(1) 我々の焦点の一部は、印刷や他のページ媒体だけに重要な余分の要素をWebの仕様として定義して、他のプロジェクトと相互運用可能にすることである。

(2) 重要な仕様の一つはCSS Paged Media仕様である。これはAH Formatter、PrinceXMLを含む幾つかの組版エンジンがCSS Paged Mediaを実装している。

(3) ブラウザは、PDFを作る方法を実装しているが、主要なブラウザはCSS Paged Mediaを実装していない。電子書籍リーダーの多くも同じである。

(4) 補足すると、CSS Paged Media仕様を実装する組版エンジンはベンダー間で非互換の独自拡張をサポートしており、ソースファイルをエンジン間で移すのが困難である。

(5) Vivliostyleプロジェクトでは、Web標準を進めることを優先しており、Vivliostyle.jsが他のまた未来のWebペース印刷エンジンと相互運用可能になるようにする。

(6) W3Cと一緒の作業を始めており、CSS Paged Mediaや他のCSS Page Floats, CSS Generated Content for Paged Media仕様を推進する。

6. 必要なこと:JavaScriptベースの一般的な印刷レイアウトの実装

(1) 一般的な印刷レイアウトのためのJavaScriptベースのソリューションが必要である。すべての主要なブラウザの上で動き、付随するページレイアウトを定義するCSSを読み、レイアウトを完全にCSSで定義できるようにする。印刷のためのWebコンテンツを準備したり、ブラウザを電子書籍のリーダーにするのに使える。

(2) 半年ほどVivliostyle.jsのコーディングしてきており、開発を継続している。ページに関係するCSSプロパティをパースする。脚注、ページ番号、ページヘッダを含む基本的なページスタイルが可能である。

(3) W3Cの仕様のかたちで標準化途中の新しい機能をJavaScriptで実装するのはExtensible Web Manifestにふさわしい。JavaScriptでどのように動くかを試すことで、関連する仕様を推進できる。うまく行けば、印刷に関連するCSS仕様の完成とブラウザが印刷関連の仕様を実装するのを支援できる。

7. 結論

テキスト出版の世界は分断されている。これを統合する試みはいくつかあり、XMLが長い間もっとも見込みがあった。出版業界では労働力集中型のDTPベースのワークフローの代替、インプットから最終出力までできるだけ少ないステップで、コンテンツの変換を自動化する印刷ソリューションを探している。ここに示したように、CSSとHTMLの組み合わせは、出版のワークフローの統合に置いてもっとも見込みがある。CSSとHTMLがもっと多くの出版社のための実行可能な代替手段になるためには、CSS標準の開発とJavaScriptの早期実装が必要である。

Ⅱ 感想
この発表は、異なる種類の課題を一緒くたに詰め込んで議論しており突っ込みどころが多い。また、著者は現実世界の問題の本質をあまり理解していないように感じる。次回にこうした点について検討を加えてみる。

[1] Vivliostyle – Open source, web browser based CSS typesetting engine Shinyu Murakami, Johannes Wilm (Vivliostyle Inc.)
[2] Great responses after I presented our paper on @Vivliostyle at #balisage today! Thnx! http://www.balisage.net/Proceedings/vol15/html/Wilm01/BalisageVol15-Wilm01.html
[3] XHTML is simple, but also other XML-formats such as DocBook/DITA can be styled with CSS via XSLT transform to HTML or directly. @AntennaInfo

本のかたちを考える:四六判・基本版面の推奨値を検討する(案)

縦組書籍の判型の代表例は新書判と四六判です。今日はこの中の四六判の基本版面の推奨値を考えてみます。なお、今回は2段組を除外し、また脚注・頭注がある本も除きます。

前回[1]にも書きましたが、日本語組版における基本版面のパラメータは①文字のサイズ、②1行の文字数、③1頁の行数、④行間の4つです。

最近の四六判の基本版面の分布は以前に本ブログで紹介しました[2]。その後、追加調査した本を含めて四六判64冊の実態を整理してみます。

1.文字のサイズ
最小:8.8ポイント、最大:10.9ポイント、平均:9.4ポイント
文字サイズが9ポイント未満の本は珍しい存在ですが、今の時代では文字が小さすぎるとみられるのではないでしょうか。
10ポイント超も珍しい存在です。一般読者向けとしては、文字が大きすぎるでしょう。
推奨値としては9.0ポイント~10.0ポイントとします。

2.1行の文字数(字詰め)
最小:35文字、最大:46.0文字、平均:43.1文字
1行文字数は文字の大きさと余白の関係で決まりますが、9.0ポイント~10.0ポイントでは、40字~45文字が推奨となります。

3.1頁の行数
最小:15行、最大:21行、平均:17.8行
1頁15行の本はやや文字の並びが疎な印象があります。また、9.0ポイント以上では21行の本は無理があります。
16行~20行が推奨範囲となります。

4.行間(文字サイズに対する割合)
最小:50%、最大:92%、平均:67%
行間50%ですとルビがあるとき、ルビと左右の行がくっついてしまいます。
行間比率80%超の本はややスカスカな印象となります。
行間は55%~80%を推奨します。

5.1頁の文字数
1頁の文字数は、1行の文字数(字詰め)と1頁の行数の掛算となります。
実態としては最小:525文字、最大:900文字、平均:770.4文字です。
上の1~4の推奨値を組み合わせますと、
最小:40文字/行×16行=640文字
最大:45文字/行×20行=900文字
を推奨します。

基本版面としては次の5つを推奨パターンとします。

(1) 最小
640文字 40文字/行×16行 文字サイズ 9.8ポイント 行間比率70% 行間6.9ポイント(行送り16.7ポイント)
(2) 少なめ
714文字 42文字/行×17行 文字サイズ 9.6ポイント 行間比率68% 行間6.5ポイント(行送り16.1ポイント)
(3) 平均
774文字 43文字/行×18行 文字サイズ 9.4ポイント 行間比率66% 行間6.2ポイント(行送り15.6ポイント)
(4) 多め
836文字 44文字/行×19行 文字サイズ 9.2ポイント 行間比率64% 行間5.9ポイント(行送り15.1ポイント)
(5) 最大
900文字 45文字/行×20行 文字サイズ 9.0ポイント 行間比率62% 行間5.6ポイント(行送り14.6ポイント)

次に5つの推奨パターンによる組版例を示します。上から順に、最少、少なめ、平均、多め、最大です。
minimum
smalleraveragelargermax

実際にこの基本版面の設定で本を試作してみたいと思います。試作結果により最終的に決定します。

[1] 本のかたちを考える:基本版面のパラメータ設定の考え方を整理してみました
[2] 本のかたちを考える:(縦組・四六判)基本版面の分布実態、読み易い版面は?

本のかたちを考える:基本版面のパラメータ設定の考え方を整理してみました

紙の書籍で本文を配置する領域を基本版面[1]と言います。

基本版面の設定の考え方は次のようになります。

制約条件としては判型があります。判型により出来あがりの1頁の縦・横の寸法が決まります。

基本版面を設定するとき変更できるパラメータは、1段組では、①文字のサイズ、②1行の文字数、③1頁の行数、④行間の4つです。多段組を指定する場合は段数と段間の空きがパラメータに追加になります。

基本版面の設定値が適切かどうかを評価する尺度としては、編集者や制作者の立場では1頁に入る文字数が重要でしょう。読者の立場から見ますと読み易さが大事です。

1頁の文字数は尺度としては明快です。そして、例えば、1頁に入る文字数を多くするには、判型を大きくし、文字を小さくし、1行の文字数を多くし、行数を増やします。

一方、読み易さはやや曖昧です。読み易さを決める要因は、文字の大きさ、周囲の空きの量と、行間の空きの量が大事なように思います。周囲の余白が狭いと窮屈な感じになります。また、行間が狭いと、ルビや注の合印が行間に入らなかったり、あるいは重なったりします。

以上は、一見簡単そうですが、このパラメータの組み合わせは、無数になります。そしてこれらのパラメータのどれをどういう優先度で動かすべきかということが難しい問題です。

1頁の文字数を決める項目はすべて読み易さに影響を与えます。

たぶん総体的には次のような関係になるのでしょう。

20150722

この図は大雑把なものですので、今後、もう少し詰めていきたいと考えています。続きは「本のかたちを考える:四六判・基本版面の推奨値を検討する(案)」

[1] http://www.w3.org/TR/jlreq/ja/#elements_of_kihonhanmen
[2] 本のかたちを考える:縦書・新書判と四六判の版面パラメータの比較

本のかたちを考える:目次の扉・目次開始処理を考える

日本語(紙)書籍では目次の始め方には、次の3通りがあります。

1.目次専用の扉(目次扉)をおき、その裏(偶数頁)から目次の内容を開始する
2.目次扉をおかずに改丁して目次を始める
3.目次扉をおかずに改頁して目次を始める

手元の書籍106冊について目次の開始の仕方を調べてみたところ次の表のようになりました。

20150607
表 目次の開始処理

縦組の本では半数近くの本に目次専用の扉があることが分ります。(数少ないですが)横組の本では目次専用の扉は置かれません。

20150607a
図 本扉(共紙)の次に目次扉を置いた例

改丁開始と改頁開始は拮抗しています。但し、目次の直前に「まえがき」などがあり、その内容が偶数頁で終了しているときは、(3)改頁して目次を始めると、奇数頁始まりになりますので、見かけ上は(2)改丁して目次を始めるときと同じになります。(2)と(3)の区別はできあがった書籍を見ただけでは判別できないことに注意してください。

目次扉を置くメリットは?

縦組の本で目次扉を置きその裏から目次の内容を始めると、目次が見開きになり、視認性・一覧性が高いというメリットがあります。横組では見開きにでも行の進む方向と頁の進行方向が逆なので視認性が高くなるとは言えないかもしれません。そのあたりに縦組のとき目次扉を置くことが多い理由だろうと思います[1]

目次を改丁してはじめることにもメリットがあると思います。

本の表紙や本扉は必ず奇数頁にあり、偶数頁は裏となります。そこで自然に紙を捲ると視線は最初に奇数頁に行くと予想します。

特に目次について考えますと、目次は本の最初の方にあります。従って、本を机の上の置いて目次を開いた状態では奇数頁に重心があり眼と平行になります。一方、偶数頁は丸くなり浮いた状態になります。従って、奇数頁の方が読み易いし、注目されやすいはずです。

20150607b
図 本扉(共紙)の次に改丁して目次を置いた例

なお、英語の本では、一般論として奇数頁の方が重要な頁とされており[2]、献辞は原則として奇数頁に置きます。

[1] 但し、目次の直前の内容が奇数頁で終わっていれば、目次専用の扉を置かなくても、目次の内容は見開きになりますので、目次扉を置く理由の説明は見開きにするためというだけでは足りないかもしれません。
[2] 例えば、New Harts’s Rulesでは、“The recto is regarded as more important of the two pages of a spread….”とあります。

本のかたちを考える:縦書・新書判と四六判の版面パラメータの比較

先日(5月19日)基本版面の実態として、縦書・四六判の基本版面で決まるパラメータの定義とその分布を紹介しました[1]。

今日は少し視点を変えて、縦書・新書判と四六判の版面パラメータの比較を紹介します。

次の図は、手元の縦書・新書判25冊と四六判53冊の各種パラメータの平均値を集計したものです[2]。

20150528

新書判は判型においては四六判の76%しかありませんが、1頁総文字数(行数×文字数)では四六判の87%となっており、文字数では接近していることがわかります。

①判の大きさ
新書判と四六判と言っても、出来上がりの判の大きさはそれぞれ少しずつ異なります。平均すると新書判は、高さで15.7mm、幅で21.8mm、四六判より小さくなっています。
判の頁面積では新書版は四六判の76%です。

②新書版の頁総文字数は647文字、四六判は741文字となり文字数においては87%となります。

新書版は上下・左右余白が小さく、文字の大きさも0.25ポイント小さい上に、行間が0.78ポイント狭くなっています。

新書判は限られた領域を有効につかう工夫がなされていると言えるでしょう。

[1] 本のかたちを考える:(縦組・四六判)基本版面の分布実態、読み易い版面は?
[2]この表の全体の列はあまり意味がありませんのでご注意ください。

『Adventures of Huckleberry Finn』英語版POD本をつくりました

来週はいよいよBook Expo America[1]です。今年はCAS-UBをBEAに出展します。CAS-UBでどんなことができるかをアメリカの人たちに理解していただくため、英語版の本をひとつ作成してみました。

素材としてProject Gutenbergの『Adventures of Huckleberry Finn』を使いました。テキストをCAS-UBにコピー&ペーストし、若干編集した上でプリントオンデマンド(POD)で出力、製本しました。

POD本のサイズは150mm×233mm。『An Unfinished Life』というJFKの伝記と同じにしました。ちなみに『Chicago Manual』が150mm×227mmです。幅はA5とほぼ同じですが、高さはA5と比べてかなり高いです。

本文の余白と行数も『An Unfinished Life』と同じにしました。英語の本はこの位のサイズが読み易そうな気がします。

『Adventures of Huckleberry Finn』はイラストが売りのようです。Project Gutenbergではイラストをスキャンした画像が96dpiと150dpi(画像による)で収録されています。

元のdpiのままだと画像が大きく印刷されて、本文が337頁(表紙を含まない総頁数は353頁)となりました。

20150522b

CAS-UBは改頁位置で画像による空きが発生しないように、自動的にテキストと画像の順序を入れ替え、文中に無駄な空白がでないようにしています。

このままでは画像が少し荒いので、画像を200dpiに強制的に縮小してみました。

20150522c

画像200dpiでは版面に対して画像が小さくなります。そこで、画像を小口に配置してテキストを回り込み指定しています。

イラストのサイズを変更して作成したPOD本2種類が次の写真です。上2冊は少し薄く、下2冊の方が厚くなっています。

20150522a

このように、CAS-UBでは設定変更のみでいろいろな本ができます。もし、文字が大きめの本を作りたいならば、文字サイズを変更してPDFを作り直すだけでOKです。

なお、POD版と同時にEPUBも制作しました。今回作成した、PDFとEPUBはCAS-UBのweb[2]よりダウンロードしていただけます。関心をお持ちの方は出来栄えをご覧になってみてください。

[1] BEA
[2] 『Adventures of Huckleberry Finn』サンプル本

本のかたちを考える:(縦組・四六判)基本版面の分布実態、読み易い版面は?

書籍の頁には周囲に余白があり、中央部に本文テキストが配置されます。本文テキストを配置する領域を版面と言います。柱・頁番号などは版面の外側に配置します[1]

書籍では何種類かの版面がありますが、本文テキストを配置する基本的な版面を基本版面と呼びます。基本版面で決まるパラメータには次の①~⑧にあげるものがあります。簡単に整理しますと、縦組の場合はそのパラメータの間に次の計算式が成り立ちます(横組については省略)。

①基本版面の高さ=文字の大きさ×字詰め[2]
②基本版面の幅=文字の大きさ×行数[3]+行間×(行数-1)

③行の高さ=文字の大きさ+行間
④行間比率=行間/文字の大きさ

⑤頁の高さ=基本版面の高さ+(上余白+下余白)
⑥頁の幅=基本版面の幅+(右余白+左余白)

⑦1頁の総文字数=字詰め×行数
⑧版面率(または版面面積率)=(基本版面の高さ×基本版面の幅)/(頁の高さ×頁の幅)

これらのパラメータは書籍の編集者が決めます。パラメータをどのように決めるかにはいろいろ考慮すべき要因があり、考え方についてのガイドブックなども多数あります。

基本版面のパラメータの値により、頁のレイアウト、ひいては読み易さも変わるはずですが、一般に市販されている書籍の基本版面の実態や、パラメータと読み易さの関係について統計的・科学的な資料はあまり見かけたことがありません。

そこで、最近刊行された書籍でこれらのパラメータの分布がどのようになっているかを調べてみました。

主に2000年以降に発行された縦組・四六判サイズの単行本についての結果をここに紹介します[4]

頁の大きさが決まっていて、文字の大きさや余白にも自然に最大・最小の値があります。従って各パラメータがとることのできる値の範囲には物理的な制約が生まれます。しかし、実際にその分布や組み合わせのパターンを見ますと、予想外にバラエティが大きいと思います。

アウトライン・フォントを使えば文字の拡大・縮小は自由自在です。またDTPや自動組版でパラメータを簡単に操作できますのでパラメータの組み合わせは非常に多様になります。もはや編集者が簡単な計算と経験・勘だけですべてのパラメータに渡る最適値を決めるのはかなり難しくなっていると思います。今後はオペレーションズ・リサーチのような工学的方法を使って最適解を求めることが必要になるかもしれません。

以下、個別に簡単に紹介します。

(1) 基本版面の幅は90mm~110mm、高さは132mm~152mmに跨って幅広く分布しています。基本版面の幅と高さは多様性があります。ということが判型が同じでも上下・左右の余白の取り方に幅が大きいと言えます。

基本版面の実態s1

(2) 1頁の文字数(頁総文字数)は525文字~882字に分布します。文字の大きさが小さいほど多くなる傾向があります。

スライド2

(3) 版面率は51%~63%にわたります。頁総文字数ほどの差はありません。

スライド3

(4) 字詰めは35文字~46文字です。実詰めと頁総文字数はかなり相関が大きいですが、次の行数ほどではありません。

スライド4

(5) 行数は15行~21行の範囲になります。行数と頁総文字数の関係は字詰めと頁総文字数よりも相関が大きく、頁の総文字数は行数で決まる傾向があります。

スライド5

(6) 字詰めと文字サイズは相関が大きい。基本版面の高さが一定ならば逆比例になるはずですが、完全な逆比例にはなっていません。余白で調整されています。

スライド7

(7) 字詰めが同じでも基本版面の高さにはかなり広がりがあります。これは字詰めが同じでも文字の大きさにバラエティがあるためです。

スライド8

(8) 行数と基本版面の幅は相関が大きいが、逆比例にはなっていない。行間、余白、文字の大きさといった他のパラメータで調整される。

スライド10

(9) 行数が増えれば行間は狭くなる。しかし、反比例ではない。文字の大きさや余白で調整されるからだろう。

スライド12

(10) 行数が多いほど文字サイズは小さくなる傾向があります。

スライド14

[1] 「日本語組版処理の要件」附属書G 用語集
[2] 1行の文字数をここでは字詰めと表現します。この式では文字は正方形であること、および、1段組を前提としています。
[3] 1頁の行数をここでは行数と表現します。頁全体を通じて文字の大きさや行間が固定値であることを前提としています。
[4] 私の本棚にある本ですので、どの程度、一般的かは不明です。また、一部、1990年代終わりに発行された本を含んでいます。これらの本はほとんどDTPでアウトラインフォントを使って作られているものと思います。
[5] 『本づくりの常識・非常識 第二版』(野村保惠、印刷学会出版部、2007年発行)の付録には、縦組み・四六判の字数でみて最大45文字・最少40字、行数でみて最大20行・最少14行の例が載っています。

この記事の続き
(1) 本のかたちを考える:基本版面のパラメータ設定の考え方を整理してみました
(2) 本のかたちを考える:四六判・基本版面の推奨値を検討する(案)