インライン(草稿)

JEPAの「いまさら聞けない電子書籍のABC ~ebookpedia~」の下書きです。最終版は、JEPAのページをご参照ください。

ラインは線であり、インラインとは線を構成することあるいは線を構成する部品のことである。デジタルドキュメントの領域では、インラインという言葉は、様々な使われ方をする多義語であり、言葉の定義は曖昧でなんとなく使われているようだ。そこで、ここではいくつかの分類に分けて例を挙げて説明してみる。

1. 記述方式としてのインライン
次に挙げるいくつかの例のように、ある文脈で表したコンテンツの中に、別の文脈のコンテンツを記述することをインラインと表現する傾向がみられる。厳密な定義によるものではなく、なんとなく使う、自然発生的な用語のようだ。

(1) CSS(Cascading Style Sheets)のインライン・スタイル
HTML文書にレイアウトをCSSで指定するには3通りの方法がある。
① HTML文書に外部のCSSファイルをリンクする。
② HTML文書のhead要素の子供としてstyle要素を置き、そのstyle要素の内容としてCSSを記述する。そのときCSSはHTML文書全体に有効となる。
③ HTMLの要素にstyle属性を置き、その値としてCSSを記述する。例えば次のように記述する。
<h1 style=”color:blue;margin-left:2em;”>見出し</h1>

③のように要素にスタイル属性を持たせることをインライン・スタイルと言う。しかし、HTML5の仕様書には単に、「HTML5ではすべての要素にstyle属性の値を指定できる。これはCSSスタイル属性である。」と書かれているだけである。

(2) インラインSVG(Scalable Vector Graphics)とMathML(Mathematical Markup Language)
HTML4まではsvg要素やmath要素はHTML4で規定される要素ではなかった。このため、SVGやMathMLで記述したコンテンツは、画像ファイルとして作成して、ラスター画像のように参照するか、embed、object、iframe要素から参照した。これに対して、HTML5ではHTMLの要素のひとつとしてsvg要素、math要素を記述できるようになった。これを「HTML5ではインラインSVGやインラインMathが使えるようになった。」という言い方で説明されることが多い。但し、HTML5仕様書の中ではインライン(inline)という言葉は使われていない。

(3) インラインコメント
電子メールでは相手のメールに返信するとき、「インラインで失礼します」という言い方をすることがある。IT用語辞典やメールソフトの説明書などでは、相手のメールを引用して、そこに自分のコメントを挟むことをインラインコメントと表現している。メールの文章全体をひとつのラインとみて、相手の文脈の中に、別の文脈として自分のコメントを挟むことから由来しているようだ。失礼かどうかは別として、インラインという表現が当てはまるかどうかは曖昧である。

2. レイアウトにおけるインライン
テキストをレイアウトするときに、インラインという言葉を使う。この場合のラインは行であり、インラインは行としてレイアウトされることを示す。

(1) インライン数式
数式を段落の1行中に書く方法をインライン数式またはインライン・モードという。数式は、通常、上下・左右の領域に平面的に書くが、段落内に数式を書くときは、一行に広げて書くと段落内の行間が均一になり見やすい。例えば分数は、分子を上に書き、横線で区切って、分母を下に書くのが普通である。インライン・モードでは、最初に分子を書き、区切りの「/」を置いて次に分母を書く。TeXやMathLのような数式記述言語ではインライン数式を使い分けできる。

(2) CSSのインラインボックス
CSSはボックスモデルというレイアウトモデルを使ってコンテンツを配置する。領域全体を包含するボックスの中に、インラインレベルのボックスを水平に並べることをインライン・フォーマッティングという。CSS2.1の仕様書には次の例が出ている。
<P>Several <EM>emphasized words</EM> appear
<STRONG>in this</STRONG> sentence, dear.</P>
P要素は段落領域を作る。そこに次の5つのインラインボックスを作る。EM要素、STRONG要素はインラインボックスを作る。また、前後の文字も匿名のインラインボックスを作る。
Anonymous: “Several”
EM: “emphasized words”
Anonymous: “appear”
STRONG: “in this”
Anonymous: “sentence, dear.”
これらのインラインボックスを段落内に並べて行を作る。

CSSでは各ボックスに対して、文字の大きさ、ウエィト、色などのプロパティでレイアウトを指定する。また、HTMLの要素に対して、displayプロパティでどのようなブロックを作るかを指定できる。

3. HTMLのインライン要素

HTMLでは長いことインライン要素、ブロック要素という区別が使われてきた。しかし、HTML5ではこの区別がなくなった。インライン要素、ブロック要素の分類は暗黙のうちにレイアウトで分類しているのであるが、コンテキストをセマンティックスとレイアウトに分離する流れの一貫である。

(1) インライン要素とブロック要素
HTML4までは文書を構成する主な要素の種類としてブロック要素とインライン要素という区別があった。ブロック要素の代表は段落要素Pや区切り要素DIVである。ブロック要素の中には、他のブロック要素やインライン要素を含むとされており、インライン要素の代表例は、強調(EM、STRONG)やインラインの範囲指定(SPAN)などである。
このブロック要素やインライン要素という分類方法には、ブロック要素は大きめの構造を表し、インライン要素は小さ目の構造を表すという曖昧なコンセプトが与えられていた。しかし、むしろ暗黙のうちにレイアウト方法も指定していた。つまり、Pは段落という領域にレイアウトし、EM、STRONG、SPANなどは行としてレイアウトするという暗黙の了解である。

(2) HTML5
HTML5では、要素はコンテンツのセマンティックスの観点から分類されており、インライン要素とブロック要素という分類はなくなった。HTML5でもp要素は段落を表すものとして定義されている。ブラウザは、CSSのdisplay:blockレイアウトをデフォルト値としてもち、p要素は段落領域を作るようにレイアウトするが、p要素で段落を区切らないで、インラインのパラグラフマーク(U+00B6 ¶)で区切って、行内に連続してレイアウトしても構わないとされている。

出版のワークフローは、ブラウザベースのCSS組版エンジンで変わるか? その2 HTMLを主なコンテンツ形式にすること

先日紹介した「出版のワークフローは、ブラウザベースのCSS組版エンジンで変わるか? その1 発表の概要紹介」の論点について順番に検討してみる。今日は、HTMLを主なコンテンツ形式にすることを取り上げる。

以下の原-番号は、先日のブログで段落に付加した番号である。

1.論旨の混乱

原-2.(1)、(2)で、Webベースのコンテンツ・ソリューションについて、HTMLを主なコンテンツの形式(main content file format)とするとメリットが大きいと主張する。
原-3.でHTML/CSSセントリックな組版ソフト、原-4.でブラウザ上で動くHTMLベースのJavaScript印刷レイアウトシステムについて解説する。

原-2の主張は、ソリューションの中核であるコンテンツ形式としてHTMLを使うということであるので、HTMLをどのように入力するか、そのどのように加工・蓄積するか、どのように出力するかが検討項目となるはずだ。

原-3、4ではHTMLを印刷することを議論しているのである。主なコンテンツ形式がHTMLである必要はなく、主なコンテンツ形式からHTMLに変換した上で印刷すれば良い。

このように原-2の主張と原-3、4の主張とは一見関係ありそうだが別の話題である。分離して考えないと混乱してしまう。本発表はかなりミスリーディングな部分が多いが、そのひとつはここだ。[1]

2. HTMLを主なコンテンツの形式にすること

さて、原-2のHTMLを主なコンテンツの形式にするという主張について考える。つまりこういうことだ。

まず、ある出版社が(原-1(1))と同じようにテキスト中心の内容を、印刷した本、電子書籍、Webなどのメディアで出版をめざすソリューションの開発を企画したとする。そして、あなたが出版社の社長から新しい出版ソリューションの設計を依頼されたとしよう。そのときコンテンツの中核形式を何にするかは重要なポイントになる。

まずは、現在のワークフローを分析する必要がある。原-1(1)の(a)~(d))に4つのワークフローの記述があるが、ここで、現在もっとも普及していると思われる、最初にInDesignで印刷本のための版を作るというフローの検討が抜けている。現状分析において、現在の主要ワークフローを無視してしまうというのは、ソリューションの提案を作るためにスタートから落第点だろう。

次に、この原-2の冒頭の(1)項であるが、「出版の既存ソリューションは一つとして完全に動いていないし、自動化もされていない。」( 原文はit was clear to us that none of them function perfectly, nor automatically. )という主張は誤りである。この反例としては、CAS-UBを挙げるだけで足りる。

DITA-Usersでも、この部分についての指摘があった[2]。ここでの議論を見ると、どうも著者達は自分が何を主張しているかを理解できていないように見える。

原-2(2)では「HTMLを主なコンテンツ形式にすれば変換プロセスは少なくなるか、完全になくなるだろう。」と言っている。

この発表では、XML[3]、XHTML、HTMLが出てくる。XMLを否定してこれからはHTMLだと主張したいようだが、そもそも用語の定義が曖昧である。とりあえず、原-1(2)には「XHTMLはXML準拠でないHTML5に置き換えられつつある。」(XHTML is being replaced by the non-XML-conforming HTML5)という表現があるので、XHTMLを否定しているように見える。従って、主なコンテンツ形式は、HTML5であってXHTML5を含まないと推論できる。

そうすると、原-2(2)(a)の主張は誤りである。EPUB3.0のコンテンツ文書はXHTML5であってHTML5ではない。このため「HTMLを主なコンテンツ形式にすると変換プロセスは多くなる。」のである。

こうしてみるとわかるとおり、本発表は技術的にずさんすぎる。技術論というよりプロパガンダであると言うのが適切だろう。

原-2の「2. Webベースのコンテンツソリューションの必要性」での主な論点であるHTML5を中核フォーマットとするワークフローが本当に最適なのかどうか、ここのところには大きな疑問がある。

著者達を含め、HTML5+JavaScriptでXMLを置き換えることができるということを主張する論者が多い。確かに一部はそうかもしれない。しかし、すべてを置き換えるのはおそらく不可能だろう。

XMLは「成熟しており、多数の実証された実装をもつ柔軟な技術、無数のツールがあり、XMLベースのシステムを実装できる技術者が大勢いる」(it is a mature, flexible technology with many proven implementations, and a huge set of tools for working with it, and there are many people knowledgeable about it who are available to implement XML-based systems)[4]のである。

原-1、原-2では出版ワークフローの自動化を議論している。ワークフローの自動化を進める際に、HTML5+JavaScriptを採用するか、XML技術を採用するかは極めて大きな選択肢なのである。twitterやDITA-Usersでの議論を含めて判断すると、どうも、著者達は基本的な論点であるはずのところを全く理解できていないようだ。

[1] 論より証拠でXHTML is simple, but also other XML-formats such as DocBook/DITA can be styled with CSS via XSLT transform to HTML or directly. あたりで混乱が起きている。DITAを直接CSSでスタイル付けても無意味である。もし、DITAのtopicをCSSで、直接、組版レイアウトするというのであれば、その発言者はDITAの組版について無知であるという推論が成り立つ。(参考のため:DITA組版についての簡単な解説文)
[2] https://groups.yahoo.com/neo/groups/dita-users/conversations/messages/38075
[3] XMLとはなにかについて簡単な解説はXMLを参照。このようにXMLとは膨大な技術体系を意味するのであって、XHTMLやHTMLと比較できるものではない。
[4] https://groups.yahoo.com/neo/groups/dita-users/conversations/messages/38077

出版のワークフローは、ブラウザベースのCSS組版エンジンで変わるか? その1 発表の概要紹介

2015年8月11日~14日にワシントンDCで開催されたBalisageマークアップカンファレンスで、Vivliostyleの村上真雄氏とJohannes Wilm氏の共著による“Vivliostyle – Open source, web browser based CSS typesetting engine”という発表が行われた。

Twitterやメーリングリストを見るとこの発表はかなり人気をあつめたようである[2]

早速、一読したが、なかなか興味深い発表である。まず大筋を紹介する。次の回でいくつかの問題について一緒に検討してみたい。

(追記) レビュー: HTMLを主なコンテンツ形式にすること

Ⅰ 発表文の要約

オリジナル発表文はCC BY 4.0で公開されているので、最初に英語に詳しくない読者のために適当に要約する。詳しい方はぜひ原文をお読みいただきたい。なお、番号は次回以降で検討を加えるために段落毎に私が付加したものである。

1.マルチメディア出版のワークフローを促進する

(1) テキスト中心の内容を、印刷した本、電子書籍、Webなどのメディアで出版しようとすると多数の挑戦に直面する。ほとんどの出版のワークフローは、一般的な出版ワークフローの一部または全部を合体している。

(a) 小規模の商業出版では、原稿を主にMicrosoft Wordで書き、HTMLにエクスポートしている。Web版ではそれをクリーンアップし、テキストを埋め込むサイトで使うタグ、属性、クラスに変換する。EPUBにするときはHTMLファイルをさらに変換する。印刷版を作るときはテキストをInDesignのようなDTPに取り込んで設定する。WordでPDFにするかもしれない。

(b) 小規模の学術出版では、LaTeXとpdfTeXのようなツールでPDFを作る。LaTeXは参考文献の管理や数式に強い。EPUBやWebを作るときは、最初にTeXからHTMLに変換する段階がある。この変換は完全にはできないので大抵手作業が必要である。同じような問題は入力でも起きる。原稿がWordで書かれているとTeXにするのが大変だ。

(c) 大きな出版社や組織ではXMLを経由する。WordからXMLに変換し、手作業でクリーンにする。次に各種の変換ツールでPDF、HTML、EPUBにする。PDFは例えばXSLTでXSL-FOに変換し、フォーマッタで解釈してPDFにする。Webは他のXSLTでHTMLに変換して得る。HTMLからEPUBを変換して得る。理論的には、これらのプロセスは完全自動化が可能だが、実際には沢山の手作業と手による編集が必要である。それは、内容には出版物の種類に特化した要素を含んでおり、そうした要素が変換ソフトの作者が予期しなかった、ためである。

(d) XMLを中核とする他のワークフローでは、XMLを直接変換する代わりに、InDesignにインポートして印刷用に調整する。このときは、XMLが変更されたらInDesignでの変更が再度必要になるという問題がある。

(2) 上記の変換システムの問題は、手作業が多いこと、異なる出力媒体毎に異なるワークフローのステップが必要なことだ。XMLを含む専門的なソリューションでは理論的にはワンソースでできるはずだ。しかし、XMLは編集し難い。また、XHTMLはXML準拠でないHTML5に置き換えられつつあるようだ。

(3) XMLをスタイル化するもっとも一般的な方法はXSL-FOである。XSL-FOを使う出版物は依然として増えており、CSSよりも進んだ機能をまだ持っている。しかし、XSL-FOの標準化への関心は少なく、W3CはCSSがXSL-FOを置き換えると信じたため無期限に停止されたという問題がある。

2. Webベースのコンテンツソリューションの必要性

(1) 出版の既存ソリューションは一つとして完全に動いていないし、自動化もされていない。また、多くの出版のワークフローの中心部にはXMLが置かれているが、それはHTMLがXHTMLに置き換えられようとした20世紀末の歴史的な人工遺物である。XMLは最終出版形式ではなく、Webには存在しない。XMLをWYSIWYGで編集できるエディタはHTMLについてよりも少ないので、不必要な変換プロセスが多く必要である。

(2) HTMLを主なコンテンツ形式にすれば変換プロセスは少なくなるか、完全になくなるだろう。

(a) EPUBはHTMLの制限付きのバージョンであり、スタイル付けは限定的なCSSである。従って、HTMLソースファイルからEPUBへの変換は多くの場合自動的にできるだろう。もし、タグ、属性、CSSの規則を制限するならば、変換プロセスは完全に自動化できるだろう。

(b) Webに出版するときは、ソースファイルはそのままで良い。さらに追加が必要であれば単純なコンバータを追加できるだろう。

(3) WebやEPUBの出版では、変更は必要ないかもしれないが、印刷の状況はかなり異なる。標準的な印刷組版はどれもHTMLを中心としてその周りに作られていない。ソースファイルはMicrosoft Word, Adobe InDesign, XMLファイルである。

(4) 多くの出版社はワークフローをHTMLに変更することでメリットがあるだろう。また、XSL-FOで定義されるスタイリングをCSS組版に切り替える利益があるだろう。なぜならば、すべての出力形式のために類似のスタイル定義を使えるからである。

3.既存のHTML中心のプリント組版

(1) AH FormatterとPrinceXMLというHTML/CSSを使う二つの組版ソフトがある。

(2) 両社はCSSとHTMLを入力とするスタンドアロン版である。少なくとも二つの大きな出版社(O’Reilly MediaとHachette Book Group)が採用している。組版ソフトは普通に使うHTML要素を受け付けるが、両者の実装は少し異なる。Webベースのコンテンツ制作者や編集者は、Webの仕様に準拠するだけでなく、普通のWebブラウザの実装に従う必要がある。さらにWebのコンテンツがブラウザで問題なく可視化できるとしても、上記のCSS組版ソフトで組版する前に余計な注意を払う必要がある。組版ソフトは、ブラウザとは多少違うし、そのCSS仕様の実装は比較的ゆっくりしている。これが現在の印刷出版業界が直面している問題の一つである。他の問題は標準CSSが、本のスタイル付けのために必要な規則のすべてを実装しているわけではなく、本の出版のためのスタイル付け機能の開発は始まったばかりであることだ。

4. WebブラウザとJavaScriptを印刷出力作成のために使う

(1) 2012-14年に開発されたPagenation.jp, simplePagenation.jsの二つは、ブラウザで走るHTMLベースの印刷レイアウトシステムである。JavaScriptで書かれており、印刷する本に特有のスタイルを付けることができる。但し、ブラウザのprint-to-pdf機能を使っておりApple Safariでしか動かない。

(2) 二つのJavaScriptパッケージはすべてのページを通じて特別なルールに従って繰り返す一般的な本の印刷専用である。雑誌やページ毎のレイアウトをする本用ではない。

(3) 二つのJavaScriptパッケージはコンセプト実装であり、特別なレイアウトタイプの本には良いが、応用性がない。

5.必要なこと:印刷のための共通のスタイル仕様

(1) 我々の焦点の一部は、印刷や他のページ媒体だけに重要な余分の要素をWebの仕様として定義して、他のプロジェクトと相互運用可能にすることである。

(2) 重要な仕様の一つはCSS Paged Media仕様である。これはAH Formatter、PrinceXMLを含む幾つかの組版エンジンがCSS Paged Mediaを実装している。

(3) ブラウザは、PDFを作る方法を実装しているが、主要なブラウザはCSS Paged Mediaを実装していない。電子書籍リーダーの多くも同じである。

(4) 補足すると、CSS Paged Media仕様を実装する組版エンジンはベンダー間で非互換の独自拡張をサポートしており、ソースファイルをエンジン間で移すのが困難である。

(5) Vivliostyleプロジェクトでは、Web標準を進めることを優先しており、Vivliostyle.jsが他のまた未来のWebペース印刷エンジンと相互運用可能になるようにする。

(6) W3Cと一緒の作業を始めており、CSS Paged Mediaや他のCSS Page Floats, CSS Generated Content for Paged Media仕様を推進する。

6. 必要なこと:JavaScriptベースの一般的な印刷レイアウトの実装

(1) 一般的な印刷レイアウトのためのJavaScriptベースのソリューションが必要である。すべての主要なブラウザの上で動き、付随するページレイアウトを定義するCSSを読み、レイアウトを完全にCSSで定義できるようにする。印刷のためのWebコンテンツを準備したり、ブラウザを電子書籍のリーダーにするのに使える。

(2) 半年ほどVivliostyle.jsのコーディングしてきており、開発を継続している。ページに関係するCSSプロパティをパースする。脚注、ページ番号、ページヘッダを含む基本的なページスタイルが可能である。

(3) W3Cの仕様のかたちで標準化途中の新しい機能をJavaScriptで実装するのはExtensible Web Manifestにふさわしい。JavaScriptでどのように動くかを試すことで、関連する仕様を推進できる。うまく行けば、印刷に関連するCSS仕様の完成とブラウザが印刷関連の仕様を実装するのを支援できる。

7. 結論

テキスト出版の世界は分断されている。これを統合する試みはいくつかあり、XMLが長い間もっとも見込みがあった。出版業界では労働力集中型のDTPベースのワークフローの代替、インプットから最終出力までできるだけ少ないステップで、コンテンツの変換を自動化する印刷ソリューションを探している。ここに示したように、CSSとHTMLの組み合わせは、出版のワークフローの統合に置いてもっとも見込みがある。CSSとHTMLがもっと多くの出版社のための実行可能な代替手段になるためには、CSS標準の開発とJavaScriptの早期実装が必要である。

Ⅱ 感想
この発表は、異なる種類の課題を一緒くたに詰め込んで議論しており突っ込みどころが多い。また、著者は現実世界の問題の本質をあまり理解していないように感じる。次回にこうした点について検討を加えてみる。

[1] Vivliostyle – Open source, web browser based CSS typesetting engine Shinyu Murakami, Johannes Wilm (Vivliostyle Inc.)
[2] Great responses after I presented our paper on @Vivliostyle at #balisage today! Thnx! http://www.balisage.net/Proceedings/vol15/html/Wilm01/BalisageVol15-Wilm01.html
[3] XHTML is simple, but also other XML-formats such as DocBook/DITA can be styled with CSS via XSLT transform to HTML or directly. @AntennaInfo

マークアップとは(草稿)

JEPAの「いまさら聞けない電子書籍のABC ~ebookpedia~」の下書きです。最終版は、JEPAのページをご参照ください。

マークアップ
マークアップとはコンテンツに対して指示マークをつけることである。マークアップの目的はさまざまである。ここでは編集者によるエディトリアル・マークアップ、コンテンツをブラウザで表示するためのHTML(Hyper Text Markup Language)タグによるマークアップ、テキストに簡単な記号でマークアップしてHTMLタグに変換する軽量マークアップ言語を取り上げる。

エディトリアル・マークアップ
編集者が、著者の原稿に、テキストを再入力するための指示、組版作業者に対する指示を記入することをエディトリアル・マークアップという。テキストの挿入、削除、置き換え、入れ替え、終了、分離、句読点の変更、ダッシュとハイフン、大文字化、小文字化、イタリックとボールド、段落のインデント、フラッシュ・ライト/レフト、縦方向の空きなどの指示をプリントされた原稿に記入する。また、見出しを階層化して構造をはっきりさせ、テキストの表示方法を区別する要素―引用、箇条書き、テキストボックス―をマークアップする。指示の仕方には、丸で囲む方法、アンダーラインやキャレットなどの記号を使う方法、例えば章のタイトルを<ct>のようなコードを用いて表現する方法がある。レイアウトに関わるコードに対しては、デザイナーが、別途、レイアウト指示を追加することもある。こうしたマークアップやコード化は分業で仕事をするための便宜的なものであり、一緒に仕事をする編集者、デザイナー、組版制作者の間で合意があれば、その具体的な方法は自由である。

ブラウザでコンテンツを表示するマークアップ
1990年代半ばに登場したWebブラウザは、インターネット上のサーバーに蓄積されたコンテンツを、端末のブラウザで可視化する。インターネットのコンテンツは、HTMLタグでマークアップされている。初期にはHTMLタグでコンテンツのレイアウトも指示したが、だんだんHTMLタグとレイアウトを分離するようになった。現在では、HTMLタグは主に文脈を指定し、レイアウトはCSSで指定する。ブラウザはコンテンツに付与されたHTMLタグとCSSによるレイアウト指定を解釈してコンテンツを可視化する。

HTMLのマークアップ作業
最新のHTML5では、100個以上のタグが規定されている。例えば、文章の大きな区切りをsectionタグで、見出しはh1~h6のランクタグで指定する。タグが複雑なことから、Webページを適切にマークアップするには、HTML専用のオーサリングツールを用いることが多い。しかし、HTMLタグの知識が十分あれば、テキスト編集ソフトを使って手作業でマークアップもできる。

マークアップと可視化の分離
マークアップはコンテンツの文脈やレイアウトを、コンテンツとは別のタグなどにより指定する考え方である。コンテンツに指示をするマークアップ工程と、マークアップされたタグに基づいてコンテンツを組版・可視化する工程が分離している。エディトリアル・マークアップにしても、HTMLタグのマークアップにしてもマークアップ作業と可視化処理は分離している。

コンテンツとレイアウトが渾然一体のWYSIWYG方式
コンテンツの制作では1980年代半ばからWYSIWYG方式(What You See Is What You Get)がマークアップ方式よりも優勢である。WYWIWYGとは画面上で表示されているレイアウトと出力レイアウトが同一という意味である。WYWIWYG方式のワープロやDTPでは、画面上にレイアウトされた状態のテキストを対話的に編集する。コンテンツとレイアウトが渾然一体の状態で編集作業が行われ、レイアウトを整えるためにコンテンツの文脈が無視されがちである。WYSIWYGによる制作作業と、マークアップ作業とはコンテンツ制作に関して、考え方が対立している。

軽量マークアップ言語
プログラムのマニュアルなどをHTMLで作成する開発者は、HTMLオーサリング・ルーツを使わずテキスト・エディタで記述することを好む。しかし、テキスト・エディタでHTMLタグを直接マークアップするのは作業負荷が大きい。そこで、原稿テキストに簡単な記号でマークアップし、プログラムを使ってHTMLタグに変換する方法に人気がある。またWikiでは、ブラウザのフォームで、テキスト入力時に簡単な記号でマークアップし、内蔵のプログラムでHTMLに変換して表示する仕組みが採用されている。こうした方式を軽量マークアップ言語(または、簡易マークアップ言語)という。その代表例としてはMarkdownとMediaWikiを代表とするWiki記法がある。軽量マークアップ言語によるマークアップの利用者は開発者が中心で、WYSIWYGになれた一般ユーザーにはあまり普及していない。

Facebook

CAS-UBのPDFインポート機能廃止の件:ご意見をお寄せください。

現在、CAS-UBのV2.4を開発中です。

V2.4は、英語版を中心に、より現実に流通されている本に近い形式の書籍用PDFを制作する機能を強化しています。

大きな改善点は、記事の種類の追加、PDFのビルドインスタイルシートの強化になります。

また、できるだけ操作を判りやすくするため画面を簡単にし、ヒント機能なども追加します。

Wordインポート機能は、大きな記事をWordインポートで分割した場合、PDFやEPUB制作時に結合するように改良する予定です。

(CAS-UBは、ブラウザのフォームで記事を編集するため、ブラウザのフォームで編集できるテキストの長さの制限を受けます。このため長い記事を分割して編集しなければなりません。)

一方、あまり有効でない機能を廃止します。その一つとして、PDFインポート機能を廃止することを検討しております。

PDFをリフロー型のEPUBに変換するには、CAS-UBで直接PDFをインポートするよりも、
1)PDFをWordに変換
2)Word上で形を整える
3)CAS-UBでWordからEPUBにする
というステップの方が望ましいと考えられます。

PDFをWordに変換する手っ取り早い方法としては、弊社の『瞬簡PDF変換』のようなデスクトップ製品や『瞬簡PDF for Cloud』のようなサービスがあります。


『瞬簡PDF変換』

『瞬簡PDF for Cloud』
『瞬簡PDF for Cloud』(価格)

このような事情でCAS-UBにPDFインポート機能を維持する必要性は小さいと考えます。そこで、V2.4ではCAS-UBのPDFインポート機能を廃止したいと考えております。

もし、継続を望まれる方がおられましたら、ご意見をいただければと存じます。

『本はどのように消えていくのか』

『本はどのように消えていくのか』(津野 海太郎著、晶文社、1996年発行)
四六判、220頁、1900円+税

20150321

書名と同名の短文を中核とする短文集である。一読して、やはり「本はどのように消えていくのか」(pp. 76-97)が最も印象に残る。

本文の趣旨を整理すると、次のようになるだろう。

冒頭で「はたして紙と活字の本はなくなるのか。」と問い、「おそらくなくなるだろう。」、ただし、数百年かかるだろう、と答える。本文で論じているのはどのような過程をたどってなくなるのか? ということである。

まず、紙と活字の本のモノとしての側面を、①明朝体の文字をタテヨコそろえて組み、②それを白い紙の上にインキのしみとして定着し、③綴じてページづけしたもの、と定義付ける。(p.77)

津野さんは、そのような本と並行して、数十年の間に①ネットワークを通じてデータを入手し、②ディスプレイ画面にデジタル文字として表示、③複数のウィンドウを切り替ながら読むという仕組みが出現するという。(p.91)

こうしたモノとしてのデジタル電子本は50年以内には完成するかもしれない。しかし、「いまあるような紙と活字の本が、まるごと別のモノによっておきかえられるには百年、二百年、いや三百年かかる。」(p.92)

その理由は、紙と活字の本は「水のように流れる自分の想念を書くことによってせきとめ、ふかめ、それをインキのしみとして、紙やその他の素材の上にしっかり定着しつづけてきた。」(p.94)、「ディジタル・ネットワークにおける…中略…ディスプレイ画面上の文字はインキのしみではなく、かげろうのようにはかない一瞬の映像に過ぎない。印刷が印刷でないものにとってかわられるということは、…印刷によってきざまれる動と静、運動と定着のリズムが私たちの社会から完全に消滅してしまうことを意味する。」(p.95)

要するに印刷が安心感の根拠であるが、モノとしての電子本が新しい安心感の根拠になるまでの社会あるいは人間の「読書習慣」の変化には数百年かかるだろうから、その間は、紙と活字の本と新しいデジタルの本が共存する期間となる、というのが津野さんの主張の骨子である。

さて、この記事が書かれてから既に20年になろうとしている。この間、活字は既に消滅し、デジタルフォントに置き換えられた、そして印刷もデジタル印刷に変わりつつある。そして、津野さんのいうデジタル電子本も技術的にはかなり進んできた。そして電子書籍が一部で確実に普及している。

しかし、この文章の冒頭の「はたして紙と活字の本はなくなるだろうか?」という設問への答えはまだ見えておらず、相変わらず想像力を掻き立てる問いのままである。

本は津野さんのいうように一つの世界観を封じ込めた精神的なカプセルである。そのカプセルの内容を表示する装置が紙か電子デバイスであるかということが紙の本と現在のデジタル本の違いである。ところで、そのカプセルの内容を紙の上に定着させた場合と、画面に一瞬表示した場合で、読み手に与える効果・影響にどの程度の相違があるのだろうか? これはまだはっきりとはわかっていない。津野さんの主張は、その相違および読書習慣の永続性を強調しすぎているとも思える。

いずれにせよ、日々の糧を得ようとしてアクセクしているわが身にとっては、数百年後に紙と活字の本はなくなるだろうというのは時間のスケールが違いすぎる。

デジタル時代の本の再定義。 EPUBはPOD書籍普及のブレーク・スルーになるだろうか?

身近なドキュメントの領域の変化を振り返ってみますと、20年ほど前に弊社が一番関係深かったワープロ専用機は、ワープロソフトによって置き換えられてほんの20年ほどでなくなってしまいました。次に関係深かった写植機はDTPによって置き換えられてなくなりました。また銀塩写真はデジカメに置き換えられて姿を消しました。

こうした歴史を踏まえて、紙の本がデジタル時代にどう変質するのかを考えてみます。

2010年に(何回目かの)電子書籍元年となりましたが、その後5年目のいま、商業用電子書籍ではEPUB3がデファクト・スタンダードになったと言って良いでしょう。一時は、EPUB3などの電子書籍によって紙の本が置き換えられるのではないかということも言われました。しかし、現在のところ、当分の間は紙の本が電子書籍に置き換えられることはなさそうです。

むしろ、紙と電子デバイス(画面)という媒体の特性の違いを考えますと、電子書籍と紙の書籍は代替関係よりも両立関係になると言う方が適切そうです。

さて、現在のところ、書籍の印刷と製本は全体としてみますと、まだアナログ技術が優勢な部分と思います。では、デジタル時代の書籍がどうなるのでしょうか?

印刷ではデジタル印刷技術がどんどん進歩しています。すでにPDFで入稿されれば、デジタルプリンタで一冊から本を印刷できる、プリント・オン・デマンド(POD)が実用になっています・

今後、PODによる本作りの時代がすぐそこにやってきそうです。PODによる本作りはまだかなり割高ですが、これを割安にするには、規格化し、コンピュータ処理にするのがポイントになりそうです。

現実は、書籍は規格化されていないものの筆頭にあげられそうです。なにしろひとつひとつの書籍の内容は全部異なり、レイアウトは1点毎ばらばらです。書店で売られている本の判型は四六判、新書版、文庫本などある程度のパターンにわけられます。しかし、同じ判型であっても、製本の仕方、扉の付け方などには結構いろいろな種類があります。

私が読んだ本の中から約100冊をとりだして調べてみました(この写真)が、詳しく見ますとひとつとして同じものはありません。

DigitalBook

PODを規格化された廉価サービスとして提供しようとしますと、そのシステムにはかなり大きな投資が必要です。従って、投資を回収するには膨大な量の注文を処理しなければならないでしょう。

そのためには、書籍のコンテンツが沢山必要です。しかし、実態として本のサイズはかなりばらばらです。そして、紙の本は絶対寸法をもっていますのでリサイズはほとんどできません。コンテンツの種類を増やすには判型を多様にせざるを得ないわけです。

つまり、既存書籍の版を使った規格化は無理という壁に行きあたってしまいます。

ひとつの解決策として、既にかなり揃ってきたEPUBリフローコンテンツを使って規格化する、という方法があります。こう考えますと、EPUBをプリントオンデマンド用のPDFに変換するツール『EPUBtoPDF』が、書籍の未来を拓くブレークスルーになるかもしれません。

『EPUBtoPDF』紹介スライド

CAS-UB本日(15日18時~)のメンテナンス予定 EPUB3自動生成の本文目次の仕様を変更します。

CAS-UBは本日の定期メンテナンスで、次の仕様変更と問題の修正を行います。

(1) EPUB3の自動生成する本文目次でタイトルにマークアップしたルビ、縦中横などが有効になります。

(2) EPUB3の自動生成する本文目次の最上位レベルの見出しを出版物タイトル(書誌情報で入力した文字列)から「目次」(固定)に変更します。

(3) これまでは「タイトル」欄で半角の「<、>、&」を使えないため、全角にする必要がありました。本日のメンテナンス後より、この制約がなくなり、半角の「<、>、&」も使えるようになります。

次に詳しく説明します。

1.本文目次とは?

CAS-UBで作れるEPUB3の目次には次のa.からc.の3種類があります。b.の本文の目次は、EPUBリーダーの操作性の影響がなく、また、縦書き指定ができますので一番重要です。

a. Navの目次(必須)–EPUBリーダーが目次パネルに表示する目次。どのように表示されるかは、EPUBリーダー依存となります。
b. 本文の目次(オプション)–EPUBの本文と同じように表示する目次。CSSのテーマでレイアウトの指定ができます。
c. EPUB2と互換の目次(オプション)–EPUB3よりも前のEPUB2形式の目次。(これは、EPUB3対応のリーダーで読むときは使われません。)

CAS-UBの目次機能についての詳しい説明は、右のブログ記事をご覧ください。「EPUB目次自動作成機能を大幅に強化! CAS-UB V2.2 を正式版としました。」(2013/11/29)

2.本文の目次の自動生成とは?

a. 本文の目次は CAS-UBで自動的に生成できます。本文の目次を自動生成するときは、「EPUB3」生成メニューの「一般設定」で「生成する」を指定します。自動生成では、記事のタイトルとマークアップした目次(上位レベルから指定したレベルまで)を集めます。

20140115

b. CAS-UBの「記事編集」機能で自分で編集して作ることもできます。自分で本文の目次を編集するときは、記事の種類を次の図のように「ユーザー作成目次」としてください。

20150115a

《注意》
なお、本文目次は「生成する」がデフォルトですので、通常は設定を変更しなくても生成されます。また、「ユーザー作成目次」があるときは、本文目次を「生成する」にしても「ユーザー作成目次」が優先されます。

3.ルビや縦中横を本文の目次でつかうときのマークアップとiBookの目次と本文での表示例

(1) ルビ
a. マークアップ
20150115c0

b. 本文目次
20150115c00

c. 本文
20150115c

(2) 縦中横

a. マークアップ
20150115d0

b. 本文目次
20150115d00

c. 本文
20140115d

本日夕方よりCAS-UB V2.3にバージョンアップします。操作の簡易化、PDFレイアウトの機能強化を図っています。

かねてよりご案内の通り、本日(25日)夕方の定期メンテナンス時間にCAS-UBをV2.3に致します。

改訂の内容については、「(予告)CAS-UB V2.3 を近々リリース予定です。操作性のアップ、PDFレイアウトの強化、多言語対応などが強化ポイントです。」にてご案内しております通りです。

詳しい内容は資料として「CAS-UB V2.3の主な変更点」を用意しました。次よりダウンロードしていただけます:(PDFダウンロード

バージョンアップ完了しました:CAS-UB 最近の修正:2014年12月25日

『マニュアルEPUB化ハンドブック2015年版』紙版もアマゾンで販売開始。制作期間等を整理しました。

『マニュアルEPUB化ハンドブック2015年版(EPUBマニュアル研究会報告書)』のアマゾン販売準備がすべて整いました。販売リンクは次の通りです。

1.Kindle版
2. 紙(POD)版

以下に、これまでの経過を整理します。ブログで、先日、『マニュアルEPUB化ハンドブック2015(EPUBマニュアル研究会報告書)』をアマゾンのKDPで販売開始をご紹介しました[1]

その後になりますが紙本(プリントオンデマンド版)が納品となりました。
IMG_20141119_103402

紙の本はBPIAの総会にて編著者の木村氏より紹介していただき、総会参加の皆様に即売しましたところ、販売予定部数を超えて売れました。お蔭さまで初のPOD増刷決定です。紙の本は現物を手に取ってご覧いただける点が良いですね。それに著者の方々にも喜んでいただけます。

少し遅れましたが、アマゾンのe宅に登録し、紙の本もアマゾンで販売開始です。
20141129

アマゾンのWebでは、現在、在庫なしになっていますが、昨日アマゾンの倉庫に1冊送付しましたので、近々在庫1になる見込みです。e宅販売の場合1冊売れる毎に、弊社の倉庫からアマゾンに送付して在庫とします。

この間の所要日数を整理しますと次の通りです。

1.11月3日(休日) 編著者(木村氏)より最終原稿を受け取り
2.11月4日(火)~11月11日(火) アンテナハウスにてCAS-UBを使い、編集作業。PDFを対象とする図形の大きさ指定。表紙制作、用語の統一(ラテン文字の大文字・小文字記法統一など)、句読点の統一、索引作成など[3]
3.11月12日(水)POD本の制作を外注(~11月19日POD本出来上がり予定)
4.11月12日(水)~13日(木) CAS-UBでKDP用のEPUBを作成。(表紙の調整、Kindleのリーダーで内容を確認など)[4]
5.11月14日(金)KDPに登録
6.11月17日(月)よりKDPにて発売
7.11月19日(水)POD本25冊納品
8.11月20日(木)BPIA総会にて報告・販売
9.11月27日(木)e宅に登録

原稿入手からすべての作業を一通り完了するまで大体3週間程度となります。但し、日程は原稿のボリューム、完成度によります。また、編集作業としては原稿の文章の修正は原則として行っておりません。文章の確認を行うとしますと、著者とのやりとりが必要になりますし、そのための期間が必要になります。

研究会の報告書をPODで制作、KDPで販売するのは、研究会成果を公共的に共有する上で大きな意味があると思います。ちなみに、国会図書館にも2冊の納本を予定しております。

アンテナハウスではCAS-UBによる報告書の制作を受け賜りますので、詳しくはお問い合わせください。予算がない場合はプロフィットシェア・モデルも可能ですので、ぜひご相談ください。

[1] 『マニュアルEPUB化ハンドブック2015年版(EPUBマニュアル研究会報告書)』発刊しました
[2] 『マニュアルEPUB化ハンドブック2015年版  EPUBマニュアル研究会報告書』
[3] 『マニュアルEPUB化ハンドブック2015年版』近日発売(POD版)の索引作りに励みました。CAS記法(簡易マークアップ)でこんな索引を簡単に作れます。索引をうまく作るには内容の理解が欠かせません。索引に完成版はないような気がします。
[4] Kindleの図形の大きさはCSS標準なのでPDFの指定はそのままでOKですが、もしiBooksにするならば図形のサイズ指定の変更が必要になります。電子書籍(EPUB)で画像の大きさを指定したいとき:CAS記法とCSSの書き方まとめ