W3CワークショップのポジションペーパーにみるEPUBへの要望

W3Cの第2回 eBooks & i18n ワークショップが6月4日東京で開催されます。

eBooks & i18n: Richer Internationalization for eBooks

参加希望者は、所属する組織または個人としてどのような立場で参加するかを表明するポジション・ペーパーという書類(原則1ページ以内)を提出することになっています。提出締め切りは4月30日までです。

主催者が承認したポジション・ペーパーは公開されることになっています。既に次のところに45名ほどのポジション・ペーパーが公開されています(日本時間で30日11時)。

the position papers submitted for a similar W3C workshop

見ますと、中には参加者のEPUBについての要望を伺うことができるものもあります。たとえば、KoboのJim Doveyさんが提出した「Multi-Package Distribution of eBooks with Additional Content」(Sub25)を見ますと次のような提案をしようとしています。

1.通常の(音声なし)のEPUB版と音声付のEPUB版は、サイズが非常に異なる。作るのに要する時間も異なる。
2.現状では、音声なしと音声付を別のEPUBとして作成し、出版社は2つのEPUBを販売する必要がある。読者も購入にあたり、どちらかを選択する必要がある。
3.これを、音節なし版を基本とし、音声情報をアドオンとして別売りできないか?そうすると音声版は基本版を購入した人の中で希望者だけが音声情報を追加で購入できるようになる。

なかなか良いアイデアだと思います。Doveyさんは、このためにOPF(パッケージング形式)を少し変更することを提案しようとしているようです。

EPUBのマルチボリューム化のツールが欲しい

最近は、CAS-UBを使っていろいろなドキュメント(仕様書、計画書、レポートなど)をEPUBで作っています。

そうした中で感じていることですが、たとえば、多数のEPUBをまとめた目次だけのEPUBをつくり、目次から他のEPUBにジャンプするようなマルチボリューム化機能があるといいなと思います。

PDFの場合は、外部のPDFの特定の位置(ページ内)に直接リンクを張る事ができますので、マルチボリューム化は容易です。AH Formatter[1]でもマルチボリュームのPDFを作る機能があります。マルチボリュームのしおりを作ることも簡単です。マニュアルが厚くなるとマルチボリューム化は必須です。もちろん、Adobe Readerをはじめとして気の利いたPDFのリーダは、PDF内の特定位置へのジャンプをサポートしていますので、PDFからPDFへのジャンプはできます。

EPUBでも同じような機能ができると思いますし、こうした機能が欲しいものです。

しかし、まずは、EPUBリーダがEPUB内部へのジャンプ機能を実現してくれないとどうにもなりません。ということで、ちょっとメモ的に書いておきます。

[1] AH Formatter 多分冊PDF出力

5月22日 AH Formatter V6.1製品発表会開催。CAS-UB V2.2で数式正式対応を予定。

アンテナハウスは、来月(5月)22日14:00~16:30まで、AH Formatter V6.1の製品発表会を開催します。CAS-UBではPDF生成にAH Formatterの最新版を採用しています。CAS-UBのPDF生成もV6.1発売と同時に最新版に入れ替えます。

AH Formatter V6.1はさまざまな機能拡張を拡張しています。その中でも数式(MathML)の組版機能を改良しましたので、この機会にCAS-UBもMathMLによる数式を正式サポートしようと考えています。

詳しいご案内はつぎのWebページでどうぞ:

http://www.antenna.co.jp/notice/2013/formatter-seminar.html

CAS-SUPPORTのブログ 2013年3月分をEPUBにまとめました

CAS-SUPPORTのブログ 2013年3月分をEPUBにまとめました。
こちらでダウンロードしていただくことができます。

■CAS-UBで作成したPDFとEPUBのサンプルファイルの中の
「3.3 CAS-SUPPORTブログ記事のEPUB版」の項

ブログを月別に整理し始めたのは、昨年の4月分からとなりますので、早いもので、丁度1年を経過しました。

以前のブログもEPUB化したいと思っていますが、なかなか進みません。

第2回 電子出版特別セミナーのお知らせ 電子書籍 “プロの書き方 読ませ方” 教えます!

アマゾンKindleストアの開始によって電子書籍は昨年の暮れ頃からようやく出版ビジネス全開モードにシフトしています。

アマゾンKindleでいかにして本を売るかが今年最大のテーマです。

本セミナーでは、ゲストスピーカーに電子書籍に詳しい舛本哲郎氏(フリーライター)を招き他では聞けないつっこんだ話を講演予定です。

◆6月11日セミナー開催決定
テーマ:「電子書籍 “プロの書き方 読ませ方” 教えます!」

◆タイムテーブル(予定)
 18:30~  主催者挨拶  (エクスイズム代表取締役 徳江一義) 
 18:40~19:30  電子書籍 “プロの書き方 読ませ方” 教えます!(仮題)
             (雑誌・書籍・自費出版・電子書籍ライター 舛本哲郎)
 休憩
 19:40~20:20  著者、編集者にお勧め!
  Kindleで売る本をつくる方法
             (アンテナハウス代表取締役社長 小林徳滋)
 20:20~20:40  eXism Short Magazineの紹介
         EPUBとPDFの制作代行と電子書店配信サービス
             (エクスイズム/徳江一義)
 20:40~終了
 
◆講師紹介
舛本 哲郎(ますもとてつろう)
1957年横浜市生まれ。日本大学経済学部卒。物流・流通専門誌、ビジネス誌
「ウェッジ」、金融専門誌などの編集・記者、経営専門誌の編集長 を経て、現
在はビジネス誌などでの取材・執筆、30冊以上の単行本の企画・ライター、出版
のプロデュースなどを行っている。近著に電子書籍 「山手線お楽しみガイド」
(安曇出版)。行政書士でもある。
https://www.facebook.com/tetsuro.masumoto

◆募集要項
○参加資格:事前予約・有償(税込み3,150円)
○参加申込みは次のURLからお願いします。
https://www.exism.co.jp/contact/form/seminarinq.html
○お問い合わせ
https://www.exism.co.jp/contact/form/forminq.html
→exsales@exism.co.jp
→03-5229-8761

◆参考: 舛本氏第1回の講演内容から抜粋

・電子書籍の市場は実はかなり大きい
・電子書籍はネット特有の世界に大きく影響される
・売れる電子書籍は「読者を裏切らない」
・売れる要素の一つは「読者と一緒に成長し継続すること」
・完成度よりも情熱が大切「荒削りでも届く言葉があれば」
・電子書籍も営業しないと売れない「多方面の展開」

CAS-UB 「PDFインポート」機能を正式機能としました。

CAS-UBは、4月からPDFを取り込んでEPUB編集を行なう「PDFインポート」機能を正式サポートしました。

電子書籍を作りたいが、底本としてPDFしかないとき、CAS-UBの「PDFインポート」機能を利用してPDFからテキストや画像を取り込むことができます。

本PDFインポートでは、テキスト情報が保存されているPDFの内部を解析してテキスト情報を取り出します。OCR技術に依存しているわけではありません。

また、テキスト情報だけではなくて、画像などについても極力解析して取り出すようにしています。

主な変換仕様は次の通りです。

変換仕様

PDFには見出しや箇条書き、テーブル、文字装飾(フォントにある場合を除く)といった情報は存在しません。[1]

よって文字や図形の種類、位置、大きさといった情報の組み合わせから判断して意味のある要素への変換をおこなっています。これにより微妙な位置のずれ、ノイズ、PDF内部の構成、文字情報の欠落などといった様々な要因で、一見簡単に変換できそうな問題なく見えるPDFでも正しく変換できないことがあります。

下記は各要素ごとの変換仕様で、PDFの内容がどのように変換されるかを示しますが、「変換される」とあるものでも、上記の理由から必ず正しく変換できるということを保証するものではありません。

要素 変換仕様
段落 変換されます。
見出し 章として指定されたページの最初の段落を見出しとます。
画像 写真などのラスター画像は変換されますが、線画、図形などのベクトル画像は変換されません。PDFでは複数のラスター画像、ベクトル画像を重ねて一枚の画像のように表示していることがありますが、その場合、一枚ずつに分割されラスター画像のみ変換されることになります。
箇条書き 箇条書きとしては変換されず、通常の段落となります。
テーブル 変換されません。通常のテキストのみとなります。
リンク リンクは無効となり、通常のテキストとして変換されます。リンク情報は削除されます。
ボールド(強調) 変換されます。
イタリック(斜体) 変換されます。
下線 変換されません。通常のテキストのみとなります。
取消線 変換されません。通常のテキストのみとなります。
上付き・下付き文字 変換されません。通常のテキストとなります。
ルビ ルビと判定できた場合にのみ変換されますが、ルビの位置は正しくない場合があります。
PDFフォームデータ 変換されません。情報は削除されます。
PDF注釈 変換されません。情報は削除されます。
スキャナで取り込んだPDF 1ページが1枚の画像として変換されます。

[1] タグ付きPDFではそのような情報があります。しかし、出版物を印刷するためにタグ付きPDFを作っているケースはほとんどないでしょう。
[2] 参考:Wordなどのインポート機能

CAS-UB 4月4日の改訂内容 EPUBに不要な画像が入らないように。など

1.EPUB3/EPUB2の生成で、記事中で使用されていない画像でも、アップロードされているものすべてが生成物に入るようになっていましたが、使用されている画像のみを生成物に入れるように修正しました。

2.検索で、記事タイトルも検索するようにしました。

3.出版物新規作成で、ひな形の複製チェックボックスの既定値をオフに変更しました。

4.Kindleの生成で、EPUB3 用のテーマを指定したmobiファイルを Kindle で表示すると、目次の2頁目以降でリンクが無効になっていたので修正しました。(Kindleのリーダの問題を回避したものです)。

◎ところで、今日、1年ぶりにEPUB3のSVGの表示確認をしましたところ、iBooks3.1で、Spineに直接指定したSVGが表示できるようになっていたことを発見しました。

EPUB3では、spineに直接SVGを指定することができます。これを使うと、全画面をSVG線画で表すことなどができるようになります。

このCAS-UBでこの機能は既に昨年4月に開発がほぼ完了していたのですが、当時は、SVGを直接Spineに登録しても表示できるリーダがなかったため、公開することを見送っていたものです。

iBooksで表示できるようになったことから、もう一度、チェックを行なったうえで機能を公開したいと考えています。少しずつですが、EPUBリーダの表示機能は進歩しているようです。