PDFレイアウトV2ベータ版を公開(書籍レイアウトの数値化に挑戦!)

本日より、CAS-UBのPDF出力レイアウトV2のベータ版を公開しました。ベータ版でも基本版面の選択項目は次のとおりで変わっていません。

左下のレイアウト詳細設定が変わりました。アルファ版からベータ版で追加した機能は、次の項目です。
・表紙のレイアウト
・目次のリーダ線のつけ方のパターン追加
・章番号・節番号を出力しない設定
・章扉を設けるか設けないかの設定
・図表番号をつけるかつけないかの設定

「レイアウト詳細設定」リンクをクリックしますとカテゴリー別のリンクのあるページになります。

上で設定したいカテゴリーを選択します。すると設定項目のメニューの箇所を表示します。例えば、「章扉」という項目を選択しますと、章扉に関連する設定項目を表示します。

○章扉(カテゴリー)では次の項目を設定できます。

・章扉の作り方
 章扉を作り、その裏から節を開始
 章扉を作り、扉は裏表
 章扉を作らず、章は奇数ページから始まる
 章扉を作らず、章は改ページで始まる

章扉に関するパターンの大部分は上の4通りに分類されます。

・章扉の文字組み方向
 横組
 縦組

・章扉のタイトルの行進行方向の開始位置(章扉のタイトルの行進行方向の開始位置の値)
 章扉のタイトルを行の進行方向(横組では上から、縦組では右から)の配置を指定します。センターにするか、実際の値を指定します。

ベータ版の段階で仕様は大よそ決定となり、これからはあまり仕様は変更しないで動作試験を行なうことになります。

ユーザーの皆様には、お使いいただいて問題がありましたらサポート窓口までご連絡をいただきますようお願いします。

以下、余談ですが、CAS-UBでは様々なパターンをパラメータ化して設定し、自動組版で指定されたレイアウトによる配置を実現することで書籍用のPDFを自動的に作成しようとしています。これがどこまでできるか、請うご期待です。

《広告》
「EPUBによる電子出版ビジネスソリューション調査報告書2012 追補版」で5つ星評価のEPUB制作ソリューション

Page2012情報 スユアe-パブリシング研究会オープンフォーラム開催案内

PAGE2012・オープンイベント
スユアe-パブリシング研究会オープンフォーラム開催案内
「 本番を迎える電子書籍・電子出版への対応 」
———————————————————

  立ち上がり始めた電子書籍制作ツールやサービスサイト、
   そしてソリューションについて

毎春恒例、PAGE展示会とジョイントで開催しているスユアオープンフォーラム開催のご案内です。
毎回、時代を先取りしたテーマで活発な議論を展開しています。

電子書籍については、EPUB3.0や業界団体の立上げなどに終始した2011年でしたが、
出版界では既に電子書籍が避けて通れない課題となりました。
一方、一般企業や教育・研究機関、官公庁などでも、電子書籍のフォーマットを活用した文書の効率的な制作・配布が、取り組むべき課題となっています。

ドキュメントやデジタルコンテンツに関わる幅広い業種業態の方々のご参加をお待ちしています。

***
PAGE2012・オープンイベント
スユアe-パブリシング研究会オープンフォーラム
第117回 開催案内

《開催概要》

開催日:2012年2月8日(水)
開催時間:開場13:00 フォーラム13:30~16:30
開催場所:池袋 サンシャインシティ文化会館7階 709会場
団体名:スユアe-パブリシング研究会  http://epub-jp.net
担当者名:伊藤 博
備考:(公開、無料、50名様限定 事前申し込み制)

《テーマと内容》

「 本番を迎える電子書籍・電子出版への対応 」

立ち上がり始めた電子書籍制作ツールやサービスサイト、
そしてソリューションについて

   *講演順、講演内容は都合により変更になることがあります。

1.電子書籍、雑誌における、インプレス『OnDeck』の取組みについて
  株式会社インプレスR&D 電子出版システム研究所 福浦一広氏
   http://www.impressrd.jp/

2.クラウドで本格的な電子書籍を~クラウド型汎用書籍編集・制作サービス
  アンテナハウス株式会社 代表取締役 小林徳滋氏
   http://www.cas-ub.com/  http://www.antenna.co.jp/

3.EPUB形式電子書籍制作環境『FUSEe® ver.1.0』について
  株式会社フューズネットワーク 代表取締役 池田 実氏
  http://www.fusenetwork.co.jp/  http://fusee.fusenetwork.co.jp/

4. 『Word2Xml2Word循環ソリューション』とオンラインドキュメントについて(仮題)
   ~Word2ePubの背景技術であるXML=XHTML~
  株式会社デジタルコミュニケーションズ 代表取締役 福重青史氏
  http://www.sgml-xml.jp/

《お申し込み方法》
 ■下記内容にご記入の上、必ずメールにてお申し込み下さい。
  お申込み多数の場合は抽選により参加者を決定させていただきます。
  当日は先着順の入場になります。
  満員の際はご入場できないこともありますので、予めご了承ください。
   [メール]hiro.ito@epub-jp.net

*参加申込書/
 1)スユアEP研究会第117回オープンフォーラムに参加します。
 2)お名前 :
 3)企業・団体名 :
 4)所属・役職 :
 5)TEL&FAX :
 6)E-mail アドレス:

出版の歴史に学ぶ『歴史のなかの「自費出版」と「ゾッキ本」』(大島一雄、芳賀書店発行)

電子書籍元年(2010年)からもうすぐ満2年になるが、まだまだ電子書籍の行方は見えてこない。こういう時期には、出版の歴史を過去に遡って調べて、混沌から秩序へどういう展開があったのかを学ぶのも良いのではないだろうか。

ということで、『歴史のなかの「自費出版」と「ゾッキ本」』(大島一雄、芳賀書店発行)を読んでみた。以下、本に書かれていたこと、そこから考えたことのメモである。

現在、自費出版と言う言葉は一般的であり、商業出版社、出版流通、書店などに属する業界人や職業作家からは若干低く見られているように思われる。しかし、自費出版の歴史は、出版(印刷)の歴史と結びついている。グーテンベルグが最初に作った「四十二行聖書」も立派な家が八軒も建てられるほどの借金で作った(p.62)ものであり、予約注文を集めて180部刷ったとはいえ自費出版には変わりはない。

日本では江戸時代の松尾芭蕉の「貝おほひ」、井原西鶴の「好色一代男」は自費出版的なもの(p.70)である。「好色一代男」はその後、世間に迎えられるようになり、様々な書肆(本を作り・売る書店)から出版されるが、言ってみれば本が売れたので本屋が扱ったというようなものである。現代的のような出版社、著者、流通が分業している世界での商業出版とは言えない。

近代の著名な著者の例では徳富蘆花「黒潮」、島崎藤村「破戒」、「春」、「家」(1906~1911)(pp.81~82)、宮沢賢治「春と修羅」(1924/4)、「注文の多い料理店」(1924/12)が(pp.116~117)、これ以外にも自費出版と確認された本の例がいろいろ取り上げられている。しかし、出版された本の奥付けだけでは費用を誰が負担したかが分かりにくいので表に出てこないが、著名な著者の本で、費用を著者が負担するという意味での自費出版で発行されたものは限りなくあるのだろう。

このように自費出版は印刷の歴史とともに生まれたようなもので、現在のように業界人、職業作家が分業化する以前からずっと続く、出版の原始マグマであると言える。新しい時代では、原始マグマに遡り、マグマをどう噴出させるを考えてみるのも良いだろう。

一方、「ゾッキ本」と言う言葉は聞いたことがなかった。「ゾッキ本」とは売れない本をダンピングして売るものを指していう(p.47)とある。本書にはこのほか、次のような用語が登場する。

・赤本
・作り本
・私家本
・地下本
・特価本
・自由価格本
・円本
・新古書
・海賊本
・バーゲンブック
・プロモーショナル・ブック

これらの用語の多くは書籍の流通・販売方法に関わるものだ。その中でも、「ゾッキ本」は、売ろうと見込んでして大量に作ったが、見込みに反して売れないので原価を割るようなダンピングで売るというということ。『出版販売を読む』という本に「デッドストックは時には処分した方が良いとされるときもあります。」とされている(p.147)。ブランドを大事にする出版社にとっては「ゾッキ」はブランド失墜を避けるために行ないたくないこと。自尊心の強い著者にとっては「自分の本が売れない」という不名誉は認めたくないことでもあり、あまり話題にしたくないことなのだ。

自費出版は出版の入り口、ゾッキ本は出版の出口の話であるが、いずれにしてもWebと電子書籍の時代では、この両者の概念も完全な見直しあるいは両方とも死語になってしまうのかもしれない。

《データ》『歴史のなかの「自費出版」と「ゾッキ本」』(大島一雄著、2001年2月発行、芳賀書店、ISBN4-8261-0160-0)

19-20日のメンテナンス報告、編集メニューの一部変更のお知らせ

19日から20日のメンテナンスで、クラウドセンターを変更しました。これまではNiftyクラウドを使っていましたが、19日からIIJのクラウドセンターとなります。

予めIIJにNiftyと同じ環境を用意しておき、データだけ複製した上でURLによるアクセス先をNiftyからIIJに切り替えています。切り替えは19日早朝に短時間で済んでおり、現在はすでに、IIJ側のWebサービス・サーバが稼動しています。

厳密には、19日朝7時に切り替えを行ないましたが、データの複製は切り替え直後に行なっていますので、この間10分間程度の間で、もしデータを入力していると失われている危険があります。(19日はメンテナンス日なので、入力している人はいないと思いますが。)

今日一日問題が発生していないかどうかを確認する作業を行なう予定です。正式運用は21日からとなりますので、ご了承ください。

なお、19日から編集画面で記事選択画面の記事内容表示の方法が変わりました。従来は、CAS記法から整形した状態で表示していましたが、今回から、CAS記法のままで表示するようになります(次の図)。

プレビュー機能は、従来どおりで変わりません。プレビューではCAS記法からHTMLに変換した上で、CSSスタイルシートを適用して表示します。

「EPUB作成ソフト試用レポート」の評価でCAS-UBに5つ星(最高点)がつきました

先日、「EPUBによる電子出版ソリューション調査報告書2012」(藤原 隆弘著、OnDeck編集部編)が発行されました。

○本誌の紹介と販売はインプレスR&D社のサイトにあります。
インターネットメディア総合研究所
http://r.impressrd.jp/iil/EPUB_solution2012/

この調査報告書は定価60,900円(税込) 本体価格:58,000円と高額出版物なので目にした人は少ないかもしれません。調査報告書ではEPUB3の要になるEPUBリーダ(25種類)について実際に表示させて評価したところでは、「各ビューアメーカとも開発途上であり、合格レベルの製品はないと言っても過言ではない」という厳しい評価となっています。

この追補版として、「EPUB作成ソフト試用レポート」が発行されました。
この試用レポートでは、アンテナハウスのCAS-UB、オープンエンドのSmart ePub、Open Office+Writer2ePubの3つの出版サービスを試用評価しています。

評価ポイント基準は0~5つ星までですが、CAS-UBは5つ星(「製品、サービスとしてある一定レベルにあり、EPUBの特徴も活かせ、さらにプロ向けの機能を有して、後工程で修正も不要である」)、つまり、最大限の評価を頂くことができました。(ちなみに、オープンエンドのSmart ePubは3つ星、Open Office + Writer2ePubは2つ星です。)

InDesignのEPUB出力の評価は掲載されていませんが、これはソフトウェアの性格から考えて4点にしかなりえだろうと思います。InDesignはDTPソフトでありWYSIWYGという命題を背負っているからです。一方において、EPUB(リフロー型)制作では構造編集が必要なのですが、WYSIWYGと構造編集を両立させるのは至難、または完全両立は不可能に近いのです。つまり、WYSIWYG/DTPとしての機能を追及すればするほど構造編集から遠くならざるを得ない面があるためです。紙やPDFがなくなれば、それとともにWYSIWYG/DTPは滅ぶと言うと少々過激かもしれませんが、未来はそれに近いとは言えると思います。

EPUB作成では、ブログでEPUBを作ったり、あるいは、一太郎のEPUB書き出し機能(予定)のように、コンシューマ向けのものが注目を集める傾向があります。しかし、コンシューマ向けの製品では高品質なEPUBを高い生産性で作るのは難しいだろうと思います。

CAS-UBは、ユーザー層をある程度セレクトして、セミプロ・プロフェッショナル向けであり、かつ、入りやすいEPUB制作フローを狙っているという点で、コンシューマ向けとは少し距離を置いています。それにコンシューマ向けは究極的には、いや最初の段階から既に、無料サービスの世界なので制作サービスはビジネスとして成り立たないでしょう。

《広告》
「EPUBによる電子出版ビジネスソリューション調査報告書2012 追補版」で5つ星評価のEPUB制作ソリューション

2012年EPUB3ブレークの条件

CAS-UBのセールスポイントはいうまでもなくEPUB生成、特に今後はEPUB3である。で世間の動きで見るとEPUBは多少の関心を集めてはいるが、ビジネスとしてはまだあまり盛り上がっていないといえるだろう。

(アドビなどと比べて)開発面で非力なサービス会社としては、この間に着々と開発を進めておき、大ブレークしたときにちょうど満点のサービスを提供できるととても都合が良い。なので、私としては今はまだ盛り上がらないほうが好都合なのだが、いつまでもそうは言っていられない。CAS-UBプロジェクトでそろそろ売上を稼がないと、ちょっと格好悪い。

ということで、来年はEPUBがビジネスとして盛り上がって欲しいのだが。そこで、2012年EPUBビジネスが盛り上がる条件を考えてみた。

1.第一にEPUB3の優れたリーダーが出てくること。先日発行された「EPUBによる電子出版ビジネスソリューション調査報告書2012」では25種類のリーダが紹介されているが、完成度の高いものはまだないと言って良い。EPUB3と言っても、縦書き、ルビなどではだめ。縦書き、ルビは小学生のレベルなのである。大学生・社会人ならば複雑なSVG図版、高等数式、それに英語を操る位は朝飯前でなければならない。それに、ときどき雑誌も読むかも知れないし。現在、こういうものを完全に表示できるのはPDFとPDFリーダになる。EPUB派が「PDFではだめだ」というからには、最低限として、PDFリーダでできる上記のこと位はできるEPUB3とEPUB3リーダを出す必要がある。これは技術的には可能だろう。

2.第二にEPUB3でビジネスをできる環境が整うこと。さらに望むならば、EPUB3でなければビジネスができない環境が出てくること。そういう意味ではアップルのiBooksとiBookstoreに期待していたのだが。残念ながらiBookstoreはいまだに日本では開店していない。iBookstoreがEPUB3オンリーで開店すれば、電子書籍ビジネスをやろうとすればEPUB3を作らざるを得ないという状況になるので、CAS-UBにとっては好都合である(勝手な言い分ですみません)。

3.第三に、これが一番本質なんだろうが、EPUB3でなければできない、という価値を提供できること。おそらく、1と2だけでも市場はある程度は伸びるが決定打には欠ける。EPUB命というならともかく、普通人には選択肢が多いのだ。つまり、PDFでできることやXMDF/.Bookでできることができたところで、PDF派やXMDF/.Book派を鞍替えさせることはできないということである。電子ファイル形式として他の選択肢があるなかでEPUB3を選んでもらうには他の選択肢ではできない価値を提供するしかないのだ。

1~3の条件が満たされればEPUB3は必ず大ブレークする。しかしながら、2011年の段階では上の1~3の条件は一つも満たされていないので、現段階ではまだビジネスとしては盛り上がらないのは必然である。もうすぐ2012年になる。来年はぜひEPUBをブレークさせたい。EPUBがブレークすればCAS-UBもブレークするだろう。これは問題ない(自信あり)。

《広告》
「EPUBによる電子出版ビジネスソリューション調査報告書2012 追補版」で5つ星評価のEPUB制作ソリューション

Adobe Digital Editionsでの数式表示、ナビゲーションファイル形式

Adobe Digital Editionsの1.8.1 preview版(ADE 1.8.1)は基本EPUB2なのだが、縦書きとかルビを使えるということで人気が出ている。

で数式はどうかなと考えて、CAS-UBで作成中の「CAS-UBで数式を使う方法について」からEPUB3を生成して、ADE 1.8.1で表示してみたところ次の図のようになった。

残念ながらMathMLによる数式はまだ表示できないようだ。

正しくは、数式の表示例2は次のようになって欲しいところ。

ちなみに、左側のナビゲーション・ウインドウが空なのはCAS-UBが出力するEPUB3ファイル(アルファ版)ではナビゲーションとしてNAV形式しか出力していないためである。EPUB3ではナビゲーションファイルの形式がNAV形式になるのだが、ADE 1.8.1はEPUB2ベースということで、NAV形式を未サポートである。

ちなみにADE 1.8.1に限らず、NAV形式をサポートしているEPUBリーダはまだ数少ないようだ。こうしたことで、CAS-UBでもEPUB3出力にNCXを入れるべきか入れざるべきかまだ思案中なのだが。

昨日のJBasic08の検討会の様子ではナビゲーションファイルとしてNCX形式(EPUB2用)とNAV形式(EPUB3用)の両方を含めることを推奨するということになりそうだ。

EPUB Publications 3.0によると、

1.The EPUB Navigation Document
It must contain exactly one EPUB Navigation Document conformant to the content requirements defined in EPUB Navigation Documents — Content Conformance [ContentDocs30].

2.The NCX feature defined in [OPF2] is superseded by the EPUB Navigation Document [ContentDocs30]. EPUB 3 Publications may include an NCX (as defined in OPF 2.0.1) for EPUB 2 Reading System forwards compatibility purposes, but EPUB 3 Reading Systems must ignore the NCX in favor of the EPUB Navigation Document.

ということなので、EPUB3.0にはncx形式のファイルを入れても良いが、しかしEPUB3にはNAV形式のナビゲーションを用意しなければならず、EPUB3のリーダはNCXを無視しなければならない。従ってEPUB3対応のリーダ用に限定するならNCXは無駄である。

つまり、NCXはあくまでもEPUB2リーダでEPUB3を読むときの補助手段という位置づけである。

逆にEPUB3で新しく拡張されたコンテンツ記述方式を多様している場合、これをEPUB2のリーダで読むとコンテンツが正しく表示されない恐れが大きい。そういったご表示を防止するためにも、EPUB3コンテンツにはNCXを入れないほうが良い可能性もある。

コンテンツ構造化の視点―大域構造化と局所構造化(メモ)

コンテンツの構造化にはいくつかの視点がある。ひとつは、大域か局所かというレベルである。

大域構造化とは、書籍で言えば記事を目次のレベルで分類したようなものである。すなわち、書籍は、前付け、目次、本文、後付といった大きな枠組み構造をもち、その下に、たとえば本文であれば、章、節、項という枠組み構造があり、全体としては木構造になる。

章、節、項という構造とは別に、柱、ページ番号(ノンブル)、脚注と言う構造がある。これは、本文の流れと関係するが、主にコンテンツにアクセスするための構造である。柱、ページ番号や脚注は可視化するときに内容と場所が決まるものである。分かりやすい例として柱をあげると、書籍の頁に片柱で章の表題を付けるとすると、その表題が現れる回数や場所は判型や版面によって異なることになる。

索引なども表示に依存する構造である。索引語を整理して配置して、索引から本文への参照をつける。印刷した書籍ではページ番号、Webや電子書籍ではリンクによる参照になる。電子書籍では検索があるので、索引は要らないのではないかというかもしれないが、全文検索ではヒットする箇所が多すぎて、情報を探すのに却って時間がかかるケースが少なくない。情報にアクセスするための構造としての索引は重要である。

局所構造化とは、テキストの中のセマンティックスに沿うものである。具体的な例は、先日紹介した「DITAの実践」の説明がある。節や段落よりも小さな断片情報を構造化することで検索・変換・表示などの便宜を図るものである(下記の「セマンティックスの役目とは」を参照)。

構造化における大域構造化と局所構造化の一つの例はDITAにおけるTopicとMapである。これはまさに大域構造化と局所構造化の使いわけであると考えている。実際のところMapの中にもかなり細かい指定があるのでそう簡単ではないのだが。

但し、大域構造化と局所構造化の概念は述べている人は少ない、というかこれは私の造語に近くあまり市民権はないし、まだ論理構成がずさんであるが、分かりやすいと思う。今後、もっと精密化したいと考えている。

◎過去の関連ブログ記事
1.セマンティックスの役目とは
12月11日CAS-UBブログ
2.コンテンツの構造化とは何か?Word文書のスタイル付けとマークアップ
http://d.hatena.ne.jp/cassupport/20110906/1315262225

書籍(PDF)における章の起こし方

CAS-UBのPDFレイアウトV2は現在アルファ版として利用可能ですが、さらにもう少し機能を追加する予定です。

その一つに、章の扉を作成する機能があります。章扉を作ることになりますと、改頁位置にいろいろなパターンがでてきます。あらゆるパターンを想定すると複雑になりますのでパターンを絞りこむために実際の書籍がどうなっているか少し調べてみました。

章の扉を作るかどうか、またその時、節をどこから開始するかをケースに分けてみますと次の図のようになりそうです。

図書館で実際に書籍を調べてみました。とりあえず59冊の書籍を調べてみた結果は次のとおりです。
1.59冊章・節の構成に近いと思われるものが48冊ありました。残りの書籍は単純な章・節構成に当てはめるのが難しいものです。
2.そのうち、章の開始パターンを分類しますと、次のようになります。
(1)上の図①に該当するものが4冊
(2)②に該当するものが31冊
(3)③に該当するものが7冊
(4)④に該当するものが6冊

章扉をもつ書籍が48冊中35冊ですので、4分の3近くあり意外に多いことが分かります。

章扉は、本文縦組み横組みに関わらず奇数頁になっています。そして章の扉をもつ書籍の多く(35冊中31冊)は、章扉の次の頁から節を開始しています。

章扉を持たない書籍では、章を常に奇数頁から起こすか、それとも成り行きにより、奇数頁または偶数頁から起こすかはほぼ半々です。

章扉を置くかまたは章を常に奇数頁から起こす場合(48冊42冊が該当)は、前の章の本文の分量によって章開始の前頁の本文が空白になる頁が出現するはずです。しかし、空白の頁が実際に出現している書籍は29冊なので、3割近い本は空白がなくなるように文章の分量を調整したり、本文空白の頁にコラムを配置するなどの編集者の工夫が見られます。なお、本文空白頁がある29冊の中で1冊を除き、柱もノンブルもない完全な空白となっています。

柱の方式は48冊の中で片柱方式が37冊と圧倒的に多く、両柱方式は6冊と少数派です。なお柱のない書籍が4冊もあったのは意外です。あと1冊は柱がない代わりに爪がありました。また、片柱はすべて奇数頁への配置となっていました。

片柱のときその内容はたいてい章見出しとなっています。このあたりは、現在のCAS-UBのPDF出力レイアウト設定のデフォルト設定と一致しています。

《広告》

セマンティックスの役目とは

以下の話は、CAS-UBとは直接は関係ないのですが、「DITAの実践(第2版)」を読んでいましたら、「セマンティックスの役目」という節(3.8節、pp.30~35)に次のような言葉が出ていました。

1.セマンティックスは意味的に適切な要素でカプセル化して情報をすばやく見つけることができるようにする。
2.コンテンツの表現よりも、情報に正しくセマンティックスを追加することで情報提示に一貫性を持たせる。
3.意味的な要素とは、「である」というコンテキストを提供するメタデータである。
4.節や段落よりも小さな断片情報にクエリを通じてアクセスできる。
5.「ボールド」、「イタリック」のような表示方法を変更するマークアップは、翻訳などで問題が生じる。
6.XSLTを用いて、表示を組織的に統一できる。変更も容易になる。

以下にセマンテッィクス要素の例示があります。

・apiname
・cite
・cmdname
・codeblock
・codepath
・filepath
・lines(歌詞や詩など、行が意味を持つ)
・lq
・menucascade
・msgblock
・msgpath
・option
・parname
・screen
・state(状態)
・synph(コマンドや構文の一部)
・systemoutput
・term
・uicontrol
・varname
・wintitle

ここでいうセマンテッィスはかなり局所的で、マニュアルの中で使うものが多いようですが、参考になる考え方です。

○出典「DITAの実践(第2版)」(Julio Vazquez著、DITAコンソーシアムジャパン訳、エスアイビー・アクセス発行、2011年11月、ISBN978-4-434-15881-0)