注釈実装と注釈サービスの拡大、EPUBリーダーでの実装、および注釈の標準化への動き。

注釈とは、他のコンテンツのある部分に関連つけた内容のことである。PDFやマイクロソフトWordには独自の注釈機能がある。また、電子書籍/EPUBリーダーではKindle、iBooksを初めとしてEPUBのある箇所にしおりをつけたり、マーカーで色をつけたり、コメントを記入する機能がある。

これらの様々な注釈はメディア別に独自の実装が行われており交換可能ではない。注釈を交換可能にするためにはオープンな標準仕様が必要である。現在、Webを中心にさまざまな注釈の標準化が始まろうとしている。

1.注釈を実装するプロジェクト

(1) Annotator(http://annotatorjs.org/)[1]

Annotatorは主にNick StenningとAron Carrollによる、Webに注釈をつけるためのオープンソースのJavaScriptライブラリー開発プロジェクトである。GitHubのコントリビュータをみると、最近はNick Stenningに加えてHypothes.isのRandall LeedsとKristof Csillagがかなりコミットしている[2]

Annotatorはコアをプラグインにより簡単に拡張できる仕組みになっている。Store(保存用)、Auth(認証用)などのプラグインが用意されている。

注釈データはJSON文書で、指定した対象文書の中で、注釈の位置と内容を示す多数のフィールドから構成している。プラグインを追加するとそのプラグイン用のフィールドが追加される。

現時点で、Annotator v1.2.9(2013/12/3)が最新である。
V2.0の開発が始まっている。

次に述べるHypothes.isをはじめとする様々なプロジェクトで使われている[3]

(2) Hypothes.is

Hypothes.isは非営利活動法人として、さまざまな団体からの資金をあつめて、Webの注釈サービスを提供する。Hypothes.isは、Open Annotation Collaborationが作成している注釈仕様とAnnotatorプロジェクトを元にしていると主張している。たとえば、Annotatorの初期投稿者であるAron Carrollが製品開発担当として参加している[4]

2013年4月から”I Annotate”というカンファレンスをサンフランシスコで開催しており、2014年の”I Annotate 2014″は4月3日から5日に開催された[5]

Hypothes.isは前日に同じ会場で開催されたW3Cの注釈ワークショップのスポンサーになっており、設立間もないにも関わらず注釈サービスの分野で強力な存在になりはじめている。

たとえば、Journal of Electronic Publishingの2014年4月号は、Hypothes.isを採用して学術誌のWeb版に注釈を可能にした(次の図)[6]

JEP20140727

Hypothes.isのブログや公開されたスポンサー(資金源)を見ると、教育分野での注釈にかなりウエイトを置いているように見える。

2.EPUBの注釈

(1) EPUB.js

Fred ChasenによるEPUB表示用JavaScriptである。サンプルの中にHypothes.isと組み合わせてEPUBに注釈を表示するところを示すものがある。”I Annotate 2014″で、Fred Chasenらによるプレゼンが行われている[7]

(2) Readium

EPUBの仕様を策定しているIDPFはReadiumというEPUBリーダー開発プロジェクトを運営している。ReadiumにはReadiumSDKと、Readium.jsがある。

Readium.jsはChromeの拡張アプリケーションとして配布されているが、注釈機能は用意されていない。

Readium.jsのソースレポジトリにはWeb Annotationのためのレポジトリが用意されているがまだ内容はなにもない[8]

Readiumは注釈機能の追加を考慮しているが、注釈の標準化がまだということで実装には至っていないように見える。

(3) IDPFのOpen EPUB Annotation (7/29追記)

IDPFは、教育用テキスト向きのEPUBプロファイル仕様の策定を進めている。EDUPUBは、5月28日にすでにドラフトが公開されている。
EDUPUB仕様策定の一環として「Open Annotation in EPUB」仕様のドラフトが作成されている。[13]
W3Cにおける仕様策定作業との関連性が不明であるが、EPUBの注釈仕様は早くできるかもしれない。

3.注釈の標準仕様策定への動き

Open Annotation Collaborationでは「Open Annotation Data Model」というコミュニティ仕様を提案してきた。これは注釈を交換可能な枠組みを作ることを目的としている。この活動は次のW3Cの活動に継承されており、Open Annotation CollaborationのWebサイトは歴史的な目的で保存されている、とされている[9]

4.W3Cの動き

(1) Open Annotation Community Group

W3Cは、Open Annotation Collaborationの動きを吸収して、Open Annotation Community Groupを開設し、この分野への参入を狙っていた[10]

(2) 注釈ワークショップ

2014年4月2日にサンフランシスコでW3C初の注釈ワークショップが開催された[11]。″I Anotate 2014″と同じ会場で開催されており、Hypothes.isがスポンサーになっている。

ここでは、既存の注釈システムと注釈の実装、注釈モデルへの一般的な要求、頑健なアンカー、画像などのデータに対する注釈、蓄積とAPI、アクセシビリティと法的な問題というセッションに分けて注釈についての現状と要求のプレゼンテーションがなされた。

注釈の課題についての20のプレゼンテーションがあった。報告書にはプレゼン、ビデオが添付されている。主なものは次の通り。
・注釈の課題は、注釈本体のコンテンツよりも、注釈の本体と対象コンテンツとの関連付けにある(Randall Leeds (Hypothes.is, USA) )。
・マイクロソフト・オフィスオンライン、VisualStudioにおける注釈(Chris Gallello (Microsoft, USA) )
・学術分野における注釈(Anna Gerber (University of Queensland, Australia))
・Logosソフトとサービス。聖書関連の注釈の利用者は注釈にお金を払う。(Sean Boisen (Logos Bible Software, USA))
・出版におけるさまざまな注釈(James Williamson (John Wiley & Sons, USA))

(3) 注釈WG結成への動き

2014年7月14日からデジタル出版活動に注釈のワーキング・グループ(Annotation Working Group)を設立する憲章の検討に入った。WGの憲章は8月19日まで公開レビュー中である。その目的は注釈についてのオープンなアプローチで、ブラウザ、電子書籍リーダー、JavaScriptのライブラリーなどで注釈をつかえるエコシステムを作ることである。開発目標としては次の項目が挙がっている[12]

(a) 抽象データモデルと語彙の開発:これは、W3CのOpen Annotation Community Groupが開発したOpen Annotation Data Modelからスタートする。
(b) HTMLや埋め込みデータ形式へのシリアライズ
(c) DOMやスクリプトへのインターフェイス
(d) リンクのメカニズム:WebApps Working Groupとの共同で開発する。

9月に最初の電話会議を行い、12月に最初のAnnotation Abstract Data Modelとその語彙(Vocabulary for the Annotation Abstract Data Model)に関する草稿を発行する。

数年で最終成果物として勧告仕様を作成することを目論んでいる。

[1] Annotator
[2] Annotator GitHub
[3] Annotator Showcase
[4] Hypothes.is
[5] “I Annotate 2014”
[6] New Feature: Article Annotation with Hypothes.is
[7] Epub.js: Bringing Open Annotation to Books
[8] web-annotations
[9] Open Annotation Collaboration
[10] Open Annotation Community Group
[11] 注釈ワークショップ報告(Web Annotations Workshop Report)
[12] draft charter for the Annotation Working Group
[13] Open Annotation in EPUB, Draft Specification 28 May 2014
[14] 注釈を利用する形態についての整理

組版の価値。組版と画面表示(レンダリング)の相違を考える。

先日、思いつきをTweetしましたが[1]、以下、その続きを少し考えてみました。

組版という言葉は、Wikipediaでは次のように定義されている。

「印刷の一工程で、文字や図版などの要素を配置し、紙面を構成すること。組み付けとも言う。」

印刷においては「版」を複製のために用いる。複製した結果は冊子や書籍の形式に製本される。こうして、「版」のレイアウトは永続的な物体化される。「版」が生み出すものが永続的であるが故に、きれいなレイアウトの「版」を創るのにコストを懸ける意味があり、また、複製する数量が多いときは、頁の数を減らすための努力がコスト削減という価値を生み出す。つまり「版」は印刷に利用されて大きな価値を生む。

組版はDTPの専門家の仕事であるが、このようにDTPは印刷と切り離しにくい。

自動組版で作る版面は、DTP専門家によるそれと比べると複雑さは劣るが、それでも細かい調整がだいぶできるようになってきた。次のような項目である。

・改行位置の調整
・長体による枠内へのテキストの押し込み
・改頁位置の制御(見出しと本文の泣き別れ防止)
・頁内での図の位置のフロートによる調整
・テキストと図の位置関係の入れ替えで頁の空きをなくす
・段組のときの左右の行の位置揃え

これらは、ほとんど組版エンジンの中のプログラムで自動処理できる。さらには、先日の「AH Formatter事例紹介セミナー」でTony Graham氏が紹介したように、組版エンジンの外側にワークフローを組んで図版の最適配置の決定もできる[2]。こうした処理の自動化は組版オペレータの判断をプログラム処理に置き換えるもの、自動組版のインテリジェント化である。現在は、コンピューターの処理能力が高まったので、インテリジェントな自動組版の高速処理ができる。

自動組版のインテリジェント化のコストは、それが永続的な複製物を作る「版」への投資であることによって正当化される。

EPUBリーダーでは頁表示が標準的に採用されているが、電子端末での画面は、読者が読む瞬間だけ頁表示するものであり、永続的な複製物を作るものではない。

こう考えると、組版と電子端末上での画面表示のための可視化(レンダリング)の戦略の間には、かなり根本的な相違がありそうだ。

印刷を想定しないPDF作成においてテキストや図などを頁上に配置する戦略は、その中間になるのだろうか。

[1] 組版は紙という静的な媒体上に、コンテンツを最適配置する概念で、最適配置のために何回も試行してもかまわない。一方、CSSは電子媒体上に瞬時にコンテンツを表示することを狙っており、最適配置よりも、一応見えれば良いということが優先される。
[2] JATS組版:3つ数えるくらい簡単

AH Formatter 事例紹介セミナー CSS組版とXSL-FO組版

7月8日AH Formatter事例紹介セミナーが無事終了しました。久しぶりの事例紹介セミナーでしたが多数のご参加をいただき盛況でした。

10489630_579466945507000_7435886537253360718_n

アンテナハウスの村上によるAH Formatterの機能紹介に続いて、各発表者より6つの事例紹介がありました[1]。事例は皆大変参考になるもので、発表いただいた方々にお礼申し上げます。

ところで、今回は奇しくもCSS組版とXSL-FO組版が半々で、CSSとXSL-FOはどう使い分けたら良いのだろうか、と改めて考えさせられるものでした。

シンプルなレイアウトの組版に使えるCSSの事例
①DITAとCSS組版で気軽にシングルソースパブリッシング
②メディカル業界におけるAH Formatter活用事例
③簡易マークアップとAH Formatterによる商業品質を満たした技術書籍制作フローの展望

最初の発表は、DITAをPDF化するのにCSS Formatterを採用した事例です。現在、XMLドキュメントの応用では、DITAがもっとも多いと見られます。DITAで制作したドキュメントをPDF化するフローは、DITA-OTのPDFプラグインを使うのが主流です。PDFプラグインはXSL-FO組版です。これに対して、coolia 土肥氏は、XHTMLを中間生成物とし、それをCSSで組版するというアプローチをとったところがとても斬新です。CSSはCompassで生成しているということなので、あまり複雑なレイアウト指定は難しいと思いますが、レイアウトが簡単な場合は有効でしょう。操作マニュアルでは、必要な情報を素早く見つける・検索しやすさが重要です。この場合はレイアウトはあまりこだわらず、シンプルとなります。こうしたマニュアルを作るにはCSSによる組版レイアウト指定も良い方法です。

高度なワークフローに耐えるXSL-FO組版の事例
①紙印刷からスマフォ対応までワンソースで作る取扱説明書 ~XMLを使いまわす自社開発システム「ITREX」の事例~
②XSL-FOの実践--このTony Graham氏の発表は、前半がXSL-FOがどのように使われているか、後半はJATS組版の事例です。後半の事例は4月に行なわれた米国のJATS Conferenceで発表された論文に基づく発表です。論文の日本語訳を別途公開しています[2]
③AH Formatterを使った日本語JATS XML組版の実践

XSL-FOの発表では二つがJATSドキュメントの組版に採用した事例です。JATSは学術論文のためのXML仕様で、日本ではJ-Stageが採用していますが、まだあまりポピュラーではないようです。Tony Graham氏の事例は、XSL-FOを使ってJATSで記述した学術論文を高度なレイアウトのPDFにするということで自動組版の最先端の利用になると思います。

[1] 7月8日 AH Formatter 事例紹介セミナーのタイムテーブル(敬称は省略させていただきます)

10:30 開会
10:35~ AH Formatter概要説明 アンテナハウス(株)AHFormatter開発担当者 村上真雄
11:05~ DITAとCSS組版で気軽にシングルソースパブリッシング (有)coolia 土肥弘子
11:35~ メディカル業界におけるAH Formatter活用事例 ダイコウクリエ(株) 梶原浩喜
12:05~ 質疑応答
12:15~ 昼休憩
13:15~ 紙印刷からスマフォ対応までワンソースで作る取扱説明書
~XMLを使いまわす自社開発システム「ITREX」の事例~
三和印刷工業(株) 代表取締役 竹内栄司
13:45~ XSL-FOの実践 Mentea Director Tony Graham
(逐次通訳にて講演します)
15:45~ 休憩
16:00~ AH Formatterを使った日本語JATS XML組版の実践 中西印刷(株) 山本剛
16:30~ 簡易マークアップとAH Formatterによる商業品質を満たした技術書籍制作フローの展望 (株)トップスタジオ 武藤健志
17:00~ 「カタログ作成システム」でのFormatter使用 共同印刷(株) 藤森良成
17:30~ 質疑応答
17:45~ 閉会

[2] JATS組版:3つ数えるくらい簡単

『PDFインフラストラクチャ解説』第3回目POD本の組版レイアウトを評価していただける方を募集しています。

『PDFインフラストラクチャ解説』の3回目のPOD版ができました。CAS-UBで編集した書籍を、PDFに生成してプリント・オン・デマンド(POD)で紙の本としたものです。

pod-2nd

これにより、①PODにかかる時間、コスト、できばえなどを評価し、また②CAS-UBのPDFページレイアウトのデフォルト値を最適化するのが目的です。

組版レイアウトの評価をしていただける方に最新POD版を提供いたします。関心をお持ちの方はcas-info@antenna.co.jpまでご連絡ください。部数が少ないため、先着五名の方に限らせていただきます。ご連絡をお早めにお願い致します。(募集は終了しています。)

(1) 所要期間とコスト
期間:6月23日(月)にPODを発注し、6月30日に納品されましたので1週間です。
コスト:表紙を除いて264頁(モノクロ)、表紙は4色。10冊で約22,500円(税込み)です。1冊2,250円(税込み)となりました。

(2) ページレイアウト
B5版、1頁36行、1行39文字、本文10ポイント、行間7ポイント(次写真)。
pod-2nd1

前回のPODは、1頁33行、1行39文字、本文10ポイント、行間8ポイントでした(次写真)。
pod-1st1

両者を比較しますとやはり前回は少しゆったりした感じですが、今回は1頁の文字が少し多い印象があります。

(3) 本文フォント
・本文のフォントはIPA明朝ですが、英数字は欧文フォント(Liberation Serif)です。英数字に欧文フォント(プロポーショナル)を使うと印象がかなり変わります。
・前回はすべてIPA明朝でした。

(4) 見出し
・今回は章・節・項をIPA明朝としています。
・前回は章・節・項をIPAゴシックとしています。

(5) 表のレイアウト
・今回は罫線については、JIS X4051風に変更しました。
・表のセル内テキストは8ポイント、セル内行間は4ポイントです。
pod-2nd2

・前回の表のレイアウトはヘッダに網掛け、セルに四辺網掛けです。
pod-1st2

(6) 図・表のキャプション
・図表の番号とキャプションを今回は0.8emとしています。
・前回のPODでは本文と同じサイズにしていました。

今日から国際電子出版EXPO POD本、PDFから画像作成ツール、ほか出展いたします。

7月2日本日から国際電子出版EXPOです。

アンテナハウスは、西展示棟(アンテナハウス・ブース: 14-61)にて出展いたします。

大変失礼しました。昨日、ブース番号が間違っておりました。

IMG_20140702_111218

出展1 CAS-UB
今回の出展はCAS-UB V2.2(昨年の終わりにV2.2とし、また、先月6月26日に改訂を行なっております。)

CAS-UBではEPUBを制作するのみではなく、同一のソースから印刷に使えるPDFを作ることもできます。

出展2 POD本
電子出版なのに、なぜPOD本?と疑問をお持ちの方に。
ワンソース・マルチユースでEPUBとPOD本がスマートです。

昨年来CAS-UBで制作、PDFを生成してPOD(プリント・オン・デマンド)で書籍とした出版物も用意いたしましたので、ぜひ、お手にとってご覧ください。

pod-2nd

ちなみに、最新刊は『PDFインフラストラクチャ解説』となります。ぜひお手にとっていただき、紙面レイアウトについてのご意見を承りたいと存じます。

出展3 PDF画像制作ツール
PDFからキャプション付きの画像を作ったり、数式を自動認識してSVGにすることができます。
簡単な紹介はこちらにございます。
電子出版サービス 日々開発途上!

会場では、ぜひ、デモをご覧ください。

出展4 電子書籍配信システム
会員制の電子書籍の配信のためのシステムを試作しました。