「日本語組版処理の要件」EPUB版をIDPFサンプルにて公開

「日本語組版処理の要件」(W3C技術ノート)のEPUB3版を作成しました。日本語版と英語版ですが、IDPFのEPUBサンプル集に追加されています。次からダウンロードしていただくことができます。

○日本語版:jlreq_20120525_ja.epub 8.0 MB

○英語版:jlreq_20120525.epub 8.0 MB

「日本語組版処理の要件」については、W3CのWeb版が正式ですが、すでにプリント書籍版が発行されています(★)。これで、Web、プリント、EPUB版と3種類揃ったことになります。

EPUB版は、CAS-UBとは異なる方法で、大よそ次のように制作しました。

(1) データ準備
W3C WebページのXHTMLを中見出し単位で分割し、分割したファイルを入力データとします。メタデータは手書きの外部XMLとして用意

(2) スタイルシート
目次(ncx、nav)、パッケージ(opf)などのファイルを生成するXSLスタイルシートを開発

(3) バッチでEPUBビルド
(1)で用意したデータを入力とし、(2)のスタイルシートを使って、バッチ処理でEPUBをビルド

★プリント書籍版を作成した報告は、AH Formatter ケーススタディの次のページにあります。

AH Formatter V6 による JLReq の自動組版

CAS-UBでの数式の編集とEPUB・PDFでの数式表示について

CAS-UBでは数式を含むEPUB/PDFの作成を重要なテーマとして位置づけて開発に取り組んでいます。数式機能は当初の予定よりも正式リリースが遅れているため、多くのお客様にお待ちいただいています。そこで、ここでCAS-UBでの数式の取り扱いの現状と開発の予定について報告いたします。

1. 現状

1.1 入力方法
コンテンツの本文にインライン数式とディスプレイ数式を埋め込むことができます。CAS-UBでは本文をCAS記法で記述しますが、数式はAMS-LaTeX (以下、TeXと略記します)の記法で記述します。数式の範囲は$$~$$で囲むことで本文と数式を区別します。

1.2 出力方法
a. EPUB3
EPUB3のコンテンツ本文はXHTML5ですが、数式部分はMathMLの形式でXHTML5の中に埋め込みます。EPUB3を出力するときTeXの記法からMathMLに自動的に変換します。

b. PDF
数式をTeXの記法からMathMLに変換し、AH FormatterでMathMLをレンダリングしてPDF中に数式を埋め込みます。

c. Webページ
ブラウザはMathJaxを使って数式を表示できます。そこで、CAS-UBのWebページ(プレビュー)作成では、数式部分をTeXのまま出力、XHTMLにMathJax対応コードを埋め込みます。

1.3 ドキュメント・サンプル
上述の入力と出力の方法は、CAS-UBの公開マニュアルに記載されていませんが、現在、クラウド上では上の仕組みを使うことができます。

使用方法、記述例およびサポートするTeXの記法、および出力結果を次のところにサンプルとして公開いたしました。このサンプルは、開発途上のアルファ版の段階であることをご理解ください。

CAS-UBサンプルの「CAS-UBによる数式の扱い」をご覧ください。

2. 開発課題

現在、次の点を課題として開発を行なっています。一部は計画も含み、今後変更になる可能性がありますのでご了解ください。

2.1 AMA-LaTeX記法からMathMLへの変換
TeXで記述した数式をMathMLに変換するとき変換できない記述があります。変換可能な範囲を増やす開発を行ないます。

なお、別の方法として、CAS-UBで編集するコンテンツにMathMLを直接埋め込むことも検討しています。これによりTeXから変換できない数式、MathMLとして予め用意されている数式コンテンツをEPUBやPDFにインポートしたり、貼り付けたりできることになるでしょう。

2.2 MathMLのレンダリングの改善
PDF生成時に数式をより綺麗にレンダリングするため、AH Formatter V6のMathMLレンダリング機能の強化を行なっています。具体的には次のような項目です。

(1) 数式専用フォントへの対応
STIXフォントなどの数式専用のフリーフォントを使ったレンダリングも行なうようにします。数式専用フォントを利用することで、数学の記号類をより綺麗にレンダリングできるようになります。

(2) MathMLのレンダリングのチューニング
MathMLをより綺麗に表示するためのレンダリングのプログラムの見直しと改善を行なっています。

2.3 その他
数式番号の付与方法、番号の自動付与、本文から数式を参照するための仕組みを開発します。

2.4 数式リーダ
MathML数式を含むEPUBを表示できるリーダは、現時点ではFireFoxのプラグインのみです。新たなリーダがでてきたら随時評価を行ないます。

3. 日程

上記の開発課題への対応は今年10~12月に完了する予定です。

4. EPUBリーダ

4.1 MathMLを表示できるEPUBリーダ

2.4項の通り、CAS-UBで作成したEPUB3では数式はMathMLで表現されています。EPUB3の仕様上は問題ないのですが、実際には、これを正しく表示できるEPUBリーダはFireFoxのプラグインのEPUBリーダのみです。iBooks, Adobe Digital EditionsなどのほかのEPUBリーダでは正しく表示できませんのでご注意ください。

4.1 その他の選択肢

EPUB3リーダでMathMLのサポートが見込めない状況であれば、数式をSVGにして埋め込むことにするかもしれません(未定)。

「魔性のプレゼンテーション~その美学と作法~」で実践プレゼンテーション技術を学ぶ

DITAコンソーシアムジャパンで、加藤哲義氏とご一緒することが多いのですが、かねがねプレゼンテーションがお上手で感心していました。その技を学ぼうということで本にしてもらったのがこれです。

「魔性のプレゼンテーション~その美学と作法~」(2011年11月18日発行)

http://www.cas-ub.com/project/index.html

CAS-UBで制作してPDF版とEPUB版を販売しています。

Google Booksで立ち読みできます。Google Booksで「魔性のプレゼンテーション」で検索してみてください。

昨日、DITAコンソーシアムジャパンの2012年度総会が開催されました。2011年度活動報告の中で、DITA Festa 2011 (2011/6), DITA Festa 2012 (2012/1) のプレゼンテーションの参加者アンケートが報告されています。

加藤氏のプレゼンですが、
・2011/6は「美味しいDITA コンテンツの作り方」第2位
・2012/1は「海外DITA 導入事例Part 2~DITA Europe2011 視察報告から~」第1位
でした。参加者のアンケートですので正真正銘の評価です。

DITAコンソーシアムジャパンは、今年度から優秀プレゼンテーション1, 2位を表彰することにしています。このままだとずっと加藤氏の連続表彰になってしまいそうです。

皆さん、「魔性のプレゼンテーション~その美学と作法~」を学んで、加藤越えを目指しましょう!

CAS-UBで作った超暫定版・中間交換フォーマットのファイル

CAS-UBで編集した汎用書籍コンテンツから「中間交換フォーマット」を出力する機能をつけてみました。

ちなみに、この機能は開発専用サーバだけについているものなので、CAS-UBの公開サーバにはありません。

で早速1ファイルを作成してみました。次がそのファイルです。

中間交換フォーマットのようなもの

中間交換フォーマットですが、現時点では「電子書籍交換フォーマット標準化会議」のWebページから仕様書(V1.1)が一般公開されているだけです。

電子書籍交換フォーマット標準化会議

で、その他の情報が一切公開されていません。このため「中間交換フォーマット」出力機能も勝手な仮定をおいてつくったものです。パッケージ形式も規定されていないようなので勝手にパッケージしました。

この中間交換フォーマットですが、2010年度に総務省の肝いりで作られた後、2011年度は経産省が多額のお金を出して、普及事業のプロジェクトを行なったのです。プロジェクト自体の報告会はありましたが、技術情報は現時点では一般公開されていません。プロジェクト参加会社以外は蚊帳の外です。

というわけでいま作るとすると仕様書を超独自解釈した「中間交換フォーマット」にならざるを得ないのですが、これが日本で初の一般に公開された「中間交換フォーマット」らしきもののサンプルということになります。このサンプルがでたらめなのか、もしかすると正しいのかは、プロジェクト参加会社以外には誰にも判断できないでしょう。

中間交換フォーマットは、経産省の「コンテンツ緊急電子化事業」で納品フォーマットとして採用されかけたのですが、結局「現バージョン(1.1)の中間交換フォーマットでは実績が少なく、さまざまなスタイルの書籍に対応させられる細かいガイドラインの策定まで至ることが出来なかった。」(制作仕様書V1.0 p.26)として採用されませんでした。

仕様書/フォーマットポリシー(PDF)

だって、あなた、まともな技術資料がまったく公開されてないんです。実績なんて造れるわけないじゃないですか。

参考)デジクリ連載[22]緊デジ事業で中間交換フォーマットを見送ったことについて

学術情報誌記述形式JATSの解説セミナーを開催、JATS-FOスタイルシートのオープンソース公開を予定

アンテナハウスは2012年5月24日13:30~東京・四谷において、「JATS 解説セミナー」を開催いたします。

今回のJATS解説セミナーでは、(1) 愛知大学教授の時実様をお迎えしまして JATS の解説をしていただきます。また、(2) JATS形式で作成された学術論文を学術誌用PDFに変換するスタイルシートをオープンソースで公開するとともに、その概要とカスタマイズ方法などを解説する予定です。

学術情報誌の分野は、一般書の電子書籍化よりも先行して電子化が進んでいます。特に英語版の学術情報誌は既に全面電子化されています。日本語の学術情報誌はまだ印刷も多いですが、早晩、全面電子化されることになると予想されます。

この鍵を握るのが、学術論文などを記述するための、XML準拠の仕様JATS(Journal Article Tag Suite)です。JATS―旧名はNLM-DTD―は欧米のジャーナル・アーカイブのためのデファクト標準となっています。現在、米国のNISOでNLM-DTDを継承するJATSの標準化が進んでいます。

日本でも科学技術振興機構(JST)が5月から運用開始した電子ジャーナル・アーカイブ J-STAGE3では、JATS0.4 ベースの書誌 XMLが全面採用されました。また論文の全文をJATS形式で搭載することも可能となっております。

現在、先進的な学会では論文全文のJATS化に取り組み始めており、学会誌を担当する制作・印刷会社でもJATS形式の論文制作するサービスを開始しつつあります。

学術論文をJATSで記述することで、論文のアーカイブの全文検索や閲読性を高めることができます。これにより論文が海外を含めて参照されたり、引用されることが増えると期待できます。

JATS形式で記述した論文は、スタイルシートをつかってHTMLに変換した上でブラウザでみたり、FOに変換してAH Formatterなどの自動組版ソフトを使ってPDFにして閲読します。

アンテナハウスは、この度、JATS0.4 に準拠して作成された論文をXSL-FOに変換する XSLT スタイルシートを開発しました。このスタイルシートを使うと、JATS形式の論文をAH Formatterによって高度なページ組版をすることができます。この作業は、従来FrameMakerや3B2などの専用の出版ソフトを使って行なわれていたのですが、それを置き換えることができるようになります。

5月24日のJATS解説セミナーにおいて、本スタイルシートを初公開する予定です。

■セミナー概要
※開催日時
2012年5月24日(木)13:30~16:30(受付開始13:15)
※タイムテーブル
13:30~    主催者挨拶
13:45~14:45 JATSの概要についての解説
  (愛知大学教授 時実象一氏)
学術雑誌出版の特徴
学術雑誌記事の構造
NLM DTD の歴史と利用
わが国での SGML/XML 学術出版の歴史
日本語学術記事の特徴と NLM DTD の問題点
NLM DTD の多言語拡張と JATS
JATS 0.4 の要点
14:45~15:00 休憩
15:00~16:00 JATS DTD仕様解説、JATS XMLデータをPDF化するために  (アンテナハウス株式会社 小林具典)
XSL-FOの基礎知識
XSLTスタイルシートの基礎知識
PDF化スタイルシート(オープンソース)について
概要、使い方
カスタマイズの方法
16:00~ ご出席者 質疑
16:30 閉会
※会場
アクセア第一会議室
東京都新宿区荒木町13の9 サンワールド四谷ビル1F
http://www.accea.co.jp/cr/yostsuya01.html#3
※受講料:10,500円
※定員:30名(事前申込み制)

■お申し込みは、
JATS 解説セミナー(JATS による日本語学術論文の標準化と自動組版)のご案内(株式会社エクスイズム)より、お願いいたします。

5月16日~教育ITソリューションEXPOにてCAS-UBを出展します

5月16日(木)~18日(金)の東京ビッグサイトで開催される「教育ITソリューションEXPO」 に出展いたします。

  • 会期 : 2012年5月16日(水)~18日(金)
  • アンテナハウス小間案内 : 学校業務支援ゾーン 3-8

CAS-UBは教育分野でのマニュアル、教材電子書籍化、研究レポートなどの制作に最適です。展示会場ではCAS-UBでこれらの出版物を制作するデモンストレーションのほか、サンプル出版物をご覧いただけるように用意いたします。

コマは西ホールの比較的入口に近いところですので、ぜひお立ち寄りください。

「教育ITソリューションEXPO」

ご入場には招待券が必要です。招待券のご請求はアンテナハウスの営業担当までお気軽にどうぞ。