Book Interchange Tag Suite (BITS) Version 1.0 の特長についての簡単な紹介

2013年末にBook Interchange Tag Suite V1.0(BITS)が発行された[1]。

以下は、4月初旬のJATS-CONでBITS開発者によるBITSに関する紹介発表[2]のメモである。

1.BITSは、JATS(NISO Z39.96-2012 Journal Article Tag Suite)を拡張したものである。JATSはNISOの標準だが、BITSは、NISOの標準ではない。BIST開発者からJATSへのコメントは多数出して一部はJATSに反映された。

2.想定する用途:
・技術専門書
・政府の報告書
・専門書のシリーズ
・本の章に匹敵するWebコンテンツ
・参考書
・カンファレンスの論文集
・百科事典

組版レイアウトを重視する雑誌、児童書などは除外されている。科学技術系教科書を除外しているわけではないが、実際には、BITS V1ではカバーしていない意味を表すタグや処理要求が多いだろう。

3.特長
(1) BITSの本には二つのトップレベル要素として本(book)と本の一部(book-part-wrapper) がある。book-part-wrapperは本の章などをモジュールとして分離して扱うためのものである。

(2) 本を一つのbookとして扱う場合でも、一部を別の独立したXML文書として作成しておいて、XInclude要素を使って取り込むことができる。

(3) 本の内容(book-body)は、JATS論文のbodyと類似の構造である。原則として、JATSで名前をつけた構造が本の中で使われるときは、BITSでも同じ名前を使う。構造モデルもできるだけ同じにする。

(4) BITSで追加した、本として専用の要素は、tocとindexである。

(5) Question-AnswerのモデルをJATSに提案したが採用されなかったため、BITSでは独自にQuestion-Answerのモデルを本の一部として定義した。

○参考資料
[1] Book Interchange Tag Suite (BITS) version 1.0
[2] What JATS Users should Know about the Book Interchange Tag Suite (BITS)

学術情報誌記述形式JATSの解説セミナーを開催、JATS-FOスタイルシートのオープンソース公開を予定

アンテナハウスは2012年5月24日13:30~東京・四谷において、「JATS 解説セミナー」を開催いたします。

今回のJATS解説セミナーでは、(1) 愛知大学教授の時実様をお迎えしまして JATS の解説をしていただきます。また、(2) JATS形式で作成された学術論文を学術誌用PDFに変換するスタイルシートをオープンソースで公開するとともに、その概要とカスタマイズ方法などを解説する予定です。

学術情報誌の分野は、一般書の電子書籍化よりも先行して電子化が進んでいます。特に英語版の学術情報誌は既に全面電子化されています。日本語の学術情報誌はまだ印刷も多いですが、早晩、全面電子化されることになると予想されます。

この鍵を握るのが、学術論文などを記述するための、XML準拠の仕様JATS(Journal Article Tag Suite)です。JATS―旧名はNLM-DTD―は欧米のジャーナル・アーカイブのためのデファクト標準となっています。現在、米国のNISOでNLM-DTDを継承するJATSの標準化が進んでいます。

日本でも科学技術振興機構(JST)が5月から運用開始した電子ジャーナル・アーカイブ J-STAGE3では、JATS0.4 ベースの書誌 XMLが全面採用されました。また論文の全文をJATS形式で搭載することも可能となっております。

現在、先進的な学会では論文全文のJATS化に取り組み始めており、学会誌を担当する制作・印刷会社でもJATS形式の論文制作するサービスを開始しつつあります。

学術論文をJATSで記述することで、論文のアーカイブの全文検索や閲読性を高めることができます。これにより論文が海外を含めて参照されたり、引用されることが増えると期待できます。

JATS形式で記述した論文は、スタイルシートをつかってHTMLに変換した上でブラウザでみたり、FOに変換してAH Formatterなどの自動組版ソフトを使ってPDFにして閲読します。

アンテナハウスは、この度、JATS0.4 に準拠して作成された論文をXSL-FOに変換する XSLT スタイルシートを開発しました。このスタイルシートを使うと、JATS形式の論文をAH Formatterによって高度なページ組版をすることができます。この作業は、従来FrameMakerや3B2などの専用の出版ソフトを使って行なわれていたのですが、それを置き換えることができるようになります。

5月24日のJATS解説セミナーにおいて、本スタイルシートを初公開する予定です。

■セミナー概要
※開催日時
2012年5月24日(木)13:30~16:30(受付開始13:15)
※タイムテーブル
13:30~    主催者挨拶
13:45~14:45 JATSの概要についての解説
  (愛知大学教授 時実象一氏)
学術雑誌出版の特徴
学術雑誌記事の構造
NLM DTD の歴史と利用
わが国での SGML/XML 学術出版の歴史
日本語学術記事の特徴と NLM DTD の問題点
NLM DTD の多言語拡張と JATS
JATS 0.4 の要点
14:45~15:00 休憩
15:00~16:00 JATS DTD仕様解説、JATS XMLデータをPDF化するために  (アンテナハウス株式会社 小林具典)
XSL-FOの基礎知識
XSLTスタイルシートの基礎知識
PDF化スタイルシート(オープンソース)について
概要、使い方
カスタマイズの方法
16:00~ ご出席者 質疑
16:30 閉会
※会場
アクセア第一会議室
東京都新宿区荒木町13の9 サンワールド四谷ビル1F
http://www.accea.co.jp/cr/yostsuya01.html#3
※受講料:10,500円
※定員:30名(事前申込み制)

■お申し込みは、
JATS 解説セミナー(JATS による日本語学術論文の標準化と自動組版)のご案内(株式会社エクスイズム)より、お願いいたします。

自動組版の強化とデジタルファーストへの道程

「日本語組版処理の要件」が4月10日にプリントされた書籍として発行されました。この書籍の本文は、4月3日に公開されたWeb版(日本語版)と同等であり、Webコンテンツをほぼそのまま書籍化したデジタルファースト出版の事例になります。

デジタルファーストによる商業書籍出版においては、自動組版の技術が重要なポイントになると考えていますので、その観点で以下に少し説明をします。

ワークフローの概要はまえがきなどに述べられている通りで、本書のプリント版の本文すべてをAH Formatter V6による自動組版で制作しています。AH Formatterで日本語の書籍を制作して商業出版を行なった例は過去にも多々あります。しかし、大きなコンテンツの書籍をデジタルファーストで出版するのにAH Formatterを使用した事例としては初めてになります。

本書は図版の数が膨大であるという点で、DTPで制作するとしても相当作業量がかかるはずですが、これを著者グループが自動組版で行なったことで出版社の負担は非常に小さくなっているはずです。また、自動組版を使うことでWeb版の内容をフィックスしてから極めて短時間にプリント版を出すことができているという点、デジタルファーストからプリント版を制作するワークフローに自動組版を組み込むことの有効性を示すことができたと思います。

プリント版とWeb版では図版の精度が違っていたり、索引などWeb版にはない内容をプリント版では付け加えていますので、まったく同じコンテンツということでもないのですが、このあたりの詳細は、4月23日にJAGATで開催される「電子書籍と日本語組版『W3C技術ノート 日本語組版処理の要件』出版記念」セミナーでもプレゼンが予定されています。

テキストと図版が混在する文書で図版がページに入りきらない場合、図版の前で改ページしてしまうと、そのページのテキストの後ろ側に大きな空きスペースができます。Microsoft Wordなどで文書を編集する際も同じことが起きますので、経験している人は多いと思います。DTPでも同じですが、こうした空きをなくすために、対話型WYSIWYG編集ソフトをつかって著者やオペレータが画面を見ながら図版とテキストの位置を調整するのが普通です。このため図版の多い書籍の組版はテキスト主体の内容の組版と比べると大変です。

AH Formatter V6では、この図版位置調整の操作をプログラムで自動的に行なう機能を備えています。これによって、今回「日本語組版処理の要件」のプリント版制作では調整の手作業は大幅に減っています。

AH Formatter V6の自動図版位置調整機能は、米国内国歳入庁の案件(下記ケーススタディ参照)のために間に合うように実装したものですが、「日本語組版処理の要件」でも有効性を発揮しました。

但し、「日本語組版処理の要件」は横組みで脚注がない一段組みという比較的シンプルなページレイアウトの書籍です。これが縦組みや大量の脚注がある書籍は図版の位置調整はさらに難しくなります。現在、CAS-UBでさらに様々な書籍を制作しながら図版の位置を自動的に調整する方法の改良をつづけています。

また、図版の多い2段組文書としては論文があります。米国内国歳入庁の帳票は多段組みなのですが、比較的シンプルでした。これに対して、複雑な論文への応用という点では、JATS(Journal Article Tag Suite)で記述された論文の自動組版があります。アンテナハウスでは、フルJATSで記述された論文の組版のためのスタイルシートを開発しましたので、これについては、5月24日のJATS解説セミナー(JATSによる日本語学術論文の標準化と自動組版)にて公開し、オープンソースとして配布する予定です。

こうしたことを通じて、さまざまなレイアウト・タイプのプリント版を自動組版で簡単に制作できるようにすることで、デジタルファーストの普及への道を切り拓きたいと考えています。

*「電子書籍と日本語組版『W3C技術ノート 日本語組版処理の要件』出版記念」セミナー
*JATSによる日本語学術論文の標準化と自動組版セミナー
*日本語組版処理の要件(日本語版)W3C 技術ノート 2012年4月3日
*「W3C技術ノート日本語組版処理の要件 美しく読みやすい文字組版の基本ルール」W3C日本語組版タスクフォース 編
*IRS:アメリカ合衆国財務省:内国歳入庁(PDF)
*時代を乗り越える日本語組版
*Page2012終了。いま、電子書籍制作のワークフロー論議をまとめると…
*NLM DTDからJournal Article Tag Suiteへの進展:これまでの経過整理

学術情報誌の全文XML化はデジタルファーストへの転換の引き金

J-Stage新システム(J-Stage3)の開発が大詰めに来ている。次のJ-Stage新システムに関するWebページによると、4月から新システムの稼動予定となっており、その時点で学会誌などの受け入れは新しい方式に切り替わるようだ。

http://info.jstage.jst.go.jp/society/development/index.html

J-Stage3では、学会誌や予稿集の受け入れデータ形式が次の2種類となる。

  1. 書誌XML形式―①書誌抄録引用XML、②全文PDF、③全文テキストファイル、④その他(電子付録やグラフィカルアブストラクト等)を登録するもの。
  2. 全文XML形式―①全文XML、②全文PDF、③図、表、④その他(電子付録やグラフィカルアブストラクト等)を登録するもの。

全文XML化はまだ選択肢のひとつであるが、将来は全文XML化の方向へ進むものと期待されている。全文XML化になればHTMLをはじめとしてさまざまな出力形式に変換できる。例えば、EPUBなどの電子書籍形式に変換してスマートフォンなどの上で読むのも簡単にできる。J-Stage3でこうした可能性が視野に入ってきたといえる。

現在、学術情報誌の制作では、紙による出版に備えて論文PDFをまず制作し、そのデータからXMLを作るというワークフローが主流になっている。しかし、最初から論文を全文XMLでオーサリングすることができれば、XMLデータからPDFを自動生成することができる。もちろん、HTML・EPUBを同時に作ることもできるので、そうなると学術情報誌のビジネスモデルはデジタルデータを先に配信して紙はオプションというデジタルファーストに転換するだろう。こうしてみるとJ-Stage3で学術情報誌の全文XMLによる受け入れはプリントファーストからデジタルファーストへの転換の引き金である。

もっとも、英語圏では学術情報はデジタルファーストどころか、デジタルオンリーになってしまっているようなのでいまさら「引き金」といっても誰も驚かないかもしれない。

上述のシナリオが絵に描いた餅でないことを次に具体的に説明する。

J-Stage3のXMLはJATS0.4形式である。JATS0.4形式はNLM-DTD 3.1に相当するもので、米国のNISOで標準化が進んでいる。

詳しくは:NLM DTDからJournal Article Tag Suiteへの進展:これまでの経過整理

先のJ-Stage3の紹介ページにはサンプルの論文ファイルがある。

【資料3別紙】サンプルファイル(BIB, XML:BIB-J, XML:Full-J)

このサンプル論文ファイルは上記のNISOのページから提供されているXSLスタイルシートでHTMLとPDFに変換することができる。AH Formatterを使ってPDF変換を試してみた。

1.AH Formatterを起動して、①入力ファイルにJ-Stage3で提供しているサンプルXMLを指定し、②スタイルシートに、NISOのページから提供されているスタイルシートを指定する。

2.サンプルのJATS形式論文ファイルは次のように表示される。AH Formatter(スタンドアロン版)はこの画面からPDFを出力できる。

ここで使ったXSLスタイルシートはプレビュー用途として提供されているものなので簡潔なレイアウトになっている。このXSLスタイルシートを見栄えのする論文レイアウト出力に改造する作業は容易である。論文のレイアウトは学会誌によって若干違うので学会誌毎に用意することになる。

論文を最初からJATS形式で編集することができれば、このようにしてPDFを作ることができるので、DTPによるPDF制作は不要となる。但し、JATSをどうやってオーサリングするかという課題が残り、実はここが大きな壁なのである。

いつ、どこがこの壁を破って、プリントファーストからデジタルファーストへの引き金を引くのか、4月以降の動きから目を離せない。