学術情報誌の全文XML化はデジタルファーストへの転換の引き金

J-Stage新システム(J-Stage3)の開発が大詰めに来ている。次のJ-Stage新システムに関するWebページによると、4月から新システムの稼動予定となっており、その時点で学会誌などの受け入れは新しい方式に切り替わるようだ。

http://info.jstage.jst.go.jp/society/development/index.html

J-Stage3では、学会誌や予稿集の受け入れデータ形式が次の2種類となる。

  1. 書誌XML形式―①書誌抄録引用XML、②全文PDF、③全文テキストファイル、④その他(電子付録やグラフィカルアブストラクト等)を登録するもの。
  2. 全文XML形式―①全文XML、②全文PDF、③図、表、④その他(電子付録やグラフィカルアブストラクト等)を登録するもの。

全文XML化はまだ選択肢のひとつであるが、将来は全文XML化の方向へ進むものと期待されている。全文XML化になればHTMLをはじめとしてさまざまな出力形式に変換できる。例えば、EPUBなどの電子書籍形式に変換してスマートフォンなどの上で読むのも簡単にできる。J-Stage3でこうした可能性が視野に入ってきたといえる。

現在、学術情報誌の制作では、紙による出版に備えて論文PDFをまず制作し、そのデータからXMLを作るというワークフローが主流になっている。しかし、最初から論文を全文XMLでオーサリングすることができれば、XMLデータからPDFを自動生成することができる。もちろん、HTML・EPUBを同時に作ることもできるので、そうなると学術情報誌のビジネスモデルはデジタルデータを先に配信して紙はオプションというデジタルファーストに転換するだろう。こうしてみるとJ-Stage3で学術情報誌の全文XMLによる受け入れはプリントファーストからデジタルファーストへの転換の引き金である。

もっとも、英語圏では学術情報はデジタルファーストどころか、デジタルオンリーになってしまっているようなのでいまさら「引き金」といっても誰も驚かないかもしれない。

上述のシナリオが絵に描いた餅でないことを次に具体的に説明する。

J-Stage3のXMLはJATS0.4形式である。JATS0.4形式はNLM-DTD 3.1に相当するもので、米国のNISOで標準化が進んでいる。

詳しくは:NLM DTDからJournal Article Tag Suiteへの進展:これまでの経過整理

先のJ-Stage3の紹介ページにはサンプルの論文ファイルがある。

【資料3別紙】サンプルファイル(BIB, XML:BIB-J, XML:Full-J)

このサンプル論文ファイルは上記のNISOのページから提供されているXSLスタイルシートでHTMLとPDFに変換することができる。AH Formatterを使ってPDF変換を試してみた。

1.AH Formatterを起動して、①入力ファイルにJ-Stage3で提供しているサンプルXMLを指定し、②スタイルシートに、NISOのページから提供されているスタイルシートを指定する。

2.サンプルのJATS形式論文ファイルは次のように表示される。AH Formatter(スタンドアロン版)はこの画面からPDFを出力できる。

ここで使ったXSLスタイルシートはプレビュー用途として提供されているものなので簡潔なレイアウトになっている。このXSLスタイルシートを見栄えのする論文レイアウト出力に改造する作業は容易である。論文のレイアウトは学会誌によって若干違うので学会誌毎に用意することになる。

論文を最初からJATS形式で編集することができれば、このようにしてPDFを作ることができるので、DTPによるPDF制作は不要となる。但し、JATSをどうやってオーサリングするかという課題が残り、実はここが大きな壁なのである。

いつ、どこがこの壁を破って、プリントファーストからデジタルファーストへの引き金を引くのか、4月以降の動きから目を離せない。