本はWeb化するか その3 J-STAGEの新バージョン評価版をみて考えたこと

6月2日開催された「学術情報の流通を考える-ORCIDとJ-STAGE新バージョン評価版をめぐって-」セミナーに参加しました[1]

ORCIDの話も面白かったのですが、小倉 辰徳氏によるJ-STAGEの新バージョンの紹介が、いま考え中の課題「本はWeb化するか」の観点から大変参考になりました。セミナーのスライドはこちらです[2]

J-STAGEは、「見やすく,使いやすいジャーナルサイト構築のため,海外のジャーナルプラットフォームを参考にしつつ,デザインを一新する.」(スライド[2]p5より)として開発中です。機械学会、薬学会より3誌をモデル誌として選択して、1年ほど前からベータ版の運用試験を行っており、2017年度中に全雑誌に適用する予定とのことです。

画面の説明など、詳しくはスライドで紹介されていますのでご参照ください。

早速、J-STAGEの評価版Webページを見ました。機械学会の「Mechanical Engineering Letters」は全文HTMLではなく、PDFダウンロードです。それに対して薬学会の「Chemical and Pharmaceutical Bulletin」「Biological and Pharmaceutical Bulletin」は全文HTMLを見ることができます。

例えば、Chemical and Pharmaceutical Bulletin[3]は、画面切り替えタブで、ジャーナルのホームページ、発行前の原稿が確定した版(Advance online publication)、各号(Journal issue)、主要論文(Featured articles)、ジャーナルについて(About the journal)に切り替わります。そして各論文の内容はPDFダウンロードに加えて全文HTMLを見ることができます。

ちなみに、Palladium(0)-Catalyzed Benzylic C(sp3)–H Functionalization for the Concise Synthesis of Heterocycles and Its Applications(Volume 65 (2017) Issue 5 Pages 409-425)の全文HTMLのWebページを見てみます[4]

Webページ全体のデザインは次のようになっています。

このHTMLページは、Window幅を狭くすると2段階のブレークポイントで表示が切り替わります。第1段階ではジャーナル上位のダウンロードメニューが右からジャーナル概要の下に切り替わります。第2段階でArticle overviewのメニューがボタンに縮退します。スマホで見ると次のようになります。

こうしてみますと、まさに現代風のレスポンシブデザインになっています。

そこで、気になるのが、このWebページがどのように作られているかです。ソースファイルを見ますと、Webページは次のような構成になっています。

HTML5で1953行であり、3行目~35行目がhead要素。9個の外部CSSをリンクしています。
36行目~1952行がbodyで、bodyの最後部1378行目~1952行にJavaScriptがあります。かなり直書きされており、全体の行の29%がJavaScriptです。

bodyは次のように分かれています。
・header要素:39~148行
・ジャーナル専用部
・footer要素:1311~1362行目
・フィードバックボタンなど1363~1377行目

header、footerはJ-STAGEシステム全体のメニューなどがあり、ジャーナル専用の部分は149行目~1310行目です。

ジャーナル専用部は次のように分かれています。
・ジャーナル紹介:151~163行目
・画面切り替えのタブ:166~180行目
・パンクズリスト:180~194行目
・記事毎のタイトルと概要・右メニュー:195~306行目
・ジャーナル記事本文:309~1304行目

全体としては記事本文が半分でそれ以外がタイトルやナビゲーションメニュー部となります。

こうしてみますと、Webページは、コンテンツが半分でそれ以外がリンクやナビゲーションのHTMLとCSSとJavaScriptから構成されている、一種のプログラムとデータの集合体と言えます。

Web誕生の頃は、HTMLだけで書いていたのですが、その後HTMLとCSSが分離し、現在のWebページは、HTML+CSS+JavaScriptとなっていますが、このJ-STAGEページはその典型例です。

こうしたWebページはもはや人手でHTMLをコーディングするものではなくなり、CMSに登録したデータからCMSの機能を使って生成しているはずです。そういう意味でCMSに完全依存となっています。

出版物のコンテンツがプログラムと組み合わさってWeb上のアプリケーション化しています。学術情報誌のページとなりますと、こうしたページが何万、何百万個と作られます。そこで、私として一番気になるのは保守コストです。保守は3つに分かれます。

(1)まず、障害対応です。Webページに直書きされているJavaScriptページは一番問題で、ここにバグがあるとWebページそのものを作り直しとなります。

(2)次は改良です。CSSとJavaScriptが膨大になっていますので、これらを改良したとき今までのWebページに問題が起きないかどうか? 

(3)次に抜本的な作り直しです。今回のJ-STAGEのユーザーインターフェイスの作り直しは2015年から開始しているとのことですので、既に2年掛かっています。これを2017年度内に全雑誌に適用するということですが、膨大な費用が掛かっているのは間違いありません。

WebのコンテンツをHTMLで作り、CSSでレイアウトし、JavaScriptでインターフェイスを操作する、という流れ。さらにスマホの登場でレスポンシブにするという流れが加わり、Webページのメンテナンスコストがどんどん大きくなっていく傾向にあるように感じます。

ここでもう一度、コンテンツとアプリケーションを分離したEPUB3の良さを見直してみる必要がありそうです。特に、学術論文のようにタイトル数が膨大なものをWebにするとき、プログラムを組み込んでアプリケーション化すると、将来の保守コストが大きな問題になるのは間違いないところです。

[1] XSPAセミナー「学術情報の流通を考える-ORCIDとJ-STAGE新バージョン評価版をめぐって-」のご案内
[2] J-STAGEの評価版について(スライドシェア)
[3] Chemical and Pharmaceutical Bulletin
[4] Palladium(0)-Catalyzed Benzylic C(sp3)–H Functionalization for the Concise Synthesis of Heterocycles and Its Applications(Volume 65 (2017) Issue 5 Pages 409-425)

参考
ワンソースマルチユースで拓く、ブック型Webページの未来 (ブログ記事2回分を整理したHTMLページ)

学術情報誌記述形式JATSの解説セミナーを開催、JATS-FOスタイルシートのオープンソース公開を予定

アンテナハウスは2012年5月24日13:30~東京・四谷において、「JATS 解説セミナー」を開催いたします。

今回のJATS解説セミナーでは、(1) 愛知大学教授の時実様をお迎えしまして JATS の解説をしていただきます。また、(2) JATS形式で作成された学術論文を学術誌用PDFに変換するスタイルシートをオープンソースで公開するとともに、その概要とカスタマイズ方法などを解説する予定です。

学術情報誌の分野は、一般書の電子書籍化よりも先行して電子化が進んでいます。特に英語版の学術情報誌は既に全面電子化されています。日本語の学術情報誌はまだ印刷も多いですが、早晩、全面電子化されることになると予想されます。

この鍵を握るのが、学術論文などを記述するための、XML準拠の仕様JATS(Journal Article Tag Suite)です。JATS―旧名はNLM-DTD―は欧米のジャーナル・アーカイブのためのデファクト標準となっています。現在、米国のNISOでNLM-DTDを継承するJATSの標準化が進んでいます。

日本でも科学技術振興機構(JST)が5月から運用開始した電子ジャーナル・アーカイブ J-STAGE3では、JATS0.4 ベースの書誌 XMLが全面採用されました。また論文の全文をJATS形式で搭載することも可能となっております。

現在、先進的な学会では論文全文のJATS化に取り組み始めており、学会誌を担当する制作・印刷会社でもJATS形式の論文制作するサービスを開始しつつあります。

学術論文をJATSで記述することで、論文のアーカイブの全文検索や閲読性を高めることができます。これにより論文が海外を含めて参照されたり、引用されることが増えると期待できます。

JATS形式で記述した論文は、スタイルシートをつかってHTMLに変換した上でブラウザでみたり、FOに変換してAH Formatterなどの自動組版ソフトを使ってPDFにして閲読します。

アンテナハウスは、この度、JATS0.4 に準拠して作成された論文をXSL-FOに変換する XSLT スタイルシートを開発しました。このスタイルシートを使うと、JATS形式の論文をAH Formatterによって高度なページ組版をすることができます。この作業は、従来FrameMakerや3B2などの専用の出版ソフトを使って行なわれていたのですが、それを置き換えることができるようになります。

5月24日のJATS解説セミナーにおいて、本スタイルシートを初公開する予定です。

■セミナー概要
※開催日時
2012年5月24日(木)13:30~16:30(受付開始13:15)
※タイムテーブル
13:30~    主催者挨拶
13:45~14:45 JATSの概要についての解説
  (愛知大学教授 時実象一氏)
学術雑誌出版の特徴
学術雑誌記事の構造
NLM DTD の歴史と利用
わが国での SGML/XML 学術出版の歴史
日本語学術記事の特徴と NLM DTD の問題点
NLM DTD の多言語拡張と JATS
JATS 0.4 の要点
14:45~15:00 休憩
15:00~16:00 JATS DTD仕様解説、JATS XMLデータをPDF化するために  (アンテナハウス株式会社 小林具典)
XSL-FOの基礎知識
XSLTスタイルシートの基礎知識
PDF化スタイルシート(オープンソース)について
概要、使い方
カスタマイズの方法
16:00~ ご出席者 質疑
16:30 閉会
※会場
アクセア第一会議室
東京都新宿区荒木町13の9 サンワールド四谷ビル1F
http://www.accea.co.jp/cr/yostsuya01.html#3
※受講料:10,500円
※定員:30名(事前申込み制)

■お申し込みは、
JATS 解説セミナー(JATS による日本語学術論文の標準化と自動組版)のご案内(株式会社エクスイズム)より、お願いいたします。