CAS記法のマークアップがなぜ必要なのかー図版とキャプションの例

CAS-UBは、原稿テキストに対して、簡易マークアップ(CAS記法)で、階層構造や文脈を付与します。

原稿などの編集にはMicrosoft Wordなどを使っている方が多いでしょう。Microsoft Wordは、画面に印刷レイアウト状態で表示しながら編集しますが、こうした方式はWYSIWYG(みたままを出力)といいます。WYSIWYGに慣れているユーザーにとっては、CAS-UBの簡易マークアップ方式には違和感を感じることと思います。

しかし、CAS-UBではどうしても簡易マークアップが必要です。そこで今日は簡易マークアップがなぜ必要かを図版とキャプションの例で説明したいと思います。

WYSIWYGではレイアウトを視覚的に行います。例えばMicrosoft Wordで次のようなキャプションをつけた図が入った原稿を編集しているとします:

原稿で図の前に一行増えますと、キャプションが次のページに送られて図とキャプションが別のページに分かれてしまいます:

皆さんはこのようなときどうしますか?

おそらく、図とキャプションが別ページになってしまうのを避けるために次のような編集をすることでしょう。

①原稿のテキストを編集して一行短くする
②キャプションの行が同じページになるように図を少し小さくする
③図とキャプションを選択して、改ページ位置の自動修正で「次の段落と分離しない」とする。(この例では図の前で改ページします。)(コメントにより7/2追加)

①、②のような操作はWYSIWYG方式特有です。構造という概念とは無縁です。ちなみに、この原稿を他のツール、例えばInDesignなどで印刷用に仕上げようとします。InDesignの文字の並べ方はMicrosoft Wordとは違うためページ区切りがずれます。Microsoft Wordの上のようなレイアウト操作は無駄だったということになります[1]。③は構造によるページ分割制御ですが、WYSIWYGツールで使う人は少数派のようです。

CAS-UBでは、①紙やPDFのような印刷媒体と、②WebページやEPUBという異なる特性をもつ2種類の媒体を想定して、原稿を再編集しないで両方にワンボタンで出力できます。PDFは自動組版ソフト(AH Formatter[2])によりサーバー上で自動生成します。

原稿に対して、図とキャプションが一体のものであるという構造情報を付与します。そして、この構造を利用してスタイルシートによって図とキャプションが別ページにならないように制御します。つまり構造でレイアウトを制御するのです。

CAS記法では図とキャプションが一体のものであるということを次のように表します。

[[[:fig =透かしの透明度(有無) 
{{WaterMarkSetOpacity-example.png}}
]]]

[[[:fig

]]]

は図のブロック

=透かしの透明度(有無) 

はキャプションです。

次に例を示します。

1. CAS記法を指定しないとき
図の次の行にキャプションを置きます。レイアウトは中央揃え・ゴシックとしました。


次図は上が透かしの透明度を0.2、下が同透明度0.7に設定した結果です。

{{:width=80% WaterMarkSetOpacity-example.png}}

:center 図 透かしの透明度(有無)

PDFを生成しますと次のように泣き分かれてしまいます。

2. CAS記法を指定したとき


次図は上が透かしの透明度を0.2、下が同透明度0.7に設定した結果です。

[[[:fig =透かしの透明度(有無)
{{:width=80% WaterMarkSetOpacity-example.png}}
]]]

PDFを生成しますと次のように、図の前で改ページが入ります。

注意
上の処理の問題点は、図の前で改ページするために大きな空きができてしまうことです。
これを回避するためには、図の前の本文テキストと図の位置関係を自動的に逆転処理するというレイアウト設定もできます。上の例では説明を分かりやすくするため図と本文テキストの入れ替えの設定をしていません。なお、現状では、自動的に図を小さくする処理はできません。

[1] 思い出しましたが、Microsoft Wordは、図の挿入方法によって図を小さくしたときの解像度の扱いが違うので、場合によっては有害です。(参考)Wordに埋め込まれたイメージ画像の解像度はどうなるか?
[2] AH Formatter

PDF文書の永続性、Web文書の揮発性

PDF文書とWeb文書にはいくつかの点で本質的な違いがあります。一番大きな違いは前者の永続性に対して、後者の揮発性ではないかと思います。

PDF文書の永続性とは
PDF文書のモデルは、紙にインクで印刷したのと同じ状態を再現することです。紙に書かれた情報は1つの物体としての形を備えています。そして、それは、消去されるまで永続的に、人間の目に見える状態は同じものとして保存されます。

Web文書の揮発性とは
それに対してWeb文書は、分散した情報を瞬時に探して端末に表示するモデルです。情報が分散配置されていることに特徴があります。リンクによって探し出される毎に、端末を経由して人間の目に触れるわけですが、その都度、人間の目に見える状態が変わります。Web文書は、次に可視化されるとき、今表示されている状態と同じである保証がありません。

現在、出版などでは紙からデジタル媒体への転換が進んでいます。しかし、デジタル媒体としてみたときには、PDF文書とWeb文書には上のような本質的な相違があります。こうしてデジタル媒体としては、WebとPDFが今後かなり長い間両立するだろうと予想します。

2018/06/21
PDF資料室に論点を整理した次の記事を掲載しました:
「PDFとWebにはどんな違いがありますか? インターネットやWebがますます普及するとしてPDFは使い続けられますか?」

ウイドウとオーファンって、なかなか深い 3大英文スタイルガイドの定義を比較する

欧文組版にウイドウ(widows)とオーファン(orphans)という言葉があります。しかし、有名な欧文組版に関するテキストブックで、ウイドウとオーファンについて調べて見ても意味がなかなか分かりません。

まず、そもそも定義がはっきりしていません。本によって違います。また、回避すべきかどうかの要求度も必ずしも一致していません。

例えば、Chicago Manual of Style (15th edition)では:

A page should not begin with the last line of a paragraph unless it is full measure, and should not end with the first line of a new paragraph. … (A very short line at the top of a page is known as a “widow”, a single word or part of a word at the end of a paragraph is an “orphan. “) (3.11 p, 94)

このChicago Manual 15版のOrphanの定義は間違いのような気がします。

Chicago Manual of Style (17th Edition)では次のように変わりました。(2018/6/23 17版について追加しました。)

A page should not end with a subhead. Nor should a page begin with the last line of a paragraph unless it is full measure; a short line in this position is sometimes called a widow. A page can, however, end with the first line of a new paragraph, or what is sometimes referred to as an orphan. (2.116)

Chicago Manual 17版ではOrphan の定義は変更になりました。あと、Orphanは明示的に許容に変更されました。これでOrphanについては3つのスタイルガイドは全部許容ということになります。

New Oxford Style Manual (2012)では:

The last line of a paragraph should not fall at the top of a new page or column: this is known as a widow. An orhpan―the first line of a paragraph that falls at the bottom of a page or culumn―is undesireble, though it is now tolerated in most bookwork.(2.5.2 p.46)

New HART’S Rules (Oxford press 2005)は、New Oxford Style Manualとほとんど同じ内容(2012)です[1] 。これらは比較的明確な定義です。但し、行の長さについては特に説明がありません。あとページだけではなく段も対象です。

The elements of typographic style (Robert Bringhursh, V4.2)では:

2.4.8 Never begin a page with the last line of a multi-line paragraph.

Isolated lines created when paragraphs begin on the last line of a page are known as orphans. … they need not trouble the typographer. The stub-ends left when paragraphs end on the first line of a page are called widows. It is the custom to give them one additional line for company. (pp. 43-44)

そもそもstub-endってなんだろう? stub-endなどというおそらくwidowよりも意味不明な言葉を定義文の中に持ち込むのは間違っていませんかねえ。

まず、widowはページ区切りで発生するものをいうか、段の区切りで発生するものを含めるかの相違があります。さらに、本によっては段落の区切りでwidowが発生するという文章もあります。

A widow (the term used for a single word ending a paragraph, that is, on a line of its own) …(Finer points in the spacing and arrangement of type, Geoffrey Dowding, Revised Edition Hartley & Marks, 1995 ISBN: 0-88179-119-9)

New HART’S Rulesによれば、出版社は段落の区切りのwidowを許容する方向に向かってきたということです。

欧文組版ではwidowについては、日本語組版よりもかなり嫌われる存在のようですが、そもそも定義があまりはっきりしていないのは困りますね。

関連
デジタル時代のレイアウトは、ユーザーの目に見えない神プロセス
組版の価値。組版と画面表示(レンダリング)の相違を考える。
「日本語組版における行配置の課題」(第1版)を配布開始

[1] New Oxford Style Manual (Oxford press 2012) は、前半がほとんどNew HART’S Rules (Oxford press 2005)であり、後半が辞書になっています。New HART’S Rulesから極一部の記述が変更されています。

※組版ではMeasureとはブロックまたはテキストのカラム幅のこと。

MathMLの未来を考える―(2)『MathML数式組版入門』の大学図書館への寄贈活動について

前回の「MathMLの未来を考える―(1)現状の整理」の続きです。

Webなどで数式を扱う方法として、MathMLが標準化されてからかなりの年月が経過しています。しかし、MathMLはいまひとつポピュラーになっていないという印象があります。一方で、前回のまとめでも書きましたが、たとえば、Microsoft Edgeのプロジェクトでのアンケートではアクセシビリティの観点でMathMLへの熱烈なリクエストがあります。

前回のブログ以後、いろいろ考えた末、MathMLの普及・啓蒙活動をもっと積極的に行うべきという結論に達しました。ちょうど都合の良いことに、弊社では、道廣氏の執筆による『MathML数式組版入門』を出版しております。

そこで、普及・啓蒙の第1弾として、数式を頻繁に使うであろう学生や研究者が集まる大学図書館に『MathML数式組版入門』を寄贈したらどうかと考えるに至りました。しかし、寄贈しても受け入れていただけない可能性もあります。そこで、昨年末に予備調査として、15の大学図書館に問い合わせをしました。

問い合わせ文
—–
この度、貴図書館へ図書を寄贈したいと考えております。
寄贈の受入れに関してお教えいただきたくメールいたしました。

図書は以下のとおりです。
MathML 数式組版入門

本書はコンピュータ上で数式などの数学的記述を表現するためのMathML(マスエムエル)というマークアップ言語に関する説明、扱っていただくための入門を目的に執筆されたものとなります。

内容面で、貴図書館の受入れ基準に合致いたしますでしょうか。

本書は電子媒体(PDF)にて全文を公開しておりますので、次のアドレスより内容をご確認いただけます。
http://www.antenna.co.jp/AHF/ahf_publication/MathML/1.1/mathml-guide.pdf

また、本書は電子媒体(PDF)と紙媒体も用意しています。
寄贈させていただくにあたり電子媒体(PDF)、紙媒体どちらが望ましいかもお教えいただけますと幸いに存じます。
—-

1月17日現在で、回答は次のようになっています。

分類 図書館数 備考
受け入れる 6 すべて紙を希望
受け入れない 4 受け入れない理由:全文をWebで公開している図書は受け入れない(2)、寄贈書の受け入れを行っていない(2)
未回答 5

全体で見ますと4割の大学図書館で受け入れてもらえる、との結果となりました。そこで、本書を200冊ほど印刷して、受け入れていただける大学図書館を探したうえで寄贈する、という活動を開始することとなりました。

とりあえず、本日、上記6図書館に発送致しました。

もし、寄贈をご希望の図書館がございましたら、cas-info@antenna.co.jpまでご連絡を頂けると幸いです。
なにとぞ、よろしくお願い致します。

続報はこちらにございます。
「MathML 数式組版入門」の大学図書館への寄贈についてのお知らせ