『JLA図書館実践シリーズ 37・38 図書館利用に障害のある人々へのサービス アクセシブルなEPUB 版』を発売しました。この機会にオンラインストアを少し改善しました。

このほど、アンテナハウスのオンラインストアより、『JLA図書館実践シリーズ 37・38 図書館利用に障害のある人々へのサービス アクセシブルなEPUB版』(日本図書館協会障害者サービス委員会 編)を発売致しました。

本書は、図書館の「障害者サービス」の基本テキストです。障害者サービスを「図書館利用に障害のある人々へのサービス」という幅広い概念でとらえ、図書館を利用する際の障害を取り除き、すべての人々が図書館サービスを受けられる環境づくりのために必要な考え方、ツール、資料、サービスの実践、さらには関係する制度・法規にも言及しています。

印刷版の販売は、日本図書館協会販売部他、全国の書店、オンライン書店にて販売中ですが、EPUB版は印刷版の上下巻を一冊にしたものでお買い得です。

本書の発売に伴い、アンテナハウスのオンラインストアを少し変更しました。大きな変更点は、会員登録の必須項目を従来の9項目から、4項目に減らしたことです。デジタル版のダウンロ-ド販売では不要な、住所などの入力を省略可能としました。

新オンラインストアの会員登録画面

旧オンラインストアの会員登録画面

また、文字の色についてメリハリを付けるように変更しました。
新オンラインストアのメニュー

旧オンラインストアのメニュー

簡単そうで難しいPDFからのテキスト抽出 解決策を考えます

Adobe Readerなどには、表示しているPDFからテキストをコピー・ペーストする機能があります。内容のコピーが禁止されていないPDFでは、リーダーのコピー・ペースト機能を使ってテキストを取り出して再利用できます。

しかし、このテキスト抽出で取り出したテキストは、文字列の順番が画面に表示される(眼で見た順番)通りにはならないことがあります。

簡単な例を示しましょう。ここに二つのPDFを用意しました。サンプルPDFはダウンロードしていただけます。

PDF1(test.pdf)
PDF2(test2.pdf)

この二つのPDFを表示して横に並べますと、次の図のように画面に表示されるテキストは全く同じです。

この二つのPDFからテキストをコピーしてみます。これは次の操作でできます。
Adobe ReaderでPDFを表示している状態で、「編集」メニュー⇒「すべてを選択」します。選択範囲が次のように表示されます。

次に、「編集」メニュー⇒「コピー」して、メモ帳に貼り付けます。結果を比較してみましょう。

(1)次は左側のPDFから取り出したテキストです。

三連休の最終日10月8日(月・祝日)に開催された
技術書典5。
CAS電子出版は初回から連続して出典しており5回
目の出典です。今回は事情により初めてスポン
サーブースにて出典しました。
事前には大型の台風25号が上陸するかもしれな
いという予報もあり、大変心配しました。蓋を空け
てみますと台風の方は予想よりも速く通り過ぎて、
杞憂でしたが、運営の方々をはじめ心配されたこ
とでしょう。
こうしたイベントは天気次第というのはつらいとこ
ろです。雨にならなくて良かった!

(2)次は右側のPDFから取り出したテキストです。

三連休の最終日10月8日(月・祝日)に開催された
技術書典5。
事前には大型の台風25号が上陸するかもしれな
いという予報もあり、大変心配しました。蓋を空け
てみますと台風の方は予想よりも速く通り過ぎて、
杞憂でしたが、運営の方々をはじめ心配されたこ
とでしょう。
こうしたイベントは天気次第というのはつらいとこ
ろです。雨にならなくて良かった!
CAS電子出版は初回から連続して出典しており5回
目の出典です。今回は事情により初めてスポン
サーブースにて出典しました。

二つのテキストは内容の順序が違っています。このようにPDFでは画面または印刷上では同じ順序で表示される文字列であっても、テキストを抽出した結果が同じになるとは限りません。こうした問題を実際に経験されておられる方も多いでしょう。

このためPDFからテキストを取り出して再利用するのが難しくなります。最悪の場合、もう一度打ち直しになります。

参考資料:PDF資料室で、もう少し整理してみました。
「簡単そうで簡単ではないPDFのテキスト抽出」

アンテナハウスでは、この問題を解決する方策をいろいろと用意しておりますので、お困りの方は一度ご相談いただければと存じます。
お問い合わせ先

技術書典5出典記:予想を上回る来場者で完売タイトル続出

三連休の最終日10月8日(月・祝日)に開催された技術書典5。CAS電子出版は初回から連続して出典しており5回目の出典です。今回は事情により初めてスポンサーブースにて出典しました。事前には大型の台風25号が上陸するかもしれないという予報もあり、大変心配しました。蓋を空けてみますと台風の方は予想よりも速く通り過ぎて、杞憂でしたが、運営の方々をはじめ心配されたことでしょう。こうしたイベントは天気次第というのはつらいところです。雨にならなくて良かった! 

さて、今回は全部で9タイトルを用意しました。そのうち『CSSページ組版入門 第4版』『PDF CookBook 第2巻』が技術書典初出典となります。

出典した本の紹介はこちら:
サークル詳細 | アンテナハウスCAS電子出版
来場される方は、事前にこのリストをチェックされているようです。

当日は11時開場ですが、売り場の用意は簡単なので10時30分頃には準備完了です。

今回、ちょっと趣向を凝らして帽子で価格表をつくりました。この帽子はドンキ秋葉原で150円で調達したものです。写真のように、技術書典では現金をやりとりするためおつりの計算や受け渡しが簡単になるように、本の販売価格は500円~2,000円(消費税込み)までと、500円刻みで設定しています。

さて、10時半にはすでに開場待ちの長蛇の列ができていました。11時開場とともに最初の方の来場者はお目当てのブースめがけて一目散。我がブースには目もくれずに通り過ぎてしまいます。しばらくして漸く立ち止まって本をチェックしていただけるようになりました。

10~20分過ぎますと、これまでの技術書典でCAS電子出版の本をいろいろ買い求めいただいたといった方も見え、初出典の本を買っていただけるなど、漸くエンジンが回転してきました。

意外だったのは、『CSSページ組版入門』に人気があり開始1時間で売り切れてしまいました。CSS組版の本はあまり売れないかと思い、持ち込みが少なかったためです。他の本も入場者が予想より多いこともあり、3時から4時頃までに6タイトルが売り切れとなりました。全体的に持ち込み部数が足りませんでした。特に『CSSページ組版入門』をめがけてブースに来られた方には、完売となってしまい、申し訳けありませんでした。

『CSSページ組版入門』は、先週末からPDFをWebで無償配布しています。こちらにはソース(HTML+CSS)も一緒に付いています:
CSSページ組版入門 第4版

振り返ってみますと、今回は初回技術書典並の勢いがあったように感じます。終了時のアナウンスで、今日は入場者延べ数10,341人(うちサークル関係者889人)という発表がありました。前回の50%程という大幅な入場者数増でしたので、初めて来場という人が増えたためだろうと思います。毎度のことですが、一発勝負の販売予測が甘すぎると反省します。

それにしても技術書典は、初回40サークルの参加からスタートして今回470サークル参加と言うことで、参加サークル数は10倍の規模になりました。短期間でここまで成長・発展させたtechbooster・達人出版会のご努力に感謝します。

出展記・マガジン航に投稿しました:技術書典は“エンジニアたちのコミケ”である

『PDF CookBook 第3巻』を10月下旬発売します。PDFテキスト検索・抽出、マスク(墨消し)、画像最適化、レイヤなど役立つ情報満載!

電子の紙PDFを企業向けのシステムの中で編集したり、加工したりする方法を紹介するPDFの料理本シリーズ『PDF CookBook 第3巻』をアマゾンのプリントオンデマンドなどで10月下旬に発売します。

『PDF CookBook 第3巻』PDFからテキストを抽出・検索する機能、PDFから画像の抽出・画像の最適化、矩形内のデータ削除と塗りつぶし(墨消し)、フォントの統合・埋め込み、PDFの最適化、PDFにレイヤーを追加する機能など豊富なテーマを紹介しています。

各機能の解説・役割や目的、見込まれる効果の紹介、PDF Tool APIによるサンプルプログラム、処理実行例を紹介しています。PDFを扱うプログラマーはもちろんですが、企画・営業担当の方でもPDFの豊富な機能についての知識が得られます。

目次
 はじめに
 第1章 テキストの抽出・検索
 1.1 テキスト抽出
 1.1.1 ページから全テキスト抽出
 1.1.2 指定矩形からテキストを抽出
 1.2 テキスト検索
 1.2.1 キーワードの指定による検索
 1.2.2 検索オプションの指定:検索対象文字列のオプション
 1.2.3 検索オプションの指定:取得順序
 1.2.4 検索オプションの指定:同一行とみなす文字の重なり
 第2章 画像の抽出・最適化
 2.1 画像抽出
 2.1.1 画像個数の取得
 2.1.2 指定した画像を抽出
 2.1.3 出力画像形式の指定
 2.1.4 画像の大きさ、解像度を取得
 2.2 画像の最適化
 2.2.1 カラー画像最適化オプションの取得・指定
 2.2.2 グレースケール画像最適化オプションの取得・指定
 2.2.3 モノクロ画像最適化オプションの取得・指定
 2.2.4 ダウンサンプリング方法の指定
 2.2.5 最適化を行う画像の対象とするフィルターの指定
 2.2.6 ダウンサンプリングする画素数の指定
 2.2.7 ダウンサンプリング率の下限値の指定
 2.2.8 ダウンサンプリング対象の画像をPPIで絞り込む
 2.2.9 ダウンサンプリング後のPPI を指定する
 2.3 JPEG 圧縮
 2.3.1 JPEG 圧縮設定
 第3章 矩形内のデータ削除
 3.1 マスクの特性
 3.1.1 マスクの色
 3.1.2 マスクの不透明度
 3.2 削除する対象
 3.2.1 テキスト:矩形内の文字を削除
 3.2.2 テキスト:削除時オプションの指定
 3.2.3 画像:矩形内の画像データを部分削除
 3.2.4 図形:矩形内にパスデータ全体が含まれる場合に削除
 3.3 テキスト検索:マスク処理
 3.3.1 テキスト検索とマスク処理の組み合わせ 
 第4章フォントリソース
 4.1 フォントの統合と埋め込み
 4.1.1 フォントの統合
 4.1.2 フォントの埋め込み
 第5章 PDF の最適化
 5.1 画像の最適化
 5.1.1 画像の最適化
 5.2 不要なデータの削除
 5.2.1 オープンアクションの削除
 5.2.2 しおりの削除
 5.2.3 注釈・フォームの削除
 5.2.4 アーティクルの削除
 5.2.5 サムネールの削除
 第6章 レイヤー作成
 6.1 レイヤーの作成・追加
 6.1.1 レイヤーに使用するPDF 文書ページを設定
 6.1.2 レイヤーの名前の指定
 6.1.3 レイヤーの不透明度の指定
 6.1.4 回転角度の設定
 6.1.5 レイヤーのZ オーダーの指定
 6.1.6 レイヤーの表示/非表示の指定
 索引

紙版(プリントオンデマンド)
出版社: アンテナハウスCAS電子出版
発売日:2018年10月下旬(予定)
著者:アンテナハウス株式会社
販売形式:プリントオンデマンド版
サイズ:B5判 横組み
ページ数:126ページ
価格(税込):1,728円
ISBN:978-4-900552-64-7
販売店:アマゾン

デジタル版(PDF)
販売形式:PDF版(DRMなし)
ページ数:126ページ
価格(税込み):864円
販売店:アンテナハウス・オンラインショップ(PDFのダウンロード)

Web版
本書の内容は次のWebページにて全文をを読みいただけます。
全文公開中

シリーズ既刊本紹介ページへのリンク
『PDF CookBook 第2巻』
『PDF CookBook』

PDF Tool API
製品ご案内ページ

『CSSページ組版入門 第4版』プリントオンデマンド版発売。技術書典5にも出品しますのでどうぞよろしくお願いします。

『CSSページ組版入門 第4版』の日本語版できあがりました。本書はAH FormatterのCSS組版機能をご利用いただくための解説書です。

CSS は,ブラウザ,エディタ,その他のWebアプリケーションで広く使用されています.CSSは,Webデザインのためだけではなく,広範な印刷アプリケーションやPDFとして配布される電子的なページ組版のスタイルシートとしても使えます.

CSS 2.1(と2.2)はページ媒体への出力サポートは最小の提供であり,ページレイアウト機能は力不足です.CSS3は,現在W3Cによって依然として開発中ですが,高度なページレイアウト,多段組,縦組,ハイフネーション,多言語の文字レイアウトなどの専門的な品質の組版に必要なさまざまな機能を定義しています.

CSSをXMLやHTMLのページ媒体デザインのために使うことはまだ一般的ではありませんが,CSS3の開発が進むにつれて増えるものと期待されています.

Antenna House Formatter は,XSL-FOとCSSのふたつのスタイルシートでレイアウトされたHTMLファイルを印刷用のページ上にレイアウトしてPDFを出力します.
W3CのCSS標準プロパティに加えて,ベースライン・グリッドなどの印刷用レイアウトや日本語レイアウトのために独自に拡張した追加プロパティ機能を使って,高度なレイアウト指定を施したページを作成できます.

さらに,独自開発のMathML 3,CGM,SVGの描画機能, PANTONE®スポット・カラーなど精細なグラフィックス指定,PDF/A,PDF/X,PDF/UAなど多用途なPDF作成機能を提供しています.

多くの人はブラウザ上のWeb制作では CSS に精通しており,その中でも非常に精通している人もいれば,それ程でもない人もいます.しかし,ページ組版に CSS を使用するのにあたって精通している人はほとんどいません.本書は,既にCSS を知っているが,ページ組版のために CSS を使用したことがない人を対象として,Antenna House FormatterのCSSページ組版機能を概説しています.

目次
はじめに
第1章 Web とページ媒体
第2章 ボックスによるレイアウト
第3章 オブジェクトの装飾
第4章 段落設定
第5章 段組
第6章 改ページ・ページコンテンツの維持
第7章 文字設定
第8章 MathMLとSVGグラフィクス
第9章 画像配置
第10章 表組
第11章 色指定
第12章 カウンタ
第13章 リスト
第14章 クロスリファレンス(相互参照)
第15章 脚注・傍注
第16章 PDFブックマーク
第17章 日本語文字組版
第18章 ページ設定
第19章 ヘッダとフッタ
第20章 PDF出力
セレクタと疑似要素
参照仕様
索引

販売
10月8日(月)開催の技術書典5に出品、販売いたします。また、アマゾンなどのオンラインストアからプリントオンデマンドで販売いたします。

第4版は英語版を2月のXML Pragueで配布、その後、英語のWebサイトなどで配布を開始しました。日本語版につきましても準備が整い次第、日本のWebサイトよりダウンロードで配布する予定です。

オンラインストア
アマゾンより販売中

デジタル版(PDF)
Webページでデジタル版(PDF)を公開・配布しています。
CSSページ組版入門 第4版

技術書典5(終了しました)
技術書典5の情報
アンテナハウスCAS電子出版は(す02)です。

CAS-UBで注を作成する方法:脚注、章末注、巻末注

本の本文には注をつけることがあります。注は大きく、脚注、章末注、巻末注に分類できます。この記事では注の扱いを簡単に説明するとともに、CAS-UBで自動的に作れない章末注の編集方法をやや詳しく説明します。

注の種類とCAS-UBの対応

脚注は、一般的に、紙の本ではページの下(横組)または左ページの左端(縦組)に配置します。EPUBの場合は、一般的に、本文の中にそのまま小さめなフォントなど配置することになります。EPUBはまだ今後進化しますので、将来は変化する可能性もあります。CAS-UBでは、脚注専用のマークアップがあります。本文中に脚注のマークアップをすればEPUB/PDFの生成時にそれぞれ自動的に配置します。

章末注は、章毎に章の最後に注をまとめて配置します。CAS-UBには、残念ながら章末注に相当するマークアップはなく、自動生成はできません。章末注を作成するには手作業で編集する必要があります。

巻末注は、一冊の最後に注をまとめて配置します。CAS-UBで注のマークアップをすれば、巻末注を自動的に生成します。本文と巻末注の間に双方向のリンクを設定します。

【参考資料】CAS-UBのマークアップリファレンス

章末注の編集方法

章末注は一般は次のような構成になります。

1. 本文の中で注を付けた位置には注のための合い印を置く。
2. 章の末尾に注の一覧を置く。各項目の先頭には番号を付ける。これは箇条書きを使うと良いでしょう。
3.紙の本では合い印の番号と注の番号を対応付ける。EPUBでは本文から末尾の注へのリンクを置く。PDFでも同じようにリンクを設定すると便利です。

ここで一番難しいのはリンクを設定する方法です。次に、リンクの設定方法を説明します。

リンクは次の2つの要素からなります。

1.リンク先にID(識別子)を設定する。
2.リンク元には、リンクのマークアップ(ID参照)をする。

CAS-UBで自動生成するときは、上の1、2の処理を自動的に行います。しかし、手作業で編集するときは自分で編集する必要があります。次に簡単に説明します。

IDの設定

IDのマークアップは、”:#ID値” (ID値は記事単位でユニークな値)です。これにより任意の位置にID値を付けられます。

例えば、テキストの範囲にID値を付けるときは、

テキスト[[[:#id-value XXX]]]テキスト続き

とします。すると、HTMLは次のようになります。

テキスト<span id="u.201809120621.id-value">XXX</span>テキスト続き

u :ユーザーが付けたIDであることを示します。
201809120621 :記事の識別子(ファイル名のベースネームに相当)
id-value :IDの値

リンクの設定

リンク元にリンクを設定するのは、CAS-UBの編集メニューの「ID参照」を使うと便利です。
リンクを設定したい場所で編集メニューのID参照をクリックすると次のダイヤログが表示されます。

ID参照:のドロップダウンリストには、IDの一覧表が出ます。例えば次のようなリストです。

ユーザーが作成したIDはまとめて表示されていますので、リンク先を選択して、「CAS記法」ボタンをクリックします。すると次のようなマークアップが挿入されます。

リンク元:[[##u.201809120621.id-value|アンカー]]

HTMLでは次のようになります。

リンク元:<a href="201809120621.ent#u.201809120621.id-value">アンカー</a>

これにより、EPUB/PDFを生成したときにリンクが設定されます。

サンプルファイル
次にCAS-UBの出版物サンプルを用意しました。ご活用ください。

作成したEPUB
作成したPDF
元の出版物(CAS-UBの出版物バックアップ)
元の出版物のUBテキスト

PDF生成の新機能:行のベースライン合わせ 簡単な解説

8月23日定期メンテナンスで公開した新機能「PDF生成時の行のベースライン合わせ」について説明します。

これは、2段組のPDFを出力する場合、横組では左右の段、縦組では上下の段で行の位置を揃えるかどうかを設定するものです。

CAS-UBのPDF生成では、見出し、本文、前付け、後付け毎に「PDFレイアウトの詳細設定」で2段組にするかどうかを指定できます。次は、本文だけを2段組みとする設定例です。

8月23日に新しく追加されたのは、次の設定項目です。行のベースライン合わせを「しない」(既定値)から「する」(新設)に変更できるようになりました。なお、このベースライン合わせは「本文」が対象です。

次に簡単な例を示します。左がベースライン合わせを「しない」、右がベースライン合わせを「する」に設定しています。ベースライン合わせをしない場合、上段の図の後で行の位置が下の段とずれています。ベースライン合わせをすると行の位置が下の段と揃うようになります。

このように図版や見出しなどによる行のずれを補正できます。

出版物のページには図、表、大見出し、中見出し、小見出し、箇条書き、整形済み、コラムなどの様々なオブジェクトがあります。これをグリッドに揃えるにはスタイルシートでどのオブジェクトを対象にするかを細かく調整する必要があります。現在のレイアウト設定では、本文の中でも、整形済み(pre)、複数行の見出し、箇条書きなどは調整していません。

なお、ベースライン合わせは、AH Formatterの行グリッド機能(行グリッド axf:baseline-grid / CSS -ah-baseline-grid )を使っています。

AH FormatterのXSL/CSS拡張のページ(オンラインマニュアル)

10月8日(月)「アンテナハウスCAS電子出版」は、『技術書典5』に出典します。

来月10月8日にTechBooster/達人出版会の主催による『技術書典5』が、池袋サンシャインシティの展示ホールD(文化会館ビル2F)で開催されます。

2018年10月8日(祝・月)に技術書典5を開催します!

一般参加者向け正式サイトは9月10日オープンです。

先日配置が発表されましたが、「アンテナハウスCAS電子出版」の配置は、「い02」。入り口近くのとても良い場所のようです。

出品予定は次の書籍ですが、新しいタイトルも用意しておりますので、ぜひ、ご来場ください。お待ちしています。

PDF関係
PDF CookBook 第2巻PDFでこんなことができる!PDF Tool API によるPDF調理法
PDF CookBook PDFでこんなことができる!PDF Tool API によるPDF調理法
PDFインフラストラクチャ解説 第1.1版 電子の紙PDFとその周辺技術を語り尽す
XML関係
MathML数式組版入門Ver1.1
スタイルシート開発の基礎
XSL-FOの基礎【第2版】XMLを組版するためのレイアウト仕様
DITAのすすめ 【第3版】

『技術書典』は2016年6月25日に初回を開催以来、毎回大勢の人に参加していただき、大成功を重ね、規模を拡大してきています。あと、一ヶ月少々の準備期間。主催者は大変と思いますが、今回もぜひ成功して欲しいものです。

『技術書典』同人誌の展示即売会ということですが、CAS-UBで力を入れているプリントオンデマンド本の販売にも大変向いていると思います。プリントオンデマンド本は、現在、アマゾンやhontoを初めとするオンライン書店で販売されています。オンライン書店では、買い手は内容を事前に確認できない、というかなり大きな弱点があります。

しかし、そうかといってニッチなタイトルの本は、従来の方法で印刷・製本して書店流通で販売するのは困難です。その点、『技術書典』のように来場者が現物を手に取って内容を確認できる、というのは本を選ぶ上でも大きな大きなメリットがあります。

初回の様子:6月25日技術書典 大盛況でした。XMLの本にも大きな関心を寄せていただきました。

なお、ご来場が無理な方には、弊社にて直販もしておりますので、よろしければこちらをご覧ください。

アンテナハウス PDF/XML関連技術書POD版直販

電子書籍関連の制作・変換サービスなどのご案内

アンテナハウスでは、電子出版に関連して、主に制作で使用するシステム(ツール)を提供をしています。さらに、ツールを弊社の社内で使用して、次のようなサービスも承っております。

EPUB制作サービス

主に、CAS-UBを使用してのEPUBの制作を受け承ります。これまでの実績としては次のとおりです:
・Kindleなどで販売するEPUBの制作
官公庁向けの報告書などのEPUB化
・学会誌のEPUB化

PDF制作サービス

主にCAS-UBを使用してPDFを制作します。Microsoft Wordなどで作成したPDFと比べて、CAS-UBで制作したPDFは、日本語組版の基本をしっかり守ったPDF版面になります。

EPUBからPDFへの変換サービス

EPUBをPDFに変換します。こちらは、弊社のAH CSS Formatterのアプリケーションとして開発したEPUB to PDF 変換ツールを活用するサービスです。
CAS-UBで制作したEPUBではなくて、様々なツールで制作したEPUBを変換対象とします。このためPDFのでき具合(品質)がもとのEPUB制作方法によって大きく違ってしまうことが難点です。

こちらは、I Love software2 Blogに先日「EPUBをPDFに変換するときの注意事項」として問題を報告しておりますので、ご参照ください。次にポイントだけご紹介します。

・書店(ストア)から購入したDRMのかかったEPUBには対応しておりませんが、出版社や著者さんが持つEPUBがあれば、ご希望のページサイズ、フォントサイズ、ページのマージンなどでPDFに変換します。お値段は1冊/3000円+税となります。
・EPUBの内容をEPUBの持つCSSでの体裁を生かして自動組版でPDF化します。変換のお値段からも推測いただける通り、人手による調整は原則として一切行いません。

一番多く、困るのは、EPUBの中で改行”<br>”や空行”<p></p>”を多用して段落間の空きを作ったり、箇条書きなどで全角空白文字でインデントを作るパターン、次点で”pagebreak”(改ページ)をやたらに使うパターン、またはその複合型です。EPUBにこのような設定がありますと、無駄に白紙ページを量産したり、箇条書きの場合は、折り返した2行目の文字の並びが最初の行より飛び出しすぎていたり、後ろに行き過ぎていたり、変なところで意図しない改行ができたりなど崩れてしまいます。

こういうことがありますと、こんなはずではなかったという期待に沿わないPDFができあがってしまいます。ご注意ください。

過去の関連記事手持ちのEPUBをプリントオンデマンド用PDFに変換。 ツールと変換サービスを提供開始!

CAS記法のマークアップがなぜ必要なのかー図版とキャプションの例

CAS-UBは、原稿テキストに対して、簡易マークアップ(CAS記法)で、階層構造や文脈を付与します。

原稿などの編集にはMicrosoft Wordなどを使っている方が多いでしょう。Microsoft Wordは、画面に印刷レイアウト状態で表示しながら編集しますが、こうした方式はWYSIWYG(みたままを出力)といいます。WYSIWYGに慣れているユーザーにとっては、CAS-UBの簡易マークアップ方式には違和感を感じることと思います。

しかし、CAS-UBではどうしても簡易マークアップが必要です。そこで今日は簡易マークアップがなぜ必要かを図版とキャプションの例で説明したいと思います。

WYSIWYGではレイアウトを視覚的に行います。例えばMicrosoft Wordで次のようなキャプションをつけた図が入った原稿を編集しているとします:

原稿で図の前に一行増えますと、キャプションが次のページに送られて図とキャプションが別のページに分かれてしまいます:

皆さんはこのようなときどうしますか?

おそらく、図とキャプションが別ページになってしまうのを避けるために次のような編集をすることでしょう。

①原稿のテキストを編集して一行短くする
②キャプションの行が同じページになるように図を少し小さくする
③図とキャプションを選択して、改ページ位置の自動修正で「次の段落と分離しない」とする。(この例では図の前で改ページします。)(コメントにより7/2追加)

①、②のような操作はWYSIWYG方式特有です。構造という概念とは無縁です。ちなみに、この原稿を他のツール、例えばInDesignなどで印刷用に仕上げようとします。InDesignの文字の並べ方はMicrosoft Wordとは違うためページ区切りがずれます。Microsoft Wordの上のようなレイアウト操作は無駄だったということになります[1]。③は構造によるページ分割制御ですが、WYSIWYGツールで使う人は少数派のようです。

CAS-UBでは、①紙やPDFのような印刷媒体と、②WebページやEPUBという異なる特性をもつ2種類の媒体を想定して、原稿を再編集しないで両方にワンボタンで出力できます。PDFは自動組版ソフト(AH Formatter[2])によりサーバー上で自動生成します。

原稿に対して、図とキャプションが一体のものであるという構造情報を付与します。そして、この構造を利用してスタイルシートによって図とキャプションが別ページにならないように制御します。つまり構造でレイアウトを制御するのです。

CAS記法では図とキャプションが一体のものであるということを次のように表します。

[[[:fig =透かしの透明度(有無) 
{{WaterMarkSetOpacity-example.png}}
]]]

[[[:fig

]]]

は図のブロック

=透かしの透明度(有無) 

はキャプションです。

次に例を示します。

1. CAS記法を指定しないとき
図の次の行にキャプションを置きます。レイアウトは中央揃え・ゴシックとしました。


次図は上が透かしの透明度を0.2、下が同透明度0.7に設定した結果です。

{{:width=80% WaterMarkSetOpacity-example.png}}

:center 図 透かしの透明度(有無)

PDFを生成しますと次のように泣き分かれてしまいます。

2. CAS記法を指定したとき


次図は上が透かしの透明度を0.2、下が同透明度0.7に設定した結果です。

[[[:fig =透かしの透明度(有無)
{{:width=80% WaterMarkSetOpacity-example.png}}
]]]

PDFを生成しますと次のように、図の前で改ページが入ります。

注意
上の処理の問題点は、図の前で改ページするために大きな空きができてしまうことです。
これを回避するためには、図の前の本文テキストと図の位置関係を自動的に逆転処理するというレイアウト設定もできます。上の例では説明を分かりやすくするため図と本文テキストの入れ替えの設定をしていません。なお、現状では、自動的に図を小さくする処理はできません。

[1] 思い出しましたが、Microsoft Wordは、図の挿入方法によって図を小さくしたときの解像度の扱いが違うので、場合によっては有害です。(参考)Wordに埋め込まれたイメージ画像の解像度はどうなるか?
[2] AH Formatter