ホーム


banner_cas_ub2CAS-UBは、ブックオンデマンドに使えるPDF, 商用に耐えうる高品質な電子書籍(EPUB3、Kindle専用EPUB)を作るWEBサービスです。DTPソフトに負けない品質のPDFと構造化された電子書籍をワンソースから出力します。出版モデルをプリントファーストからデジタルファーストに転換するのに最適なツールです。

最近の投稿

Noto Sans CJK, Source Han SansフォントとAH FormatterによるPDF生成


10/25のCAS-UB:多言語機能に魂を入れるため、ドキュメントの多言語化と、EPUBの多言語化を考えるの続きです。

GoogleのNoto Sans CJKフォントとアドビのSource Han Sansは9月にそれぞれV1.001になりました。7月の初版(V1.000)からの変更点についてはアドビの資料「Source Han Sans V1.001」([1])の最後に詳しく出ています。これによりますと、各言語でかなり細かいチューニングが行われています。

最初に目につく変更点はV1.001からNoto Sans CJKとSource Han Sansのパッケージ方式が共通になり、次の表のようにそれぞれ4種類になったことです。

表1.フォントの構成

名称 説明 ファイル名
CJK OTF fonts with different default language 4言語のグリフを各ウェイトごとに1ファイルにまとめたもの。各ファイルはデフォルトで一言語のグリフをサポートし、GSUB’locl’を使えば他の言語をサポートできる。28ファイルある。 NotoSansCJKSC-hinted.zip, NotoSansCJKSC-hinted.zip, NotoSansCJKJP-hinted.zip, NotoSansCJKKR-hinted.zip
All-in-one CJK super OTC font 4言語×7ウェイトを全部ひとつにまとめたもの(Windowsは未サポート) NotoSansCJK.ttc
CJK OTC fonts 各ウェイトごとに4言語を1ファイルにまとめたもので7ファイルある。デフォルト言語の指定を行う。さらに、GSUB’locl’をサポートすればデフォルト以外の言語の指定ができる。(Windowsは未サポート) NotoSansCJK-[Weight].ttc
Region specific OTF subsets 4言語(地域別)のサブセット。グリフは各言語用のみである。4言語×7ウェイトの 28ファイルある。 NotoSansSC-[Weight].otf, NotoSansTC-[Weight].otf, NotoSansJP-[Weight].otf, NotoSansKR-[Weight].otf

使う側からしますと、どのフォントをインストールするべきかが気になります。

最初にCAS-UBでPDFを作成するという観点で調べてみました。上述のアドビの資料に選択のためのチャートが出ていますが、CAS-UBでPDF出力を行うのはAH Formatterです。

AH Formatterは、現在のところ、OTC形式のフォントを全くサポートしていません(Windowsも同じですが)。このため、CJK OTF fonts with different default languageか、Region specific OTF subsetsが選択肢となります。[2]

CJK OTF fonts with different default languageは、例えば日本語を基本言語とするシステムではNotoSansCJKJPをインストールし、日本語以外の言語のグリフはGSUB’locl’を使って選択します。このフォントではAH Formatterは、次のような動作になります。

1.日本語のグリフは通常に処理します。組版対象の文字列に日本語以外のスクリプトが指定されていると、その部分はPDFにフォント(グリフ)を埋め込みます[3]

2.言語指定があると、次のようにスクリプトを類推します。
xml:lang=”ja” –> script=”Jpan”
xml:lang=”ko” –> script=”Hang”
xml:lang=”zh-CH” –> script=”Hans”
xml:lang=”zh-TW” –> script=”Hant”

ということで、PDF生成では、CJK OTF fonts with different default language、Region specific OTF subsetsのどちらのパッケージもとりあえず使えるようです(ただし、[2] の事情でMR5をお待ちいただく必要があります)。

問題はEPUBの方ですが、これは次回に調査結果を報告したいと思います。

[1] Source Han Sans V1.001
[2] AH FormatterはV6.2MR3からNoto Sans CJK V1.000(当時は Region specific OTF subsetsのみ提供されていました)をサポートしています。しかし、今回、CAS-UBの試験用システムで使ってみましたところ、Noto Sans CJK V1.001でフォント側が変更になってしまったため、V1.001では正しくPDFにフォント埋め込みができません。次の、AH Formatter MR5でNoto Sans CJK V1.001対応の改訂版を提供する予定です。また、もし、AH FormatterのユーザーでOTC形式のサポートが必要という方は、AH Formatterのサポートまでご相談ください。
[3] スクリプト名については、ISO 15924: Codes for the representation of names of scriptsを参照。

  1. CAS-UB:多言語機能に魂を入れるため、ドキュメントの多言語化と、EPUBの多言語化を考える コメントをどうぞ
  2. オープンソース収益化のモデル(メモ) 続き コメントは受け付けていません。
  3. EPUB・PDFで索引や親子索引を作るためのCAS記法の例 コメントは受け付けていません。
  4. EPUBで箇条書きのラベルを消すためのCAS記法例(親の要素に属性を付ける方法) コメントは受け付けていません。
  5. Windowsの操作がうまくできずに、ヒステリーを起こす。これも、EPUBの光と影? コメントは受け付けていません。
  6. 電子書籍(EPUB)の制作:画像への回り込み解除するためのCAS-UBの指定方法 コメントは受け付けていません。
  7. 電子書籍(EPUB)で、テキストを画像に回り込みさせるためのCAS-UBの指定方法 コメントは受け付けていません。
  8. 縦書き書籍(EPUB)で画像を左右中央配置するためのCAS-UBの指定方法 コメントは受け付けていません。
  9. 注釈の利用形態について(W3Cの注釈ユース・ケース) コメントは受け付けていません。