Noto Sans CJK, Source Han SansフォントとAH FormatterによるPDF生成

10/25のCAS-UB:多言語機能に魂を入れるため、ドキュメントの多言語化と、EPUBの多言語化を考えるの続きです。

GoogleのNoto Sans CJKフォントとアドビのSource Han Sansは9月にそれぞれV1.001になりました。7月の初版(V1.000)からの変更点についてはアドビの資料「Source Han Sans V1.001」([1])の最後に詳しく出ています。これによりますと、各言語でかなり細かいチューニングが行われています。

最初に目につく変更点はV1.001からNoto Sans CJKとSource Han Sansのパッケージ方式が共通になり、次の表のようにそれぞれ4種類になったことです。

表1.フォントの構成

名称 説明 ファイル名
CJK OTF fonts with different default language 4言語のグリフを各ウェイトごとに1ファイルにまとめたもの。各ファイルはデフォルトで一言語のグリフをサポートし、GSUB’locl’を使えば他の言語をサポートできる。28ファイルある。 NotoSansCJKSC-hinted.zip, NotoSansCJKSC-hinted.zip, NotoSansCJKJP-hinted.zip, NotoSansCJKKR-hinted.zip
All-in-one CJK super OTC font 4言語×7ウェイトを全部ひとつにまとめたもの(Windowsは未サポート) NotoSansCJK.ttc
CJK OTC fonts 各ウェイトごとに4言語を1ファイルにまとめたもので7ファイルある。デフォルト言語の指定を行う。さらに、GSUB’locl’をサポートすればデフォルト以外の言語の指定ができる。(Windowsは未サポート) NotoSansCJK-[Weight].ttc
Region specific OTF subsets 4言語(地域別)のサブセット。グリフは各言語用のみである。4言語×7ウェイトの 28ファイルある。 NotoSansSC-[Weight].otf, NotoSansTC-[Weight].otf, NotoSansJP-[Weight].otf, NotoSansKR-[Weight].otf

使う側からしますと、どのフォントをインストールするべきかが気になります。

最初にCAS-UBでPDFを作成するという観点で調べてみました。上述のアドビの資料に選択のためのチャートが出ていますが、CAS-UBでPDF出力を行うのはAH Formatterです。

AH Formatterは、現在のところ、OTC形式のフォントを全くサポートしていません(Windowsも同じですが)。このため、CJK OTF fonts with different default languageか、Region specific OTF subsetsが選択肢となります。[2]

CJK OTF fonts with different default languageは、例えば日本語を基本言語とするシステムではNotoSansCJKJPをインストールし、日本語以外の言語のグリフはGSUB’locl’を使って選択します。このフォントではAH Formatterは、次のような動作になります。

1.日本語のグリフは通常に処理します。組版対象の文字列に日本語以外のスクリプトが指定されていると、その部分はPDFにフォント(グリフ)を埋め込みます[3]

2.言語指定があると、次のようにスクリプトを類推します。
xml:lang=”ja” –> script=”Jpan”
xml:lang=”ko” –> script=”Hang”
xml:lang=”zh-CH” –> script=”Hans”
xml:lang=”zh-TW” –> script=”Hant”

ということで、PDF生成では、CJK OTF fonts with different default language、Region specific OTF subsetsのどちらのパッケージもとりあえず使えるようです(ただし、[2] の事情でMR5をお待ちいただく必要があります)。

問題はEPUBの方ですが、これは次回に調査結果を報告したいと思います。
『多言語EPUBの作成において考慮すべき技術要件』に続く。

[1] Source Han Sans V1.001
[2] AH FormatterはV6.2MR3からNoto Sans CJK V1.000(当時は Region specific OTF subsetsのみ提供されていました)をサポートしています。しかし、今回、CAS-UBの試験用システムで使ってみましたところ、Noto Sans CJK V1.001でフォント側が変更になってしまったため、V1.001では正しくPDFにフォント埋め込みができません。次の、AH Formatter MR5でNoto Sans CJK V1.001対応の改訂版を提供する予定です。また、もし、AH FormatterのユーザーでOTC形式のサポートが必要という方は、AH Formatterのサポートまでご相談ください。
[3] スクリプト名については、ISO 15924: Codes for the representation of names of scriptsを参照。

今年もPage2013に、CAS-UBやAH Formatterを中心に出展いたします。

アンテナハウスは、2月6日(水)~2月8日(金)東京・池袋サンシャインシティコンベンションセンター TOKYO(展示ホー ルD:文化会館2F) で開催されるPage 2013に出展します。

■Pageでの弊社の主要出展内容

主に次の製品を展示いたします。説明員がデモの用意をしてお待ちしていますので、ぜひご来場ください。

1) CAS-UB

ワンソースでブックオンデマンド書籍のためのPDF制作、EPUB・Kindle形式の電子書籍の制作を同時に行なうことができます。

2) XMDFtoEPUB変換ツール

XMDFのソースXMLから、EPUBに変換できます。「電書協フォーマット」対応のEPUBを出力することもできます。

3) AH Formatter

(1) 多言語組版

AH FormaterV6.0では南アジア・東南アジアの文字はデバナガリ(Devanagari)文字とタイ(Thai)文字のみのサポートです。V6.1でインド系文字にベンガリ(Bengali)、グジャラーティ(Gujarati)、タミール(Tamil)、テルグ(Telgu)、グルムキ(Gurmukhi)、オリア(Oriya)、カンナダ(Kannada)、マラヤラム(Malayalam)の8文字を追加、東南アジア系文字にクメール(Khmer)文字の組版をサポートします。

(2) 数式組版

数式組版についてもV6.1に向けて機能強化中です。

■出展情報
ブース番号:D-26
入場費用 :1,000円(下記までお問い合わせいただければ無料入場券を送付いたします)
お問い合わせ:03-5829-9021 
e-mail:sis@antenna.co.jp