Noto Sans CJK, Source Han SansフォントとAH FormatterによるPDF生成

10/25のCAS-UB:多言語機能に魂を入れるため、ドキュメントの多言語化と、EPUBの多言語化を考えるの続きです。

GoogleのNoto Sans CJKフォントとアドビのSource Han Sansは9月にそれぞれV1.001になりました。7月の初版(V1.000)からの変更点についてはアドビの資料「Source Han Sans V1.001」([1])の最後に詳しく出ています。これによりますと、各言語でかなり細かいチューニングが行われています。

最初に目につく変更点はV1.001からNoto Sans CJKとSource Han Sansのパッケージ方式が共通になり、次の表のようにそれぞれ4種類になったことです。

表1.フォントの構成

名称 説明 ファイル名
CJK OTF fonts with different default language 4言語のグリフを各ウェイトごとに1ファイルにまとめたもの。各ファイルはデフォルトで一言語のグリフをサポートし、GSUB’locl’を使えば他の言語をサポートできる。28ファイルある。 NotoSansCJKSC-hinted.zip, NotoSansCJKSC-hinted.zip, NotoSansCJKJP-hinted.zip, NotoSansCJKKR-hinted.zip
All-in-one CJK super OTC font 4言語×7ウェイトを全部ひとつにまとめたもの(Windowsは未サポート) NotoSansCJK.ttc
CJK OTC fonts 各ウェイトごとに4言語を1ファイルにまとめたもので7ファイルある。デフォルト言語の指定を行う。さらに、GSUB’locl’をサポートすればデフォルト以外の言語の指定ができる。(Windowsは未サポート) NotoSansCJK-[Weight].ttc
Region specific OTF subsets 4言語(地域別)のサブセット。グリフは各言語用のみである。4言語×7ウェイトの 28ファイルある。 NotoSansSC-[Weight].otf, NotoSansTC-[Weight].otf, NotoSansJP-[Weight].otf, NotoSansKR-[Weight].otf

使う側からしますと、どのフォントをインストールするべきかが気になります。

最初にCAS-UBでPDFを作成するという観点で調べてみました。上述のアドビの資料に選択のためのチャートが出ていますが、CAS-UBでPDF出力を行うのはAH Formatterです。

AH Formatterは、現在のところ、OTC形式のフォントを全くサポートしていません(Windowsも同じですが)。このため、CJK OTF fonts with different default languageか、Region specific OTF subsetsが選択肢となります。[2]

CJK OTF fonts with different default languageは、例えば日本語を基本言語とするシステムではNotoSansCJKJPをインストールし、日本語以外の言語のグリフはGSUB’locl’を使って選択します。このフォントではAH Formatterは、次のような動作になります。

1.日本語のグリフは通常に処理します。組版対象の文字列に日本語以外のスクリプトが指定されていると、その部分はPDFにフォント(グリフ)を埋め込みます[3]

2.言語指定があると、次のようにスクリプトを類推します。
xml:lang=”ja” –> script=”Jpan”
xml:lang=”ko” –> script=”Hang”
xml:lang=”zh-CH” –> script=”Hans”
xml:lang=”zh-TW” –> script=”Hant”

ということで、PDF生成では、CJK OTF fonts with different default language、Region specific OTF subsetsのどちらのパッケージもとりあえず使えるようです(ただし、[2] の事情でMR5をお待ちいただく必要があります)。

問題はEPUBの方ですが、これは次回に調査結果を報告したいと思います。
『多言語EPUBの作成において考慮すべき技術要件』に続く。

[1] Source Han Sans V1.001
[2] AH FormatterはV6.2MR3からNoto Sans CJK V1.000(当時は Region specific OTF subsetsのみ提供されていました)をサポートしています。しかし、今回、CAS-UBの試験用システムで使ってみましたところ、Noto Sans CJK V1.001でフォント側が変更になってしまったため、V1.001では正しくPDFにフォント埋め込みができません。次の、AH Formatter MR5でNoto Sans CJK V1.001対応の改訂版を提供する予定です。また、もし、AH FormatterのユーザーでOTC形式のサポートが必要という方は、AH Formatterのサポートまでご相談ください。
[3] スクリプト名については、ISO 15924: Codes for the representation of names of scriptsを参照。