10/25のCAS-UB:多言語機能に魂を入れるため、ドキュメントの多言語化と、EPUBの多言語化を考えるの続きです。
GoogleのNoto Sans CJKフォントとアドビのSource Han Sansは9月にそれぞれV1.001になりました。7月の初版(V1.000)からの変更点についてはアドビの資料「Source Han Sans V1.001」([1])の最後に詳しく出ています。これによりますと、各言語でかなり細かいチューニングが行われています。
最初に目につく変更点はV1.001からNoto Sans CJKとSource Han Sansのパッケージ方式が共通になり、次の表のようにそれぞれ4種類になったことです。
表1.フォントの構成
名称 | 説明 | ファイル名 |
---|---|---|
CJK OTF fonts with different default language | 4言語のグリフを各ウェイトごとに1ファイルにまとめたもの。各ファイルはデフォルトで一言語のグリフをサポートし、GSUB’locl’を使えば他の言語をサポートできる。28ファイルある。 | NotoSansCJKSC-hinted.zip, NotoSansCJKSC-hinted.zip, NotoSansCJKJP-hinted.zip, NotoSansCJKKR-hinted.zip |
All-in-one CJK super OTC font | 4言語×7ウェイトを全部ひとつにまとめたもの(Windowsは未サポート) | NotoSansCJK.ttc |
CJK OTC fonts | 各ウェイトごとに4言語を1ファイルにまとめたもので7ファイルある。デフォルト言語の指定を行う。さらに、GSUB’locl’をサポートすればデフォルト以外の言語の指定ができる。(Windowsは未サポート) | NotoSansCJK-[Weight].ttc |
Region specific OTF subsets | 4言語(地域別)のサブセット。グリフは各言語用のみである。4言語×7ウェイトの 28ファイルある。 | NotoSansSC-[Weight].otf, NotoSansTC-[Weight].otf, NotoSansJP-[Weight].otf, NotoSansKR-[Weight].otf |
使う側からしますと、どのフォントをインストールするべきかが気になります。
最初にCAS-UBでPDFを作成するという観点で調べてみました。上述のアドビの資料に選択のためのチャートが出ていますが、CAS-UBでPDF出力を行うのはAH Formatterです。
AH Formatterは、現在のところ、OTC形式のフォントを全くサポートしていません(Windowsも同じですが)。このため、CJK OTF fonts with different default languageか、Region specific OTF subsetsが選択肢となります。[2]
CJK OTF fonts with different default languageは、例えば日本語を基本言語とするシステムではNotoSansCJKJPをインストールし、日本語以外の言語のグリフはGSUB’locl’を使って選択します。このフォントではAH Formatterは、次のような動作になります。
1.日本語のグリフは通常に処理します。組版対象の文字列に日本語以外のスクリプトが指定されていると、その部分はPDFにフォント(グリフ)を埋め込みます[3]。
2.言語指定があると、次のようにスクリプトを類推します。
xml:lang=”ja” –> script=”Jpan”
xml:lang=”ko” –> script=”Hang”
xml:lang=”zh-CH” –> script=”Hans”
xml:lang=”zh-TW” –> script=”Hant”
ということで、PDF生成では、CJK OTF fonts with different default language、Region specific OTF subsetsのどちらのパッケージもとりあえず使えるようです(ただし、[2] の事情でMR5をお待ちいただく必要があります)。
問題はEPUBの方ですが、これは次回に調査結果を報告したいと思います。
『多言語EPUBの作成において考慮すべき技術要件』に続く。
[1] Source Han Sans V1.001
[2] AH FormatterはV6.2MR3からNoto Sans CJK V1.000(当時は Region specific OTF subsetsのみ提供されていました)をサポートしています。しかし、今回、CAS-UBの試験用システムで使ってみましたところ、Noto Sans CJK V1.001でフォント側が変更になってしまったため、V1.001では正しくPDFにフォント埋め込みができません。次の、AH Formatter MR5でNoto Sans CJK V1.001対応の改訂版を提供する予定です。また、もし、AH FormatterのユーザーでOTC形式のサポートが必要という方は、AH Formatterのサポートまでご相談ください。
[3] スクリプト名については、ISO 15924: Codes for the representation of names of scriptsを参照。
今年もPage2013に、CAS-UBやAH Formatterを中心に出展いたします。
アンテナハウスは、2月6日(水)~2月8日(金)東京・池袋サンシャインシティコンベンションセンター TOKYO(展示ホー ルD:文化会館2F) で開催されるPage 2013に出展します。
■Pageでの弊社の主要出展内容
主に次の製品を展示いたします。説明員がデモの用意をしてお待ちしていますので、ぜひご来場ください。
1) CAS-UB
ワンソースでブックオンデマンド書籍のためのPDF制作、EPUB・Kindle形式の電子書籍の制作を同時に行なうことができます。
2) XMDFtoEPUB変換ツール
XMDFのソースXMLから、EPUBに変換できます。「電書協フォーマット」対応のEPUBを出力することもできます。
3) AH Formatter
(1) 多言語組版
AH FormaterV6.0では南アジア・東南アジアの文字はデバナガリ(Devanagari)文字とタイ(Thai)文字のみのサポートです。V6.1でインド系文字にベンガリ(Bengali)、グジャラーティ(Gujarati)、タミール(Tamil)、テルグ(Telgu)、グルムキ(Gurmukhi)、オリア(Oriya)、カンナダ(Kannada)、マラヤラム(Malayalam)の8文字を追加、東南アジア系文字にクメール(Khmer)文字の組版をサポートします。
(2) 数式組版
数式組版についてもV6.1に向けて機能強化中です。
■出展情報
ブース番号:D-26
入場費用 :1,000円(下記までお問い合わせいただければ無料入場券を送付いたします)
お問い合わせ:03-5829-9021
e-mail:sis@antenna.co.jp