英数字の方向のこと、いまTwitterで議論がなされていることへの簡単な説明

縦組みにおける英数字の方向についての議論が活発ですが、どうも議論をしている人たちは、本来別のものとして分けて考えるべき問題を一つにごっちゃにして議論しているのではないかと思います。

その結果、シンプルである問題を複雑にしてしまっているのではないでしょうか。

●現状と課題

Unicodeは文字(Character)の抽象的な形状に基づいてコードポイントを与えており、具体的な形状であるグリフやその方向は定義しないとしています[*1]。そこで、縦組み時に文字の向きを指定しないときの方向(デフォルトの方向)はアプリケーションに任されることになります。

Microsoft Officeを初めとする多くのアプリケーションは、UnicodeのBasic Latin(ASCIIコード、MS IMEでは半角英数で入力、以下「半角文字」)は時計回りに90度回転した状態(横倒し)をデフォルトとし、その全角形(FullWidth Variant、MS IMEでは全角英数で入力。以下「全角文字」)は正立としています。一方、青空文庫のリーダでは半角文字を正立させているものもあります[*2]。このように、特に、半角文字の向きは必ずしもすべてのアプリケーションで同じではありません。

UnicodeのUTR#50という仕様[*3](仕様案)で決めようとしているのは、文字のコードポイント毎のデフォルトの方向です。これが決まって普及するとアプリケーション毎に文字の向きがばらばらになる状態が解消されるものと期待されます。

縦組みは新聞、雑誌を初め文芸書やビジネス・経済書などの書籍では頻繁に使われています。これらの出版物の制作にはプロの編集者・制作者・印刷会社が関与しています。しかし、いままで、オフィスソフトで作成する文書はほとんど横組みです。また、Webでは縦書きがほとんど使われていませんでした。つまり、縦組み制作は専門家のものであり、一般人は縦組み出版物を読むことがあっても作成するドキュメントは横組み中心でした。そこで縦組みの出版物での文字の向きに関する取り扱いは一般人には縁遠いものだったと言えます。

現在、CSS3で縦組みが標準化されてブラウザで読めるようになりつつあります。そうすると縦組みブログも数多く登場するでしょう。また、EPUBでも縦組みを使えるようになります。このように一般人が縦組みで表現する機会が増えるものと予想します。専門家は訓練を受けており、DTPソフトなどのツールを使うことができますが、一般人はそうではありません。そこで、縦組み時に文字がどういう向きになるかでかなりの混乱が生まれることになるでしょう。

このような観点に立つとUTR#50の意義は非常に大きなものがあります。

さて、UTR#50の現在の仕様案(ドラフト5版)には縦組みの行における文字のデフォルト方向としてMVO方式とSVO方式が記述されています。他にHOもありますが、これは横書きなので省略します。

●MVOとSVOはどういうものか?

MVO方式での文字のデフォルト方向の決定方針は複雑であり、個々の文字については様々な意見が出ておりまとまっていません。いま、本ブログで注目している英数字(ラテンアルファベットとアラビア数字)についてだけを見ますと、MVO方式では半角文字を横倒しとし全角文字を正立とします。一方、SVO方式では半角英数、全角英数とも正立です。

・MVOでは、Basic LatinのU+002E … U+005Aは、縦組み時に横倒し、その全角形(全角文字)は正立
・SVOでは、Basic LatinのU+002E … U+005Aと、その全角形は両方とも正立

MVO方式とSVO方式の適用範囲に関する記述は曖昧なのでよく理解できません。Forumで質問したところ、UTR#50のエディタであるEric Muller氏からは、SVOは英語に適用するものであって日本語はMVOを適用すると回答がありました[*4]。しかし、CSSのワーキンググループのfantasaiは別の考えを示しています。このあたりの関係はよくわからないのですが、SVOはCSSのワーキンググループの考えをEric Muller氏が受け入れたものということなので[*5]、fantasaiの考えが及ぶものと見ることもできます。

●MVOとSVOの適用例

ということでUTR#50のSVOが日本語に適用されるものなのかどうかは今の仕様案からは読み取ることができません。今後変わる可能性もあると期待して、とりあえずMVOとSVOを日本語文字列にも適用できるとします。するとMVOとSVOによる英数字のデフォルト方向は次の図のようになります。

図では、MVOとSVOで同じ内容の行がそれぞれ2行ずつペアになっていますが、そのペアの右は英数字と記号を半角文字で入力、左は全角文字で入力したものです。

日本語の縦組みの行に英数字が単独で現れた場合、全角文字・半角文字に如何に関わらず正立させるSVOの方が自然ということが大多数の人が認めると思います。しかし、Twitterの議論では、どうも、SVO方式の支持者は少なく、MVO方式の支持者の方が多いように思います。

●文字単位と文字列の表記の違い

たとえば、強硬なMVO支持者である山本太郎氏は、つぎのような理由で半角文字横倒しを主張しています[*6]。

1.縦組みの日本語文字の中に英文が入る場合、英文は横倒しにするのが一般である。
2. 新聞などの限られた分野では英文やアラビア数字列を正立させているが、新聞では段の文字数が少ないなどの制約がある。また、新聞以外の出版物で英数字が正立するのは頭字語や縦中横などのトリック的な表示に限られる。
3.フォントに縦組み用メトリックス情報がないなど技術的制限があるし、日本語の中で英数字を正立させる慣例が確立されていない。このような理由で縦組みで英数字を正立させると組版結果が醜いものとなる。特に、全角文字ではないラテンアルファベットは横倒しにすべきである。
4. 英数字正立をデフォルトとすると、少なくない人々が、正当な書法では縦書きでは漢数字を使うべきであることを忘れて、アラビア数字を縦書きで使い始めるだろう。そして伝統的な方法を学ぶ機会もなくなる。
5. 縦中横のような方法で英数字を正立させるのは訓練された組版担当者に行なわせるべきであり、このようなトリックをデフォルトにするべきではない。
6. 一部の人は、西欧生まれのラテン文字やアラビア数字の向きを正立をデフォルトとせよ、と主張する。しかし、そういう主張は開発者、ユーザ、組版を誤った方向に導くものであり、信じがたい。

実際には、UTR#50は、1文字単位で、特にマークアップがなければどういう方向を向かせるか(デフォルトの方向)を決めるものです。縦組みの和文中で英語の単語や文章が現れたとき(つまり、組版での和欧混植)どうするかは、英語の単語や文章を縦組みの行の中にどう配置するかという問題なのであり、これはUTR#50で決めることではありません。

山本太郎氏の意見を典型として、Twitterの議論の多くは、このあたりを拡大解釈して、あたかもUTR#50は、和欧混植の組版や混植文字列の表示をどうすべきかという観点から、各文字のデフォルトの向きを議論しているようです。実際には文字は単独で現れるだけではなくて、文字列の中で現れることが多いので、1文字単位の方向を文字列内での方向と同じ向きにしたいという、そういう風な議論になりがちなのはわかります。

しかし、現実には1文字単位の方向と文字列内(和欧混植など)での方向は必ずしも一致しません

縦組みの行に英数字が1文字だけ現れた場合は正立が自然と述べました。では、2文字以上連続したときの方向は一体どうなるべきでしょうか?

実際の出版物を調べてみますと、アラビア数字は、1文字なら正立、2文字なら縦中横、3文字~4文字なら一文字ずつ正立、などと表記することが多くなります。つまり2文字のときは特殊な配置になりますが、多くの場合正立します。しかし、縦組み参考文献表で参照ページ番号をpp.10-11のように示す場合や、数式の中に現れるアラビア数字は全体を時計回りに90度回転して配置しますので、横倒しにする方が良いでしょう。

一方、ラテンアルファベットについてみますと、たとえば、Nippon Hōsō Kyōkaiは縦組み中では文字列全体を時計周りに90度回転して表示する(文字毎では横倒ししているように見えます)のが綺麗に見えるでしょう。しかし、NHKと表記したときは3文字をそれぞれ正立して表すのが普通です。同じN、H、Kという文字が文脈によって正立にも横倒しにもなりえるのです。

文字の方向は言葉の中で文字がどのように使われているかの役割やその書記方法に基本的に依存します。さらに著者や編集者なりの考えがあった場合、その考えに沿った指定ができることが重要です。

●文字単独と組版問題を分離する

このように英数字が2文字、3文字…と連続するときにどう配置するかは、文字のコードポイントに付随させる属性というよりも、むしろ文字列を行の中にどのように配置するかという組版の問題です。そして、文脈依存で変わりうるものです。したがって、ケースバイケースで外部から指定できることが重要となります。つまり「CSSなり他のアプリケーションで決定するべき問題」ということです。

●全角文字と半角文字で方向の使い分けの問題

MVOでは半角文字を横倒し、全角文字を正立とします。つまり、縦組み時のデフォルトの方向を文字コードで使い分けるという考えです。これは専門的・技術的な問題なので詳しくは別途検討したいと考えますが、ここで結論だけ述べるとこれは不可です。

理由は次のようなことです。①現在までの文字コードとフォントの技術進歩に相反するものである。②文字コードレベルでの使い分けは原テキストの書き直しを必要とするのでコンテンツが縦組み専用となる。③半角文字(文字コードレベル)であっても全角形で表示することができるし、その逆も可能なため、外観だけでは、半角文字なのか全角文字なのかの区別ができない。このため半角文字と全角文字の使い分けを厳密に行なうにはツールの支援が必要となる、など。

[*1] UTR#50(Unicodeの縦書きの文字の向き)の話題
[*2] Unicode仕様書第1章を参照のこと
[*3] http://twitpic.com/a180ys
[*4] Unicode Properties for Horizontal and Vertical Text Layout
[*5] Fundamental questions
[*6] https://twitter.com/kojiishi/status/217421396391899136
[*7] About the MVO, http://blogs.adobe.com/CCJKType/files/2012/07/TaroUTR50SortedList112.pdf

■CASオンラインショップでCAS-UBのユーザー登録をしていただくと、誰でも30日間だけ無償でご利用いただくことができます。
CAS-UB評価ライセンス

メルマガEPUB版をiBooksで読んでみると・・・

以前にCAS-UBにメルマガをEPUBにするインポート機能をつけていることを書きました。

今日はその続きですが、メルマガをEPUBにしたものをiBooks(新しいiPad)で表示してどうしたら読みやすくなるかを考えて見ます。

材料としては次の2種類のメルマガを使わせていただきました。

1.小寺信良の「金曜ランチボックス」 2012年6月15日 Vol.030 「夜間飛行」から配信のもの
2.津田大介の「メディアの現場」 2012年6月13日 Vol.36 「夜間飛行」から配信のもの

「夜間飛行」はメルマガをテキスト形式の他にEPUB形式でも配信しています。「金曜ランチボックス」は「夜間飛行」のシステムで自動的にEPUB形式に変換しているようですが、「メディアの現場」は、津田大介氏の事務所(ネオローグ)が独自にEPUB形式にしてから、それを配信しているようです。

そこで、現在、それぞれのメルマガで配信されているEPUB版(オリジナル版と略記)と、CAS-UBでEPUB形式に変換したもの(本文ゴシック、本文明朝)2種類とを比較してみました。なお、CAS-UBのスタイルシートは現在開発中のアルファ版ですので、正式提供時は変更になることがあります。(スタイルシートは、本日現在クラウドから指定できません)。

1.小寺信良の「金曜ランチボックス」の場合
a) オリジナル版

b) CAS-UB本文ゴシック

c) CAS-UB本文明朝

2.津田大介の「メディアの現場」の場合
a) オリジナル版

b) CAS-UB本文ゴシック

c) CAS-UB本文明朝

3.備考

2種類のメルマガEPUB版についてそれぞれ1画面だけ紹介しました。少し特徴を挙げます。

1)iBookは、特に指定しないと本文がかな漢字はゴシック体、英数字がプロポーショナルの明朝系フォントになります。オリジナル版はそのような表示になっています。

印刷の場合はこういう使い方はしないのではないかと思いますが、URLのような長い英数字列が頻繁に出てくる場合、これでも良いかという気がします。

2)CAS-UB本文ゴシック版は、見出しも本文もゴシック体を有効になるように指定しています。

本文の行送りが少し狭いような印象があります。また、メルマガを自動的にEPUBにするとURLがそのまま見えてしまいますので、URLの表示に工夫が必要なように思います。

3)CAS-UB本文明朝版は、見出しはゴシック、本文が明朝体に指定しています。

新しいiPad位の解像度になりますと、本文を明朝にしても十分読むことができるように思います。ただ、ちょっと画面が白すぎるのが気になりますね。

さて、読者の皆様はこの3種類でどれが一番読みやすいと感じますか。いかがでしょうか。コメントをいただけるとありがたいです。

《注意》現在、CSSスタイルシートは開発中のため実際のサービスで提供されるものは変更になると思います。ご了承ください。

メルマガ配信の新しいステージとEPUBのインパクトを考える―(3)メルマガビジネスの将来

『堀江貴文のブログでは言えない話』の成功により、有料メルマガのブームが始まったのですが、それでは将来はどうなるのでしょうか。

日経ビジネス2012年6月25日号の「敗軍の将、兵を語る」は「ホリエモンの獄中手記」です。その記事の最後の方に次のような文章があります:

しかし、「有料メルマガ」というメディアは大きな可能性があるかもしれません。将来は、テレビや新聞、雑誌に置き換わっていくものだと期待し、発信を続けていきます。

・有料メルマガが堀江氏の予見通り大きなメディアに成長するのでしょうか?
・そのためには何が必要なのでしょうか?

このことについて多方面から勉強してみたいと考えて、有料メルマガライターまたは制作者を対象にして、「ビジネスモデルとしての有料メルマガを考える」セミナーを開催することにしました。本セミナーでは、メルマガ評論家の渡辺文重氏をゲストにお招きして、最近の有料メルマガの動きや未来についてお話をいただきます。

また、私は、EPUBがその一つの鍵になるのではないかと考えています。そして、アンテナハウスでは、メルマガを自動でEPUB3に変換するサービスを近く開始します。本セミナーではその狙いや内容についても紹介します。

●本セミナーの概要

テーマ 有料メルマガライターまたは制作者のためのEPUB作成セミナー
~ビジネスモデルとしての有料メルマガを考える~
開催日時 2012年7月11日(水)18時30分~20時45分(受付開始18時00分)
主な内容 ・渡辺 文重氏講演「有料メルマガの未来」(45分)
・アンテナハウスのメルマガからEPUB3への変換サービスの趣旨とサービス内容説明(40分)
・質疑応答(15分)
会場 東京・秋葉原UDXビル8F ネットカンファレンス会議室B
定員 40名
参加費用 一般5,250円(消費税込み)。但し、有料メルマガ・ライターまたは制作者は発行しているメルマガを示していただいた場合、無料となります。
主催 アンテナハウス株式会社
セミナー事務局 株式会社エクスイズム
お申し込み 次のセミナー事務局の申し込みフォームでお申し込みください。
セミナー事務局申し込み先(エクスイズムのWebページにジャンプします)

メルマガ配信の新しいステージとEPUBのインパクトを考える―(2)メルマガの配信形式

前回はメルマガ配信スタンドの動向、有料メルマガの増加、著者個人によるメルマガ配信の可能性、などについて考えてみました。

今回は、メルマガの配信形式として、EPUBが普及するかどうかを考えて見ます。

やはり、最初に過去の歴史をさかのぼって見ます。まず、電子メールはこれまではテキスト形式が主流でHTMLメールが副次的に使われてきました。しかし、日本ではHTMLメールはあまり普及していません。米国などではHTMLメールがもっと普及していると耳にします。

「マグマグ」のベストセラーメールの配信形式をみてもHTMLメールは少ないことから、メルマガ配信形式としてのHTMLメールもあまり普及していないと言えるようです。

1. HTMLメールが普及しなかった理由

HTML形式にすることで、テキスト形式に比べて次のようなメリットがあります。

(1) 見出しなどにレイアウトをつけたり、背景をつけたり、フォントサイズ指定、フォントファミリー指定などのレイアウト指定が可能
(2) 画像をページの中に埋め込むことでいままでコンテンツの充実が図れる
(3) 表の表現ができる

こうしてみますと、表現力という点では、HTMLメールがよさそうに見えます。

しかし、HTMLメールには次のような問題点があります。

(1) HTMLメールに対応したメール閲読ソフトが必要。
(2) HTMLメールでは、スクリプトを埋め込むことができるのでこれを悪用したウイルスが可能になるという問題があり、最初の頃にかなりネガティブキャンペーンが行なわれた。
(3) テキストだけと比べて、表などのレイアウトを指定するには、プラスアルファの作業が必要になる。
(4) さらにレイアウトセンスが問われる。一人で執筆能力とレイアウト能力を兼ね備えた著者は少ない。
(5) 画像を含めることが可能になるので、それを生かすためには、テキスト能力に加えて写真やイラストなどの画像を準備することが必要になる。

有料メルマガの場合は、お客さまでもある読者に向かってウイルスを送信する著者はいないでしょうし、(1)、(2)はあまり問題にならないでしょう。

(3)~(5)からは、HTMLメールの可能性を生かすには、著者の方に文章を書くことに加えて、熱意・スキル、スキルが足りない場合にはそれを補う体制作りが必要になることがわかります。

2. EPUB版メルマガの登場

前々回(CAS-UBにメルマガインポート機能(アルファ版)を追加)
に紹介しましたが、2011年10月に津田大介さんのメルマガをEPUBに無償変換するサービスが登場したことがTwitter上で話題になりました。

その後、『津田大介の「メディアの現場」』は既にEPUB版のテキストメールとの同時配信を開始しています。また、「夜間飛行」はテキストメールとEPUBメールの同時配信を行なっています。

さらに、インプレスはEPUB版のみのメルマガを配信開始しています。このようにEPUBがメルマガの形式として採用される動きが出ています。

3. EPUB版メルマガの将来を考える

今後、これらの動きはどこまで進むのでしょうか?

・有料メルマガの間に爆発的に普及するか、
・HTMLメールと同じように、一部の著者の採用するところでとどまるのでしょうか?

EPUB版メルマガは表現力という点ではHTMLメールと類似しています。つまりHTMLメールの長所を引き継ぐことになります。

さらに、HTMLメールに無い、EPUB版メルマガの特徴として第一にパッケージ化があります。パッケージ化によって出版物としての形態を整えることができ、電子書店の店頭に並べることが可能になります。つまり流通ルートを増やせる可能性がある、ということになります。

一方で、HTMLメールが普及しなかった理由の(1)~(5)は、HTMLメールとEPUBメルマガの違いは、閲読環境のメールソフトをEPUBリーダやスマホ・タブレット環境に置き換えて考えると、EPUB版メルマガにもそのままあてはまってしまうようです。

ですので、EPUBメルマガが普及するためには、次の要件が整う必要があるのでしょう。

・まず閲読環境の普及が必須です。
・次にEPUB版メルマガの制作体制を整えること。

■■7月11日「有料メルマガライターまたは制作者のためのEPUB作成セミナー」を開催します。

メルマガ配信の新しいステージとEPUBのインパクトを考える―(1)メルマガ配信の変遷

現在は、週刊有料メルマガ『堀江貴文のブログでは言えない話』が発行数1万を超える成功を収めたのをきっかけとするメルマガブームの最中です。

ここでは有料メルマガ配信の未来を考えるために、これまでのメルマガ配信の歴史を少し見てみます。ざっと調べてみた範囲ですので、間違いが多いと思いますが、お気づきの点を指摘いただけると嬉しいです。

1. 初期のメルマガ配信スタンド

昔からのメルマガ配信スタンドでは、「まぐまぐ」が有名です。1997年にスタートした老舗です。
http://www.mag2.com/

「マグマグ」より少し遅れてNiftyも1998年7月にメルマガ配信サービス(Macky!)を開始しました。こちらは、その後、いくつかの変遷を経て終了になっています。このほかに、1990年代終わりから2000年代初めには、メルマ、メルマガ天国、パブジン、カブライト、E-Magazineなどの多数のメルマガ配信サービスがあったようです。

例えば次の記事:電子メールマガジンの作り方:インターネットウオッチ
http://internet.watch.impress.co.jp/www/column/m_mag/

しかし、上に掲載したメルマガ配信スタンドは2012年現在ではすべて活動を停止しています。
こうした初期のメルマガ配信スタンドは、「まぐまぐ」を除いて運営のための収入を確保するビジネスモデルが確立できなかったのではないかと思います。

おそらく初期のメルマガ配信スタンドは広告モデルであったため、読者を多数確保しなければならず、大きなスタンドしか広告収入を確保できなかったのだろうと推測します。なぜ、「まぐまぐ」が生き残り、他は生き残ることができなかったのかはもう少し詳しく調べてみる必要があります。

2. 有料メルマガの登場

初期のメルマガ配信スタンドは、その殆どが無料メルマガの配信だったと見られます。「まぐまぐ」が有料メルマガの配信を始めたのは、2001年の秋となっています。

○まぐまぐ、有料メールマガジン配信「まぐまぐプレミアム」開始
http://internet.watch.impress.co.jp/www/article/2001/0731/magpre.htm

週刊有料メルマガ『堀江貴文のブログでは言えない話』はこの有料メルマガの延長上にあります。

3. 有料メルマガ専門配信スタンドの登場

「まぐまぐ」は、無料メルマガからスタートして有料メルマガもサービスするようになったのですが、2010年頃から、有料メルマガを主体とするメルマガ配信スタンドが登場しています。これは新しい動きと言えます。

各メルマガスタンドがブランド・イメージ確立のためか、著者をかなり厳選してメルマガ発行に取り組んでいるようです。このためメルマガ配信スタンド毎にみますと、タイトル数がまだ2桁の前半です。

こうした新しいスタンドは著者をセレクトするという点で「まぐまぐ」とは一線を画しています。プロに近い著者に限定することでコンテンツのレベルを確保し、読者が安心して購読できることになります。その一方で、有料メルマガを配信したい多くの著者にとっては敷居の高い存在となります。

こういったメルマガ配信スタンドが今後どうなるか、その行方には目を離せません。

●「夜間飛行」
http://yakan-hiko.com/
ひよこファイターmusic合同会社
2008年設立
17人の著者の有料メルマガを配信

●「タグマ!」
http://www.targma.jp/
株式会社メディア・ヴァーグ
2011年4月設立

●「BLOGOSメルマガ」
http://magazine.livedoor.com/
ライブドアの有料メルマガサービス
24誌を配信

●「ビジスパ」
http://biz-spice.jp/public/
株式会社ビジスパ

●「フーミー」
http://foomii.com/magazines/
株式会社foomii
2010年6月~
42タイトル

●「イズメディアモール」
https://mall.ismedia.jp/?gclid=CMmt4-e227ACFUdKpgodcg2R0Q
2011/12/16 :イズメディア・モール オープン
イズメディア・モールにメルマガのセレクトショップがオープンしました。

4. 出版社によるメルマガ配信への動き

もうひとつ眼を離すことができないのは、大手の出版社によるメルマガ配信開始の動きです。

4.1 サイゾウ
サイゾウメールマガジン
http://www.cyzo.com/2011/06/post_7638.html
PC、携帯、スマートフォン向け/HTML形式

4.2 インプレス
MAGon
http://magon.impress.co.jp/
メール添付でEPUBを配信
2012年3月1日

4.3 講談社
講談社から初の有料メルマガ!第一弾は古賀茂明氏 
『現代ビジネス』( http://gendai.ismedia.jp /編集長・瀬尾傑)は、2012年1月12日、有料メールマガジンの発行を始めました。講談社が有料メールマガジンを発行するのは初めてです。

4.4 文芸春秋
Number 有料メルマガ
http://number.bunshun.jp/list/vianumber
2011年3月開始
4タイトル

5. 著者自身の有料メルマガ配信

著者自身がメールマガジンを配信する方法の基本は、(1) スタンドアロンの専用メール配信ソフトを使って配信する方法です。これは通常のメールクライアントの延長になります。(2) さらに著者がメール専用サーバを立ててメールを配信する方法があります。(1)、(2)は専用のシステムですが、別の方法として、(3)共有インターネットのメール配信サービス(メルマガ配信Webサービス)があります。

配信サービスの方はWebサービス化によって、利用への敷居は今後さらに下がると見込まれます。

もう一つ、メルマガ配信スタンドの利用と著者自身の配信するときの相違点は、決済サービスがあります。決済サービスについては、個人の著者が顧客のクレジットカード情報を取得するのは敷居が高いのですが、現在は、PayPalのような仕組みで小額決済を簡単にできるようになってきています。

この方式による有料メルマガ発行がどの程度行なわれているかは簡単には調べることはできません。発行者が点在し、メルマガの読者に対してワン・ツー・ワン(ピンポイント)で配信する活動が、社会全体でどの程度の行なわれているかを補足するにはしっかりと設計した統計的な調査が必要となります。

しかし、配信と決済の敷居が下がっていることを考慮すると、著者自身によるメルマガ配信が増えているのではないかと推測できます。

6. まとめ

メルマガは日本独自のサービスといわれていますが、1990年代後半に最初のメルマガ配信スタンドである「まぐまぐ」が登場して15年を経過しました。当初は無料メルマガ中心でした。

しかし、堀江貴文氏が有料メルマガで成功を見せたことによって、メルマガ配信サービス業界が全体として新しいステージに入っている、と言えます。

この有料メルマガ配信の新ステージにおいてEPUBがどのような役割を果たすのでしょうか。これについては、また後日検討してみたいと思います。

■7月11日「有料メルマガライターまたは制作者のためのEPUB作成セミナー」を開催します。

CAS-UBにメルマガインポート機能(アルファ版)を追加

半年ほど前、Twitterで、津田大介さんのメルマガをEPUBに変換するサービスの話が話題になっていました。

これは、Masahiko OHKUBO(@mah_jp)さんという方が開発して、2011年10月22日から運用しているものです。

http://remoteroom.jp/mail2epub/

5月22日のJEPAのセミナーで、その後、津田大介さんの事務所ネオローグが独自にEPUB変換を行なうようになったという報告がありました。

http://www.neo-logue.com/mailmag/index.html

Twitter上で、話題になったときから、大変関心をもって見守っていたのですが、JEPAのセミナーは大変に刺激的なものでした。早速、弊社のエンジニアに頼んで、同じような機能をCAS-UBに用意しました。

CAS-UBのドラフトの画面のテキストインポート機能にメルマガをインポートする機能(アルファ版)を追加しています。インポートファイルの形式をクリックすると次の画面になります。

ここに4種類のメニューは、次の4つのメルマガに対応します。

・メルマガH:マグマグから配信されている「堀江貴文のブログでは言えない話」
・メルマガK:「夜間飛行」から配信されている小寺信良の「金曜ランチボックス」
・メルマガT:「夜間飛行」から配信されている『津田大介の「メディアの現場」』
・メルマガU:「夜間飛行」から配信されている「内田樹メールマガジン 大人の条件」

実はメルマガをEPUBに変換するサービスの大きな問題は、メルマガ一つ一つに、専用の変換メニューを用意しなければならないことです。プログラムそのものは難しくないのですが、一定のルールに従って書いてもらえないと綺麗な変換ができないのですね。で、ルールは各著者によって違いますので、個別対応が必要になります。

メルマガ用EPUB3スタイルシートは、現在、開発中です。とりあえずは、既存のスタイルシートを少し直して、「標準メルマガEPUB3(アルファ版)」を用意してありますので、関心をお持ちのかたはお試しになってみてください。

但し、現在、綺麗に変換できるメルマガとしては、上記の4種類(と同じ雛形で書いたメルマガ)だけで、それ以外は満足のいく変換にはなりません。

なお、上の4種類はいずれも既にEPUB形式で配信されていますが、CAS-UBのEPUB自動変換はそれらのものよりも多少は良いと思います。

新しいスタイルシートやビジネスモデルを含めて「国際電子出版EXPO」にてご案内の予定です。

また、7月11日夕方、秋葉原にて「ビジネスモデルとしての有料メルマガを考える」というテーマでセミナーを予定しています。

ご期待ください。

「銃・病原菌・鉄」に見る縦組みにおける英数字の扱いーアラビア数字はほとんど正立する

「銃・病原菌・鉄」(ジャレド・ダイヤモンド著、倉骨 彰訳、草思社、2000年10月発行)は上下巻合計約650頁の大著です。最近、文庫本が出版されていますが、ここでは単行本版を対象にして英数字がどのように組版されているかを見てみます。

1.全体

本文は縦組みですが、索引は横組みです。なお、原書には巻末に参考文献一覧がありますが、訳文では参考文献一覧は省略されており、Webで公開されています。

また、ページ番号は小口側にアラビア数字で表記、左頁下に片柱で章番号と章タイトルを横組み表記しています。章タイトルは本文は漢数字表記ですが、柱はアラビア数字表記に変更しています。

図のキャプションは横組みで、図番号は図1-1の形式です。図の説明文はキャプションの下についており横組みで、例えば「紀元前7000年」のように年数はアラビア文字で表記しています。

表は横組みであり、表キャプションは横組みで、表の番号は表5-1の形式です。

2.目次

部番号、章番号、ページ番号はアラビア数字です。章番号は2桁まで、ページ番号は3桁までですが2桁以上は縦中横となります。

3.本文

3.1 ラテンアルファベット

(1) ラテンアルファベットが正立で使われている箇所

a.一文字づつ正立――91箇所

本文中ではラテンアルファベットが1文字ずつ正立で使われている箇所が一番多くなっています。記号、頭字語のほか、言語の表記や音を表すために使われています。

(本文中の頁)

B型やO型、A型(p.28)、「最古といわれていたX」より古いX、古いX (p.52) 、DNA (p.56)、BC (p.138に2回)、bc (p.138)、牡馬Aは牡馬B、C、D、Eより…牡馬Bは序列が上のAには…序列が下のC、D、Eを…CはAとBに服従し、DとEを従えて (p.257)、線文字B (下p.17、下p.18、下p.24、下p.28、下p.40、下p.42に3回、下p.48)、線文字A (下p.28、下p.48)、 他の欧州語にある「b」「c」「f」「g」「w」「x」「z」(下p.29)、「c」(下p.29)、「j」、「u」、「w」(下p.29)、頭音(a、b、g、dなど)(下p.30)、「g」が、「c」に、「g」を(下p.31)、「D」「R」「b」「h」を使って、チェロキー語の「a」「e」(下p.34)、「l」と「r」(下p.40 2回)、「p」と「b」、「g」と「k」と(下p.40)、「XがYを発明した」(下p.55)、黄色のHBが(下p.57)、QWERTY(下p.60に3回、下p.61、下p.62、下p.317に8回、下p.318に3回)、ABO型のBとMNS型のS(下p.138)、南方振動(ENSO)(下p.148)、カリフォルニア州ロスアンゼルス校(UCLA)(下p.281)、Dvorak配列(下p.318)

b.縦中横――23箇所

ラテンアルファベットを縦中横で表記している箇所の大部分は言語の音を表しています。

○出現箇所
「sh」や「th」(下p.17)、「ti」(下p.22)、(ta、ti、tu、te、toなどのように)(下p.24)、マヤの「ne」という音節は「しっぽ」を意味する「neh」と同じ…)(下p.24)、英語で「th」(下p.29)、「ts」(下p.29)、「si」「ni」の音節(下p.34)、「se」…「yu」「sa」「na」…「ho」…「li」…「nu」(下p.34)、「ph」、「kh」(下p.40)

(2)ラテンアルファベットが横倒しで使われている――80箇所

横倒しで使う箇所は、原典を表したり、元の言葉の注記、言語表記に関わる使い方が中心です。

○出現箇所
「Cargo(積荷)」(p.18, p.29)、『人間はどこまでチンパンジーか(The Third Chimpanzee)』(p.38)、「持てるもの(Haves)」と「持たざるもの(Have-nots)」(p.133)、オリーブ(Olea europea)(p.197)、「family」が「fa-mi-ly」の…(下p.17)、英語で「four」…ロシア語で「chetwire」…フィンランド語で「neljä」…インドネシア語で「empat」(下p.20)、「-tion」(下p.22に2回)、「shun」(下p.22に2回)、「believe」という…「蜂(bee)の絵」と「葉っぱ(leaf)の絵」…「bee-leaf」(下p.22)、歯(tooth)、話(speech)、話し手(speaker)などを(下p.22)、二(two)、相互(each)、山頂(peak)を付加すれば、△two=tooth、△each=speech、△peak=speaker(下p.22)、’aleph=ox雄牛、beth=house家、gimel=camelラクダ、daleth=doorドア(下p.30)、裁判所の書記が「We order John to deliver the 27 fat sheep that he owes to the government」…「John 27 fat」(下p.40)、「lap」も「rap」も「lab」も「laugh」(下p.40)、とても寒い夜を意味する「five-dog night」(下p.148)、「tatoo(入れ墨)」と「taboo(タブー)」、「boondocks(未開の奥地)」、「amok(怒り狂う)」「batik(バティク、蠟染め)」、「orangutan(オランウータン)」(下pp.193-194)、「羊」を…「avis」…「ovis」…「oveja」…「ovtsa」…「owis」…「oi」…「sheep」…「owe」…「owis」)(下pp.203-204)、「goat」「horse」「wheel」「brother」「eye」など(下p.204)、「gun」…「gun」…「fusil」…「ruzhyo」(下p.204)、「two」「bird」「ear」「head louse(毛ジラミ)」(下p.204)、「pig」「dog」「rice」(下p.204)、「outrigger canoe」「sail」「giant clam」「octopus」「fish trap」「sea turtle」(下p.204)、「science」とは…「scire」…「scientia」(下p.322)、“GUNS, GERMS, AND STEEL : The Fates of Human Societies” (W.W.Norman & Company, 1997)(訳者あとがき)

3.2 アラビア数字

人類史ですので本文では4桁の年数、年月などが頻繁に出てきますがすべて漢数字です。従って、アラビア数字が使われているケースは少なくなっています。

本書は頁番号は、アラビア数字ですが、本文中の頁番号参照は漢数字を使っています。頁番号参照が3桁数字になることが多いためでしょう。箇条書きにも正立で使われています。

(1)アラビア数字が正立で使われている。縦中横を含む。

アラビア数字は、参照先の部・章・節番号の表記、参照先図番号の表記、参照先表番号の表記に多数使われています。1桁では正立、2桁のとき縦中横になります。

・参照先部・章・節の番号は頻繁に出てきますので数えません(数えきれない)。

・参照先図番号――36箇所

○出現箇所
(図1-1を参照)(p.51)、(図2-1)(p.80)、(図4-1を参照)(p.124)、(図5-1を参照)(p.141に2回)、図8-1 (p.199)、(図8-2)(p.204)、(図8-1→二〇七頁)(p.205)、図10-1 (p.263)、図10-2 (p.271)、(図12-1→二一頁)(下p.19)、(図12-1)(下p.19)、図15-1 (下p.132、下p.134)、図16-1(下p.175、下p.178)、(図17-1)(下p.193)、(図17-2)(下p.199)、(図18-1)(下p.247)、図19-1(下p.260、下p.261、下p.265、下p.266、下p.289)、図19-2(下p.265に3回、下p.266に2回、下p.268に2回、下p.269)、図19-3(下p.273、下p.276に2回)、図19-4(下p.285)、図10-1(下p.294)

・参照先表番号――23箇所

○出現箇所
(表5-1を参照)(p.142)、表7-1は(p.183、p184)、表8-1(p.205、下p.303)(表9-1参照)、(表9-1中の…)(p.236)、表9-2(p.240、p.241、下p.303)、表9-3(p.246)、表13-1(下p.82、下p.83)、表14-1→九一頁(下p.89)、表18-1(下p.232、下p.233、下p.234に4回、下p.235に2回)、表18-2(下p.243)、

・箇条書き――17箇所

○出現箇所
(1)(2)(3)(4)(5)(下p.63)、(1)(2)(3)(4)(下p.63と下p.64、下pp.102-103)

・その他――36箇所

○出現箇所
炭素14 (p.49に4回、p.67に2回、p.68に2回、p.136に9回、p.137に1回、p.138に6回、下p.235)、炭素12 (p.136に4回、p.138に2回)、窒素14 (p.136に1回)、3000BC、3000bc(一文字ずつ正立、p.138)、「4」という記号(下p.20)、数字の4(下p.34)

(2)アラビア数字が横倒しで使われている――4箇所

アラビア数字が横倒しで使われている箇所は4箇所しかありません。

○出現箇所
裁判所の書記が「We order John to deliver the 27 fat sheep that he owes to the government」…「John 27 fat」(下p.40)、(20×19÷2で)一九〇通り(下p.115)、(W.W.Norman & Company, 1997)(訳者あとがき)

CAS-UB多言語化へ向けて 一般フォント設定機能を追加しました

CAS-UBは2012年6月14日のメンテナンスで、PDF生成に、一般フォント(generic font)の設定機能を追加しました。フォント名を指定するとき、従来は、「IPAex明朝」というような具体的なフォントファミリーの指定しかできませんでしたが、本日から、「serif」というような一般フォントでの指定もできるようになりました。これにより多言語混植でより柔軟なフォントの指定ができるようになります。

一般フォントを指定したときに、どの具体的フォントファミリーが適用されるかは、スクリプト(文字の種類)別に予め組み合わせを定めておくことができます。

具体的に使い方を説明します。

1.一般フォントに対するスクリプト別フォントファミリーの指定方法

(1)「生成」メニューのPDFの項の「フォント設定」のメニューを使います。フォント設定は6月14日の新規メニューです。

(2) 一般フォントの設定

「フォント設定」をクリックしますと、下の画面が現れます。serif(明朝)、sans-serif(ゴシック)、monospace(固定幅)の3種類の一般フォントに対して、スクリプト別に適用するフォントファミリーを設定します。

スクリプトとは文字の種類ですが、現在は日本文字、ハングル、キリル、ギリシャ、それ以外(基本ラテンと同じとします)の5種類になっています。

☆中国繁体字、中国簡体字は現時点では使用できません。

2.フォントの設定

「PDF生成」の「レイアウト設定」-「レイアウト設定詳細」で本文、見出し、表題などの項目別にフォント名を指定するメニューを使って、各項目に使用するフォントを選択します。

たとえば、「本文段落のフォント名」は次のようになっています。従来は、具体的なフォントファミリー名だけでしたが、これからは、一般フォントの指定ができます。

3.使用例

和欧混植のページを従来の指定と、新しい指定でPDF化して比較してみました(次の図)。
図上半分は、「本文段落のフォント名」に「IPAex明朝」を指定したものです(従来と同じ)。
図下半分は、同「serif」を指定したものです。serifには、基本ラテンに「LiberationSerif」、日本語に「IPAex明朝」を設定した状態です。

serifを指定した場合、日本語文字にはIPAex明朝が適用され、英数字にはLiberationSerifが適用されます。LiberationSerifは、Times Romanと同じメトリックス情報をもつように設計されたフォントなのですが、IPAex明朝と比較してフォントサイズが同じでも文字が小さくなっているため上半分と比較して欧文部分の字詰数が増えています。

昭和前半の縦組み新書版における英数字

縦組みの出版物で英数字がどのように表記されているかについての調査を行なっています。表記方法は、年代、および、ジャンルによって異なると予想しますが、すべてを網羅的にかつ統計的に調査するのはなかなか大変なので、今のところ、かなり行き当たりばったりですが。

今日は、昭和の早期に発行された「国語の変遷」を調べてみます。本書は本文縦組みですが、表紙が横組みです。

かなと漢字は右から左に書いていますが、アラビア数字(71)は左から右です。(17ではなく71であることは、本文のノンブルから分かります。)

さて、英数字ですが次のようになります。

1.ラテンアルファベット

本書でのラテンアルファベットの利用例を図で示します。

図1(p.121)

図2(p.44)

図3(p.161)

このように本書ではラテンアルファベットを次の二通りで用いています。

(1) 音を表す記号としての用途 図1、図2
(2) 英語の単語と記号の用途 図3

音を表す記号として用いるとき、a. 母音は1文字ずつ正立、b. 子音+母音は縦中横、c. 子音が入った「ことば」としての発音(上の図には相当するものがありません)あるいは子音を’,’で区切って並べるとき(図1)文字列を全体として横倒しにしています。

図3を見ますと英語の単語と記号については字数に関わらず、1文字であっても横倒しです。一文字でも横倒しの理由はなんなのでしょうか?

頭字語(YMCA、IWW)は1文字づつ正立です。文脈的には、頭字語も英語とされていますので、正立の基準は英語か日本語かではなくて頭字語か否かになっているように思います。

2.アラビア数字

本書ではアラビア数字は各頁下中央のノンブルのみです。

目次の頁番号、章番号(第一、第二、…)、節番号(一、二、…)、箇条書きの項目番号、年月などの数字はすべて漢数字となっています。

○書籍の情報
書名:「国語の変遷」
著者:金田一京助
出版元:日本放送出版協会
発行:昭和16年12月30日

昭和前半の縦組み文学書における英数字

手元にある昭和の前半に発行された2冊の文学書を対象にして英数字の使われ方を調べてみました。

○最初は日本の作家の書いた小説の例です。

書籍:「成吉思汗」(尾崎士郎著、新潮社、昭和15年7月発行)

本文314頁、解説18頁

1.ラテンアルファベット

本書には全体を通じてラテンアルファベットはまったく使われていません。

2.アラビア数字

本書の中に現れるアラビア数字は、本文の節番号とノンブル(イタリック体で頁下中央に横書き)のみです。

なお、章番号は漢数字、目次の頁番号も漢数字となっています。
従ってアラビア数字は非常に少ないのですが、すべて正立しています。

○次は、原文はフランス語から翻訳した文学書です。

書籍:「サン・ペテルスブルグの夜話」(ド・メーストル著、岳野 慶作訳、中央出版社、昭和23年5月発行)

本文と解題205頁

1.ラテンアルファベット

匿名人物を指すために枢密顧問官なるT、騎士B、などの形式で本文中にときどき(全体を通じて10箇所程度)使われています。すべて1文字で正立です。本文の文字サイズと同じ高さをもちます。

人物名をカタカナ表記した後に注として原文が入っていることがあります。この場合、ラテンアルファベットの部分が横倒しです。これらの括弧内の文字は、本文より小さな文字サイズのプロポーショナルフォントで組まれています。

例)
ド・メーストル(De Maistre)、クリスティンヌ・ド・モッツ(Christine de Motz)など

他に書籍の題、難しい単語の原文が()内にとして付されていることがあります。この場合、ラテン文字の部分が横倒しです。

例)
「サン・ペテルスブルグの夜話」(Soirées de Saint-Petersbourg)、テ・デウム(Te Deum)(注、カトリック教会が感謝祭において歌う賛美歌。「Te Deum Laudamus・神よ、われら、おんみを...)

つまり、本文の補足的情報として括弧に括られた形式で単語がラテンアルファベットで表記されていることがあり、これらが横倒しになっています。

2.アラビア数字

本書にはアラビア数字はまったく使われていません。
頁番号(目次、見開き左右のノンブル)、章に相当する番号、年月日、数量などすべての数値が漢字表記です。

このように昭和の前半の文学書では英数字はあまり使われていません。しかし、少数みられる英数字の箇所は1文字のとき正立、翻訳書では注として原文の表記に使われていて、その場合横倒しとなっていることが分かります。