メルマガEPUB変換の4つのテンプレート(サンプル兼解説)とEPUB変換結果

7月24日にCAS-UBに追加予定のメルマガEPUB変換のα版機能について紹介しました。

メルマガEPUB変換機能(アルファ版)の利用方法

続きとして現在用意している4種類のメルマガ種別(メルマガK、メルマガH、メルマガT、メルマガU)テンプレートのサンプルと解説を用意しました。また、実際に変換してEPUBを作成しました。

メルマガEPUB変換では、テキストで書かれたメルマガを、ヘッダー(タイトル)、前書き、目次、記事、フッター(奥付け)に分割して、記事毎に大見出しをつけ、さらに必要に応じて小見出しをつけます。また、目次から大見出しへのリンクを張る事で読みたい記事にジャンプできるようにします。

こうしたコンテンツの自動マークアップ処理を正しく行なうには、オリジナルのテキストを一定の規則に従って書いていただく必要があります。この書き方の雛形がテンプレートのサンプル兼解説となります。

メルマガの書き方は、作者によって異なり、数限りないパターンがあります。そこで、CAS-UBのメルマガEPUB変換ではまず代表的なメルマガを4種類選んで雛形を作成してみました。

これ以外の雛形については、作者の要望に応じて追加していく予定です。実際に変換してみたいメルマガをお持ちの方は、営業担当窓口(cas-info@antenna.co.jp)までご相談ください。

■メルマガ種別のテンプレート・サンプル兼解説

メルマガ種別 テンプレート EPUB見本 備考
メルマガK テンプレート EPUB見本 小寺信良の「金曜ランチボックス」(「夜間飛行」より配信)を参考に雛形化
メルマガH テンプレート EPUB見本 『堀江貴文のブログでは言えない話』を参考に雛形化
メルマガT テンプレート EPUB見本 津田大介の「メディアの現場」を参考に雛形化
メルマガU テンプレート EPUB見本 内田樹メールマガジン 大人の条件(「夜間飛行」より配信)を参考に雛形化

■ご案内

CASオンラインショップでCAS-UBのユーザー登録することで、誰でも30日間だけ無償でご利用いただくことができます。
CAS-UB評価ライセンス

縦組み時の文字方向について:UTR#50のSVOデフォルト、MVOデフォルト、現代方式、伝統方式、新聞方式の相違を分析する

AH Formatter V6.0 の縦組み時の文字方法設定にSVOモードを使えるように実装しています。開発者の話では、大分出来上がっているようですので、さっそくこれを使って縦組み時の文字方向の設定について比較検討してみたいと思います。

既に、このブログでは何回も取り上げているとおり、UTR#50(ドラフト)では縦組み時のデフォルト文字方向について、SVO方式とMVO方式が提案されています。

SVO方式、MVO方式ともに、コンテンツ(テキスト)に特別なマークアップを指定しないときのデフォルト文字方向です。実際には、日本語文書の中に欧文の単語などが混じるときは和文混植という組版を行なうことになります。つまり、商業的印刷物を作るときは、SVO・MVOをデフォルトのまま用いるのではなくて、日本語部分と欧文部分について何らかの指定をして使うことになります。

日本語の縦組み文章に英数字が混じるとき、その和欧混植の方法として、現代組版、新聞方式、伝統組版の3通りがあります。

下に例を示しました。ご覧いただくとお分かりの通り、デフォルト状態ではSVOにするかMVOにするかで違いが出ます。新聞組版はSVOに対して縦中横を追加する方式です。

現代組版方式で和欧混植指定をした結果(PDF)はSVOでもMVOとは同等になります。つまり、SVO方式でもMVO方式でも最後の見かけはまったく同じになります。

但し、指定方法(マークアップとCSSの作り方)は、どちらをデフォルトにするかで変わってきます。XHTMLをご覧いただくと分かると思いますが、デフォルトをSVOにするほうが、マークアップはコンテキストに沿うようになります。具体的には、英語単語の箇所に lang=”en” というマークアップをし、スタイルシートでlang=”en”の範囲を横倒しするという指定になります。組版処理を行なう際は、和文と欧文では空きのとり方、改行位置の決定方法が異なりますが、マークアップを手がかりにして処理の切り替えができます。

一方、MVOをデフォルトにすると文字を正立させる目的のマークアップが随所に必要となります。文字の向きを変えることを目的とするマークアップは意味的なものではなく、見かけを整えるためのものです。このマークアップでは、和文組版と欧文組版の処理切り替えの役には立ちません。

伝統的な組版をするには、アラビア数字を漢字に変換するなど別処置が必要となります。

※SVOをデフォルトにするか、MVOをデフォルトにするかの議論に伝統組版を持ち出すのは筋違いですが、参考のため示したものです。

次に順番に紹介します。

1.原稿

原稿は横書きで簡単な文章を含むXHTMLとします。英数字はUnicodeのベーシック・ラテン文字を使っています。


原稿PDF
原稿HTML

2.SVO方式デフォルト

原稿を縦組みとします。そのとき文字の方向をSVOデフォルト設定としたところです。英数字は正立します。記号類の扱いはさらに検討が必要です。


SVOデフォルトPDF
SVOデフォルトHTML
[*1]

3.MVO方式デフォルト

原稿を縦組みとします。そのとき文字の方向をMVO方式のデフォルト設定としたところです。


MVOデフォルトPDF
MVOデフォルトHTML

4.SVO方式を元にマークアップして和文混植を指定する現代組版

原稿を縦組みとします。そのとき文字の方向をSVO方式のデフォルト設定を指定しておき、それに加えて欧文の部分を横倒しする指定と縦中横指定をしたところです。


SVOベースにマークアップで和文混植を指定PDF
SVOベースにマークアップで和文混植を指定HTML

5.MVO方式を元にマークアップして和文混植を指定する現代組版

原稿を縦組みとします。そのとき文字の方向をMVO方式のデフォルト設定を指定しておき、それに加えて和字として扱いたい(正立させたい)英数字を正立指定と縦中横指定をしたところです。


MVOベースにマークアップで和文混植を指定PDF
MVOベースにマークアップで和文混植を指定HTML

4と5は表示上は同じです。しかし、マークアップが異なります。

6.新聞方式

次に新聞方式の設定をします。新聞方式は、SVOデフォルト設定に対してさらにアラビア数字の2桁の箇所のみ縦中横設定をした状態です。SVOでは英数字を正立させてしまうので2桁であっても縦中横にはならないのですが、新聞方式は縦中横を頻繁に使います。


新聞方式PDF
新聞方式HTML

7.伝統方式

最後に比較のため、伝統方式で設定します。伝統方式はマークアップだけではなくて、アラビア数字を漢数字に変換しています。(おまけに、1文字のラテンアルファベットを全角幅にしました。)


伝統方式PDF
伝統方式HTML

■注意
「日本語組版の要求条件」[*1]では正立する英数字は全角形を使うことになっています。これを前提にすると、上のSVOあるいはMVOを元にマークアップして和文混植を指定する現代組版の例では、正立させる文字については全角系のグリフイメージを表示するべきです。このあたりの処理は開発の課題です。現状、上の例ではプロポーショナルなグリフイメージを使っています。

[*1] UTF#50のドラフトSVO仕様:http://unicode.org/reports/tr50/tr50-5.Orientation.htmlでは、
U+003A(コロン)はSVO=Uになっている。しかし、JIS X4051ではコロンの縦書き字形は横倒しである。

■ご案内
CASオンラインショップでCAS-UBのユーザー登録することで、誰でも30日間だけ無償でご利用いただくことができます。
CAS-UB評価ライセンス

第2回 AH Formatter事例紹介セミナー 27日 開催が迫りました

第2回 AH Formatter事例紹介セミナー 7月27日(金曜日)午後開催です。

■開催場所: 堀留町区民会館 東京都中央区日本橋堀留町1-1-1   
  交通 (東京メトロ日比谷線、都営浅草線「人形町駅」A5番出口 徒歩5分
東京メトロ日比谷線「小伝馬町駅」 3番出口 徒歩5分)

■日時 2012年7月27日(金)13時30分~16時40分

■アジェンダ

13:30  開始
13:35~13:50 AHFormatter概要とW3C日本語書籍の組版
13:50~14:20 DITAによるマニュアル作成の実体
       ~シングルソース・マルチターゲットへの取り組み~
       (ニューメリカルテクノロジーズ)
14:20~14:50 XMLによるデジタルビデオカメラ取扱説明書の制作事例
       ~多言語制作の効率化(iTrexシステム)~
       (三和印刷工業)
14:50~15:20 オンライン入稿・自動組版でのAH Formatterの活用事例
       (ニューキャスト)
15:20~15:30 休憩
15:30~16:00 JATS(学術出版物)スタイルシートの説明
16:00~16:20 電子出版への応用
16:20~16:40 質疑応答
16:40  終了

■お申し込み
申し込みフォーム
(事務局:エクスイズムのWebページにジャンプします)

■概要
「第2回AH Formatter事例紹介セミナー」のご案内

■お知らせ(CAS-UB試用ライセンス)
CASオンラインショップでCAS-UBのユーザー登録することで、誰でも30日間だけ無償でご利用いただくことができます。
CAS-UB評価ライセンス

メルマガEPUB変換機能(アルファ版)の利用方法

CAS-UBでは、8月上旬より、メルマガをEPUBに変換する機能を追加する予定です。

現在、CAS-UBユーザーの方は、クラウド上でアルファ版機能をお試しいただくことができます。ここで使い方について簡単に説明します。

なお、正式サービス開始時にはメニュー(利用方法)が変更になることがありますのでご了承ください。

自分で作成したメルマガであれば、この機能を使って制作したEPUB3は自由にお使いいただくことができます。(自分以外の作者のメルマガを変換した場合は、私的利用を超える利用は著作権者の許諾が必要です。)

1.メルマガEPUB変換機能の選択

CAS-UBにログインすると、ユーザー毎のホーム画面を表示します。メルマガ変換機能を使うにはホーム画面上でメルマガEPUB変換のボタンをクリックします。

2.メルマガ変換機能のメニュー

次の画面がメルマガ変換機能のメニューです。この画面で「*」がついている項目を入力します。

メルマガ種別は、現在、次の4つあります。メルマガは作者によって書き方ルールが異なるため、作者毎のルールを選択してください。

・メルマガK 
・メルマガH
・メルマガT
・メルマガU

ちなみに、この4つの種別は次の4つの有料メルマガの書き方に対応します。但し、作者が書き方を変えてしまうと、うまく変換できなくなりますので、ご注意ください。現在のところ、次の4種類のメルマガ以外を正しく変換することはできません。

・メルマガK :小寺信良の「金曜ランチボックス」(「夜間飛行」より配信)
・メルマガH :『堀江貴文のブログでは言えない話』
・メルマガT :津田大介の「メディアの現場」
・メルマガU :内田樹メールマガジン 大人の条件(「夜間飛行」より配信)

「マグマグ」より配信されているメルマガは、ファイルが分割されていますが、分割されたファイルはヘッダーとフッターを削除して、ひとつのファイルにまとめてからお試しください。

入力すべき項目をすべて入力してから、一番下の「メルマガをEPUBに変換」のボタンを押すと、変換が始まります。

変換には30秒~1分程度の時間がかかります。

3.EPUB3ダウンロード

変換が完了すると次の画面になります。ブラウザのダウンロード機能を使ってEPUBをダウンロードすることができます。

4.メルマガ変換ルール

CAS-UBのメルマガEPUB変換では、上の2項の説明にもありますように、メルマガの種別毎に変換ルールを用意しなければなりません。サービス利用してみたいというメルマガ作者の方は、メルマガ変換ルール作成についてご相談ください。

○(7/30追記)「メルマガEPUB変換の4つのテンプレート(サンプル兼解説)とEPUB変換結果」にメルマガ種別のサンプルを用意しました。

■参考資料
7月11日のセミナーでのプレゼン資料PDF

■CASオンラインショップでCAS-UBのユーザー登録することで、誰でも30日間だけ無償でご利用いただくことができます。
CAS-UB評価ライセンス

「日本語組版処理の要件」に見る英数字の扱い

日本語組版で文字・記号を行に配置するときの、文字間の空き量、文字間での改行の可否、行の調整のために文字間を空けたり・詰めたりの調整などの振る舞いは文字毎に異なります。その振る舞いが同じ文字や記号ごとにグループ分けし、これを文字クラスとすることにより、組版ソフトなどが文字クラス毎に振る舞いを管理できます。

「日本語組版処理の要件」(W3C技術ノート[*1]、以下、JLreq)では付属書Aに文字クラス、および各クラスに属する文字の一覧が出ています。これを、英数字ならびに(参考のため)ギリシャ文字、キリル文字といった文字の種類毎に、どの文字クラスに属するかという観点から再整理すると次の表のようになります。

Unicode cl-19 漢字等 cl-24 連数字中の文字 cl-25 単位記号中の文字 cl-27 欧文用文字
ラテンアルファベット大文字 U+0041~U+005A
ラテンアルファベット小文字 U+0061~U+007A
アラビア数字 U+0030~U+0039 U+0031~U+0034
ギリシャ大文字 U+0391~U+03A9 U+03A9
ギリシャ小文字 U+03B1~U+03C9 U+03BC
キリル大文字 U+0401
キリル大文字 U+0410~U+042F
キリル小文字 U+0430~U+0451

簡単に各文字クラスの特徴をまとめます。
・漢字類は全角形で、縦組み中では正立、任意の文字と文字の間で改行することができます。
・欧文用文字はプロポーショナル形で、縦組み中では横倒し、単語間でのみ改行できます。
・連数字の中では改行はできません。

JLReqではBasicラテンのアルファベットは、漢字類、欧文用文字の両方に属し、さらに単位記号中の文字にも属します。つまり、ラテンアルファベット文字は全角形をとり、任意の文字間で改行するという漢字のような振る舞いをする一方で、プロポーショナルな字形となり、単語間でのみ改行できるという振る舞いにもなります。

Basicラテンのアラビア数字は、漢字類、欧文用文字に加えて、連数字にも属します。

JLreqの本文では、Basicラテンのアルファベットやアラビア数字が、どういう条件で漢字として振る舞い、あるいは欧文文字、連数字中の文字、単位記号中の文字として振る舞うかは明確に記述されていません。

全体としてはコンテキストによって振る舞いを変えることができるものと想定されているようですが、例えばマークアップによって切り替えるということになるのでしょう。

先日紹介した「UAX#11 East Asian Width」[*2](以下、EAW)では文字に狭い(Narrow)、広い(Wide)、曖昧(Ambiguous)という特性を分けていました。Narrowは欧文用文字の振る舞いをし、Wide文字は漢字類の振る舞いをすることになっていますので、それぞれJLreqのcl-19とcl-27に相当します。

しかし、EAW#11では、Basicラテンの文字はNarrow特性をもち、Wide特性をもたないものとしています。

このように見ますとEAWとJLReqでは、Basicラテンの文字について、対照的な考え方を採用していると言えます。

[*1]日本語組版処理の要件(日本語版)
[*2]UAX#11 East Asian Width の紹介

■CASオンラインショップでCAS-UBのユーザー登録することで、誰でも30日間だけ無償でご利用いただくことができます。
CAS-UB評価ライセンス

UAX#11 East Asian Width の紹介

Unicode仕様の付録にEast Asian Width(EAW)という文書があります[*1]。これは東アジアのレガシーな文字集合(日本では主にシフトJIS)との相互運用のためのUnicode文字の参考特性についての仕様です。

1. EAWの目的

EAWは次のような実装のための参考情報です。

・東アジアのレガシーが符号化文字とUnicodeの相互運用
・東アジアと西欧のタイポグラフィーと行レイアウトの両方のサポート
・東アジアの文字を含む、マークアップされていない文字にフォントを関係つけるため

2.概要

EAWの概要を紹介します。

(1) 半角文字と全角文字
東アジアのレガシーな符号化において1/2Em幅の文字を半角(Halfwidth)といい、Em幅の文字を全角(Fullwidth)という。レガシーな符号化では半角は1バイトであり、全角は2バイトである。Unicodeではもうそのような区別はない。

(2) Unicode文字のデフォルト特性値
Unicodeの文字データベースでは、各Unicode文字にデフォルト幅特性を与えている。これは次の6つの値の一つである:

1) 曖昧
あるときは広く、あるときは狭くなる文字幅特性。曖昧な文字の幅を決定するには、文字コードに含まれていない情報が必要である。この例は、ギリシャ文字やキリル文字であり、東アジアのレガシーな文字集合では広くなり、非東アジアではない用途では狭くなる。

Unicodeから東アジアのレガシーな文字集合に対応つけるときは、全角文字にマップする。非東アジア以外の文字集合に対応つけるときは通常の(狭い)文字にマップする。

2) 全角
UnicodeでFullwidthと定義されている文字すべて。
U+FF01(U+0021(!)の全角文字)~U+FF5E(U+007E(チルダ)の全角文字)
U+FF60(全角幅左白括弧)、FF61(全角幅右白括弧)、FFE0~FFE6(全角記号の異形文字、全角通貨記号など)

3) 半角
Unicodeで明示的にHalfwidthと定義されている文字。
U+FF61~FF64(半角句点、半角鍵括弧、半角読点)
U+FF65(半角中点)
U+FF66~FF9F(半角カタカナ)

Unicodeから東アジアのレガシーな文字集合に対応つけるときは、半角文字にマップする。非東アジア以外の文字集合にはマップできない。

4) 広い(Wide)
漢字、ひらがななど。

Unicodeから東アジアのレガシーな文字集合に対応つけるときは、全角文字にマップする。非東アジア以外の文字集合にはマップできない。

5) 狭い(Narrow)
常に狭い文字である。狭い文字には対応する明示的な全角または広い文字がある。ASCII文字は、Unicodeに全角文字が定義されていることから狭い文字の例である。

Unicodeから東アジアのレガシーな文字集合に対応つけるときは、半角文字にマップする。非東アジア以外の文字集合では通常の(狭い)文字にマップする。

この定義による限り、ASCIIの「A」のような文字を全角形で表示することはできないことになる。

6) 中立(非東アジア)
他の文字である。東アジア文字集合の中には含まれない。

任意の処理において、コンテキストに応じて、文字の幅は最終的に広いか狭いのどちらかに決定する。

3.問題点
EAWは、(1)レガシーな文字符号化とUnicodeの文字コードの相互変換を行なうためのものであるとともに、(2)東アジアと西欧のタイポグラフィーと行レイアウトの両方のサポートとされている。

文字コードの変換については、EAWのような対応関係をつけるのはやむを得ないだろう。

しかし、行レイアウトは、新しいレンダリング方式はフォントの選択やソースの文字コードの範囲をこえた、文脈情報を使って文字の幅(Wide-Narrow)を決定するようになっているが、この仕様書はそういう変換を追跡していないとされている(仕様書の「現代のレンダリング実践」の項)。

しかし、EAWではASCIIコードに属していた文字コードは、狭い(Narrow)文字であり、Wideにならない。ところが、一方、ラテン補助文字、拡張文字、キリル文字、ギリシャ文字はNarrowにもWideにもなる。

具体例で示すと、たとえば、「A」(ASCIIに属する)という文字はWideにはならないので、「A」をWideにするには、「A」に対応する「A」という全角文字コードに変換しなければならない。ところが、たとえばギリシャ文字、日本語文脈中ではWideであり、ギリシャの標準フォントを指定するとNarrowになる。

つまり、ASCII文字は全角文字が別に定義されているために、幅の操作がとても不便なのだが、ギリシャ文字の幅の操作は簡単という、なんだか首尾一貫しないことになっている。

今後は、レガシーな文字集合(シフトJIS)において1バイト文字か2バイト文字のどちらに属しているかによって取りうる文字の幅に制限を設けるというEAWのような奇妙なやり方は廃止するほうが良いだろう。

〔追記〕
WideとNarrowの違いとして文字の幅という解釈を強調しすぎたようなので反省(次の項を参照)。定義にはあまり明確に書かれていないが、仕様書のOverviewでは、組版においてWideはIdeographのような挙動(1文字毎に改行ができ、縦組みで正立)を示す。一方、Narrowは、単語あるいは一連の文字の固まりを保持し、また、縦組みでは横倒しになる、とされている。このように、WideとNarrowの相違点は、文字の幅だけではなくて組版のときの文字としての挙動の違いという捕らえ方をするとわかりやすい。

また、勧告の項には、Wide/Narrowについて「データの処理と表示に際しての振る舞いについて」という項目があり、次のようになっている:
①Wide文字は表意文字のように振舞う。
②Narrow文字は、例えば改行において西欧の文字のように振舞う。また縦組みでは横倒しになる。
③曖昧な文字は、言語タグ、スクリプト識別、対応フォント、データのソース、マークアップなどのコンテキストに応じてWideまたはNarrowのように振舞う。コンテキストを確立できないときは、デフォルトではNarrow文字として扱われるべきである。

Basic Latinの文字はNarrowの値をとるのみとし、一方、ギリシャ文字やキリル文字は曖昧で、コンテキストによってNarrowになったりWideになったりするというような扱いの相違がある。

EAWでは、文字としての振る舞いの相違点の根拠は、Basic LatinはJIS X0201とJIS X0208の両方にあり、ギリシャ文字やキリル文字はJIS X0201になく、JIS X0208のみにあるということになる。しかし、これはレイアウトと改行処理における、文字の挙動の相違を説明する理由にはなりえないのではないか?

[*1]Unicode Standard Annex #11 East Asian Width

■CASオンラインショップでCAS-UBのユーザー登録することで、誰でも30日間だけ無償でご利用いただくことができます。
CAS-UB評価ライセンス

1950年代岩波文庫における英数字の扱い

一昨日に続き、昭和前半の岩波文庫の英数字表記を調べてみます。題材は、「歴史における個人の役割」(プレハーノフ著、木原正雄訳、昭和33年10月発行)です。

この本はロシアのマルクス主義者であるプレハーノフの哲学書を翻訳したものなので、ロシア語(キリル文字)、英語・フランス語・ドイツ語(ラテンアルファベット、補助記号)が入り乱れています。翻訳文中の人物名、原書名などに原文がラテンアルファベット(ASCII以外の補助記号を含む)やキリル文字の表記が注記されていることが多く、これらはすべて横倒しです。

ラテンアルファベット、キリル文字は大文字は幅が広く、小文字は幅が狭いのですが、総じて半角幅ではありません。ラテンアルファベットはプロポーショナルです。

ラテンアルファベットが正立するのは1文字で記号的に使用している箇所です。さらにその記号を使って数式表記する場合は、数式を横倒しとしています。正立する文字は横倒しの文字よりも少し大きい文字です。

本文中にアラビア数字が出現するのは、原著のページ番号参照(書名と一緒に横倒し)と、解説の中の箇条書きのみです。

1.ラテンアルファベットとキリル文字

(1)横倒し
横倒しの箇所の例を挙げる。キリル文字についてはうまく判読できていないところもある。大抵の箇所は、日本語訳の後ろに()内に原文を示すかたちで書かれている。一種の注である。原文は、英語、ドイツ語、フランス語が入り乱れている。本書では氏名の初出箇所にはキリル文字またはラテン文字の注がついておりそれらは横倒しである。以下、数が多いので例のみあげている項目がある。

ラテン文字を横倒しにしているとき、活字は半角幅ではない。プロポーショナルな幅をもつ。平均的にみてラテンアルファベット一文字の幅は和字の2/3幅程度で半角幅よりも広い。
キリル文字は大文字は幅が広く、小文字の幅は狭い。固定ピッチのように見える。半角幅よりも広い。

a) 訳文の原文例
わたくしがあらゆる動物の中でもっとも不活発なものだ(am not the most torpid and lifeless of all animals)
キリスト経的必然論者(christian necessarians)
とるにたりないもの(quantité négligeable)
歴史生活全体(das Ganze des geschichtlichen Lebens)
いまは亡き夫(feu monsieur mon mari)

b) 氏名例 
プレハーノフ(Г.В.Плеханов)
カブリツ(Каблиц,Осип Иванович)
スペンサー(Spencer, Herbert)
プリーストリー(Priestley, Joseph)
プライス(Price, Richard)
ランソン(Lanson, Gustaue)
カルバン(Calvin, Jean)
クセルクセス(Xerxes 原名 Khshayarsha)

c) 書名、雑誌名、論文の題名など例
『歴史における個人の役割』(К вопросу о роли личности в истории)
G. V. Plekhanov, The Role of the Individual in History, translated from Russian by J. Finebery, Foreign Languages Publishing House, Moscow, 1944
『キリスト教原理』〔Institutio〕[*1]
《Die Freiheit ist dies, Nichts zu wollen als sich》. Werk, B. 12, S. 98. (Philosophie der Religion).
『歴史評論』(《Revue Histrique》)
《Histoire de France》, 4-ème édition, t.XV, p.520-521 (『フランス史』第四版、十五巻、五二〇―五二一ページ)

[*2]

d) 社名

e) 引用段落

f) 引用文

(2)正立
条件Sが存在するばあい、現象Aがかならずおこる
一定時間Tにあらわれるだろう
諸条件の総量Sには、たとえば、aにひとしい…
諸条件の総量はすでにSではなくて、S-aになるだろう (1文字は正立、S-aの部分は横倒し)
もしaがbに等しい(a=b)とすれば (1文字は正立、a=bの部分は横倒し)

Aという才能ある人は一つの問題Xを… (p.70)

2.アラビア数字
(1)横倒し
ラテン文字などで表記した書籍のページ参照にアラビア数字が使われている。

(2)正立
解説中に箇条書き(1)~(3)(括弧を含む3文字で縦中横)が出てくるのみである。

本文中ではほとんど漢数字である。年月日、年齢など頻出するがすべて漢数字。目次のページ番号も漢数字。後注の合印や後注番号も漢数字である。
また、各ページの上に表示されるノンブルはアラビア数字。

3.書誌情報

書名:歴史における個人の役割
著者:プレハーノフ
訳者:木原 正雄
発行時期:昭和33年10月
体裁:文庫本、112頁
発行所:岩波書店

[*1]〔〕は『哲学著作選集』編者注
[*2] 《》の用途が理解できない。(フランス語やドイツ語の書名、論文やチラシなどの題名のようだが、《》で囲まれていない箇所もある)

■CASオンラインショップでCAS-UBのユーザー登録することで、誰でも30日間だけ無償でご利用いただくことができます。
CAS-UB評価ライセンス

戦前の岩波文庫における英数字の扱い

神田の古本屋にいって、戦前の本を探してみました。さすがに戦前の古本は店頭にもあまりありませんが、岩波文庫の「ミレー」(文庫本165頁)を見つけました。印刷・発行は昭和14年10月です。

本文はもちろん縦組みですが、表紙は横組みで書名や著者名などは、文字を右から左へ進めています。

以下、ラテンアルファベットと数字の使い方の紹介です。

ラテンアルファベットが、人名の欧文表記、書名表記、詩の文章などを示すために使われている場合は、横倒しである。これらの箇所は本文テキスト中で文脈上特別な意味付けができるものが多い。

正立の箇所は、人を指す1文字の代名詞、1文字のイニシャルに使っているときだけである。

数字については年の表記は本文ではほとんど漢字になっているが、アラビア数字が書籍の書名とともにその発行年などの表記に使われているときは横倒しになっている。わずかに数箇所書籍と関係なくアラビア数字の年表示がでている。その年表記の漢数字との使い分け基準はあまりはっきりわからない。

1.ラテンアルファベット
ラテンアルファベットは、本文中氏名、単語などで出現する。その箇所を分類すると訳文の原文、氏名、書名、雑誌名、会社名、引用である。これらは横倒しの欧文プロポーショナルフォントで組まれている。

(1)横倒し

a) 訳文の原文
「いまわの際」(in extremis)
「美術新報」(“Gazette Des Beaux Arts”)
「食事」(La Becqée)
「第五講演(Leeture)」
「美は題材とは関係ない」(“La belezza è lontana dalla materia”)
「沈黙は耳を澄ます。」“Silence listens”
「沈黙は満足していた。」“Silence was pleased.”
「些事を斥けよ。」(“Relinqne curiosa”)
「神ハ高慢ナル…」(Deus resistit …) (預言者の言葉)

b) 氏名
Alfred Sensier (1815-1877)
Miss Clementina Black

c) 書名、雑誌名
A. Sensier 「ジャン・フランソワ・ミレーの生涯と作品」(“La Vie et l’Œuvre de J.-F. Millet,” 1881)
“The Popular Library of Art”
“Talks on Art” (1875)
“Atlantic Monthly”
(“Gazette Des Beaux Arts” 1877-85)
参考書目の書名に多数(著者名、書名、発行年月、発行所などの形式)

あとがき中の原典参照部分:
“Millet”, by Romain Rolland, Duckworth & Co.
The Popular Library of Art
Alfred Sensier; La Vie et l’Œuvre de J.-F. Millet. A Quantin, Paris. 1881
Etienne Moreau-Nélation : Millet, raconté par lui-même. 3 vols. Henri Laurens, Paris, 1921
“CUR ARS PICTURAE APUS ITALOS XVI SAECULI DECIDDERIT”, 1895
“La Décadence de la Peinture italienne.”, 1896
“Revue de Paris”
“VIE DES HOMMES ILLUSTRES”

d) 社名
Duckworth & Co.

e) 引用段落
Et jam summa procul villarum culmina fumant
Majoresque cadunt altes de montibus umbrae

“Insere, Daphni, pyros; carpent tux poma nepotes” (ヴィルギリウス)

f) 引用文
“Et si mon …” (イタリック体、聖書の言葉、ルカ傳)

(2) 正立
ラテンアルファベットの正立は氏名のイニシャルまたはL氏のように人を指すために使用している。

W・モリス・ハント
P・J・プルードン
M・ド・シャントルー
M・L・ルトロンヌ
L氏(13箇所)

2.アラビア数字
数字はほとんど漢数字である。年月日などは漢数字表記が原則である。

(1)横倒し
アラビア数字は書籍の発行年、参考書目録の(海外)書籍発行年、人名につづく生年-没年に使われている。このときはラテンルファベットの書籍名ととも横倒し表記になっている。

書籍発行年数以外に本文にはアラビア数字の横倒しが2箇所ある:①「その当時(1853-54) 」、②「美術史教授時代(1902 」である。但し、このような年の表記は多くの箇所では漢数字になっている。アラビア数字にしている基準が明確ではない。

横倒しアラビア数字は半角幅のようだ。

(2)正立
正立のアラビア数字は、本文ノンブル(正立)のみである。目次の章見出しの頁位置示す頁番号は漢数字である。

3.書誌情報
書名:ミレー
著者:ロマン・ロラン著
訳者:蛯原 徳夫
発行時期:昭和14年10月
体裁:文庫本、164頁
発行所:岩波書店

■CASオンラインショップでCAS-UBのユーザー登録をしていただくと、誰でも30日間だけ無償でご利用いただくことができます。
CAS-UB評価ライセンス

有料メルマガライターまたは制作者のためのEPUB作成セミナー 講演メモ

7月11日に秋葉原UDXで開催した「有料メルマガライターまたは制作者のためのEPUB作成セミナー」[*1]を開催しました。
以下、渡辺文重氏の講演に関する簡単なメモです。

1.携帯情報サイトとメルマガ
1)月100円~1000円でテキスト(文字)情報を売るビジネスとしては、携帯公式サイトの例がある。携帯公式サイトの市場規模は文字ものだけでも1000億円程度はあったのではないだろうか?
2)携帯公式サイトとメルマガの共通点は、主な売り物が文字情報であることのほかに、初月無料、1ヶ月無料が標準であることと、解約率が低いことがある。
3)相違点としては次のことがある。
①携帯情報サイトは、ドコモ、AU、ソフトバンクなどのキャリアのプロモーションが非常に有効であった。また、公式サイトであるというお墨付きがあり、暇なときにみるものなのでサイトの使いやすさが重要、イベントなどの際は速報性が重要といった特徴がある。但し、プロモーションに関しては、スマホの時代になってからはパソコンと同じように検索エンジンが重要な役割を占めるようになった。
②これに対しメルマガは、自由競争であり、短い時間に有益な情報を得るため、つまり、時間の短縮のために読むものではないだろうか。キュレーター需要といっても良い。

2.ライター40歳の壁問題と有料メルマガ
有料メルマガは中堅ライターの40歳の壁問題への対応策としても位置づけできるかもしれない。Webサイトの運営経験から判断して、Webページは有名ライターが書いても若手ライターが書いてもページビューは同じなので、中堅ライターには仕事を依頼しづらい。つまり40歳超えのライターは自分で自分の活路を見出す必要があるが、有料メルマガがその一つになるかもしれない。

3.有料メルマガの価格モデルと代表的なもの紹介
1)メルマガの価格は、月額105円~1000円まであり、値段をつけるのは難しい。
月額105円では「黒田勇樹が働かずに生きていくためのメルマガ「黒田運送(便)」」があるが、読者は約200人で月収1万円程度である。
「井沢元彦の書かずにはいられない」は、月額525円だが記事は多くのメルマガの中ではもっとも短い。
「おすぎです!~映画って素晴らしい~」は、フォーマット化が上手。形を作るという点では一番のお奨め。奇抜なコーナーはなくて決められたものをまず出すというやり方である。月額420円帯はお奨め。
月額630円の価格帯は、ほぼ毎日発行の「J3+(メルマ)」、「津田大介の「メディアの現場」」などの化け物メルマガがあって、勝負しにくい価格帯である。


もっとも短い?「井沢元彦の書かずにはいられない」

2)有料メルマガの料金設定は、情報量と値段の設定から。ちょうど清涼飲料水(缶ジュース)くらいの単価を想定するといいのではないか。

渡辺氏の「メルマガ=ドリンク料金説[*2]」はなかなかユニークでした。このほか、渡辺氏の関連Tweetをリンクしておきます。([*3]~[*6])

[*1]有料メルマガライターまたは制作者のためのEPUB作成セミナー
[*2]https://twitter.com/sammy_sammy/status/223230221707509763
[*3]https://twitter.com/sammy_sammy/status/223229973287280641
[*4]https://twitter.com/sammy_sammy/status/223230088894885889
[*5]https://twitter.com/sammy_sammy/status/223230128656883713
[*6]https://twitter.com/sammy_sammy/status/223230181521883136

縦組みにおける半角文字の方向―MS-DOSの一太郎と松

縦組みにおける半角文字の扱いについて、今回は、MS-DOSの一太郎と松を調べてみました。

手近にあるPC-9801が動かないので、エプソンのPC98互換機(PC-486 NOTE AU)を動かして、一太郎dash、松Ver.5をインストールして動かしてみました。一太郎と松はMS-DOSの時代にもっとも人気があったワープロソフトです。一太郎dashはノートパソコン向けに軽量化したタイプ。松Ver.5はシリーズの最後の方の製品です。

両方とも縦組み文書を作るときは、横書きで編集します。そして、印刷するときにプリンタの印刷方向と用紙の方向、および文字の向きを調整して縦組みを実現します。現在は画面上で縦組みのまま編集することができますが、当時のパソコンソフトではそうした編集操作はできませんでした。

また当時のパソコンのプリンタはページを1ページずつ取り扱う方式(ページプリンタ)ではなくて、一行ずつプリントする方式であったことも忘れることができません。

今回、プリンタは既になく、紙に印刷できないので、印刷プレビューの画面で文字がどうなるかを見てみました。

1.一太郎dash

一太郎dashの印刷プレビュー画面は次の写真です。横組では用紙上辺は画面の上辺にあたりますが、縦組みでは用紙上辺が画面の左辺になります。

縦組み文書であっても編集時は横書きで編集しますので、漢字も半角英数も文字が画面に対して正立の状態です。

そして、印刷時に漢字を左に90度回転して、用紙の上辺に対して文字の上辺が対応するようになります。一方、半角英数は回転せずに画面に対して正立のままです。結果的に、漢字に対しては右に90度回転した状態となります。

2.松ver.5

松Ver.5の印刷プレビュー画面は次の写真です。横組みでも縦組みでも画面の上辺が用紙の上辺になります。

縦組み文書であっても、横書きで編集しますので編集時は漢字も半角英数も文字が画面に対して正立の状態です。編集時の行は横方向で文字は左から右に進みます。

そして、印刷プレビューでは漢字は正立、半角英数は右に90度回転して横倒しです。行が縦になり、文字が上から下に進みます。

3.漢字と半角英数で方向が違う理由は?

一太郎も松も縦組み文書を印刷した結果は、用紙の向き(用紙上を上)に対して漢字は正立し、半角英数は右に90度回転します。

漢字が正方形なのに、半角英数は幅が1/2幅なので、漢字に対して90度寝かせるように出力することで、行の長さが横書きのときと同じになるからでしょう。

この方法は、先日のワープロ専用機ではNECの文豪と同じやり方です[*1]。

MS-DOSの時代には、文字を半角と全角のセルに表示する技術が基本になっており、文字の字形を自由自在に変形して表示することは難しかったのです。この文字の表示・印刷の技術上の制約上のために半角英数を横倒しにしたのではないだろうかと思います。

なぜ、このような設計になったかは開発担当者に確認する必要がありますが、おそらくすでにその設計理由を確定するのはできないように思います。弊社に「新松」の開発者が数名是移籍していますが、彼らに聞いても、「もう忘れてしまった。」という回答が帰ってくるのみです。

[*1] 縦組みにおける半角文字の扱い―ワープロ専用機はまったくばらばら