Word2013のWord文書をHTML形式で保存を試してみる。その問題点は?

最近、HTMLをどう作るかを再考しています。HTMLの書き方で一番原始的な方法は、テキストエディタで書くことです。それではあまりに効率が悪いのでもう少し簡単に作る方法が必要なことは明らかです。で、ここ10年近くWordでHTMLを作るという問題をあまり考えていませんでしたが、まずはWordでHTMLを作る方法を調べています。

ということは前回も書きましたが、前回「HTMLを手軽に作る方法を再検討します。手軽といえば、まずWordでHTMLを作ることが思いつきます。」として、Webにでていたサンプルを見ました。

今回はその続きで、自分で作成したWord文書で調べてみました。作成した文書は次のものです:
・オリジナルのWord文書[1](こちらからダウンロード)
・Word文書をPDF化:(PDFをダウンロード)


図 PDFを画像化したもの(先頭ページ)

これをWord2013でHTML保存してみます。


図 Webページ形式で保存

保存したHTML形式:リンクをクリックすると開きます。

保存したHTML形式を表示しますと、Wordの次の指定はそのまま生きています。
・段落枠による囲み
・段落の文字サイズ
・見出し
・段落と段落の空き
・表

このHTMLのソースを見ますと、こんな感じです。

図 Word2013でHTML保存したHTMLファイル

このHTMLはHTMLのタグとCSSでレイアウトを指定しています。見出しレベル1がh1タグになるためh1タグが複数出てきています[2]。表のタグも正しく付いているようです。多くの属性値は引用符で囲まれていません。

HTML+CSSの表現として大きな問題はないと思いますが、このHTMLを使い回すときはとても難しいでしょう。例えば、他のHTMLと一緒にして、二つの見栄えを揃えようとします。もし、二つのHTMLでフォント指定(サイズ、フォントファミリー)異なっていたとします。すると見栄えを揃えるにはフォント指定を統一する必要があります。しかし、フォント指定がHTMLタグツリーの末端にばらばらに指定されているため、統一する編集はかなり面倒なことにあります。HTMLでこのような操作をするよりも元のWord文書に戻ってWord文書で編集したくなると思います。

ということは、ここで作るHTMLはあくまで出来上がった文書を単独でパブリッシュする(最終用途)ために使うものということです。Wordで保存したHTMLを使って、例えば、他のWebサイトに組み込んで全体のレイアウトを統一したり、EPUBを作ったりするなどの流用は難しいのではないでしょうか。

[1] 3月22日のニュースリリースの原稿です。ニュースリリースはこちら
[2] SEOの本を見ますと、h1タグはHTMLの最上位に1回使うというのが基本的とされているようです。確かに、大見出しは1ページ(1HTMLファイル)あたり1つが望ましいと思います。しかし、HTMLの仕様ではh1タグをHTMLの最上位要素として1回だけしか使うという制限はありません。HTML5では文書をsectionで分けて、各sectionタグの子供としてh1タグを使います。そしてh1~h6の新しいランクタグは新しいセクションを暗黙に作るという考えのもとで、sectionタグはそれを明示的にするという考えのようです。すると、h1⇒p1⇒h1⇒p1の順序でタグが出てきたときは、h1⇒p1⇒section(h1⇒p1)と考えることになるのでしょうか。

■連載
(1) ワンソースマルチユースの課題:HTMLソースのオーサリング問題を改めて考えてみようと。
(2) HTMLを手軽に作る方法を再検討します。手軽といえば、まずWordでHTMLを作ることが思いつきます。
(3) Word2013のWord文書をHTML形式で保存を試してみる。その問題点は?(今回)
(4) HTMLを簡単に作る方法:h1要素の話(1)(次回)

HTMLを手軽に作る方法を再検討します。手軽といえば、まずWordでHTMLを作ることが思いつきます。

このところ、CAS記法[1]の便利さになれてHTMLを作る他のオプションを忘れかけていました。

しかし、まだ巷ではHTMLを簡単に作る方法で苦労しているようです。そういう方には、CAS記法を使ったら如何ですか? と言いたいところです。しかし、いきなり結論を出しても、ということで、まずは久しぶりに現状を調べてみましょう。最近は、どんなのがあるんだろうねぇ。

こういうときはググるというわけで、「Office HTML 変換」で検索! 最近のGoogle検索はパーソナライズされていますので、すべての人が同じ結果になるかどうかは分かりませんが、私の画面でトップに来たのはこちらです。

「ワード文書を Web ページに変換する」
Last Update:12/22/2016 21:58:35

となっていますので新しいですね。どれどれ。

どうやらマンション管理組合関係のWord文書をHTMLに変換する話のようです。Word2007/2010の「名前を付けて保存」でHTML形式に保存しているようです。ああ、これはもう10年以上前に試した記憶があるなあ、と思って読んでみました。

この「ワード文書を Web ページに変換する」というWebページを作成された方は、Wordで紙に印刷するようにレイアウトした紙のページをWebページでも再現しようと考えておられるようです。そして、変換前のWordのレイアウトをWeb化したときのレイアウトを比較して「レイアウトが崩れること、その原因」についてのまとめがあります。

これはまさにWordで文書を作成している人の典型のパターンです。

まず、Wordの文書は紙に印刷することを想定しています。そして一定のサイズをもつ紙の印刷面にうまく適合するように、そして分かりやすいように画像や文字の大きさを決めてレイアウトするわけです。

しかし、Webページはコンピュータの画面で表示するものです。で画面はWebページを読むコンピュータの種類、最近ではスマホで見る方が多いと思います。スマホの画面でみるかタブレットの画面で見るかなど、使う人の時間やあるいは通勤途上、会社、自宅などの場所によって千差万別になります

ですので、そもそもWebを作るときには印刷レイアウトをそのままWebで再現したい、という発想はあまり良くないんですね。

ではどうしたら良いでしょうか?

まずは、Webページ=様々な画面で見たときに問題がない、というようなWord文書の作り方をする必要があります。このWebページで紹介しているようなチラシ的なレイアウトをした文書はWebに持って行くのはあまり適切ではないでしょう。

WordでHTMLを作るといったときは、まずWord文書の作り方を次のように変える必要があると思います。

・見出しと本文を明確に使い分ける。
・そして見出しの階層は文字の大きさではなくスタイルで表す。
・本文は段落を意識して書く。
・段落の種類(例えば、引用、箇条書きなど)はレイアウトで区別するのではなく、スタイルで区別する。

こうなると、結局、Wordで簡単にHTMLを作る=まずガイドラインの作成から? そのガイドラインはいままでのWord文書の作り方の発想転換を迫るものになって、結局は受け入れられるまでに時間がかかる? やれやれ。

[1] CAS記法リファレンス
[2] 前回:ワンソースマルチユースの課題:HTMLソースのオーサリング問題を改めて考えてみようと。

■シリーズ
(1) ワンソースマルチユースの課題:HTMLソースのオーサリング問題を改めて考えてみようと。
(2) HTMLを手軽に作る方法を再検討します。手軽といえば、まずWordでHTMLを作ることが思いつきます。
(3) Word2013のWord文書をHTML形式で保存を試してみる。その問題点は?
(4) HTMLを簡単に作る方法:h1要素の話(1)

ワンソースマルチユースの課題:HTMLソースのオーサリング問題を改めて考えてみようと。

2017年になってから久しぶりにWebページを自分で編集・更新をし始めています。XHTML形式のWebページをoXygenというXMLエディタ[1]で編集しているのですが、このところ毎日Webページ制作の生産性の低さに辟易しています。

少し遡っての個人的な経験ですが、私は2000年頃からドキュメントの多くをXML(XHTML)で作成するようになり、Webページなども簡単なHTMLタグの組み合わせで作成していました。それらのWebページはXHTMLタグでマークアップして簡単なCSSでレイアウトを施したものです。今から見ますと原始的なものですが、この頃のマークアップ編集はAntenna House XMLエディタという自社開発のXMLエディタを使っていました。この間、Antenna House XMLエディタは、開発があまり進まず、時代の流れに遅れてしまい、結局、販売も断念してしまいました。

その間、HTMLのタグを直接編集するのはどうも生産性が低いのでなんとかうまい解決策がないものかと考えていました。そうした経験からWiki記法のような簡易マークアップを使ってHTMLを書くことで、HTML制作の生産性を高めることができるだろう、と考えました。それが、2010年にCAS-UBの開発を開始した一つの理由です。CAS-UBはWiki記法を拡張したCAS記法をつかってHTML文書を記述します[2]。これは檜山正幸さんという天才的なアーキテクトに設計していただいたものです。自分で言うのもなんですが、いつも良く出来ていると感じます。CAS記法をなかなか普及させられないのは、偏に私のマーケティング力が足りないからだと反省します。

もう一つの理由は、出版の世界は一品生産のため、DITAマニュアルの制作システムのように大きな投資が必要なシステムを作るのは難しいので、PDFとEPUBを作る仕組をWebサービスとして提供するのが向いているのではないかと考えたことです。CAS-UBは出版物を作る仕組としてうまく機能するようになっています。まだまだ改善が必要ですが。

そうしたことで、2011年頃から、業務上の文書はOffice、簡単なWebページはブログ、出版物にするときはCAS-UB、といった使い分をしていました。そんなことで、個人的には問題も感じなくなり、もうワンソースマルチユースには課題はないだろうなどと考え始めていたのです。そして、ワンソースマルチユースの大きな課題であるソースドキュメント編集の問題について、やや忘れかけていました。

で、久しぶりにWebページ(HTML)をXMLエディタ(oXygen)で編集し始めて、HTML直接編集の生産性がさらに低下しているのに辟易しています。ずっと、HTMLの生産性が低い理由は、コンテンツ(原稿)とタグ(マークアップ)の二つを同時に考えるためと思っていました。しかし、今回、久しぶりにWebページを編集してみて、レイアウトのための余計なクラス属性や余計な階層構造が、さらに生産性を下げる原因になっている、と痛感しています。

ちなみに、今『CSS設計の教科書』(谷 拓樹著、インプレス発行、2016年2月第1版第4刷)を読んでいます。この本を見ますとCSSのセレクタには要素ではなく、クラス属性を指定する方を推奨しています。要素のセマンティクスにはあまり依存しないで、div要素に多数のクラスを設定し、CSSではクラスのセレクタを使って部品化し組み合わせる方法などがあります(pp.45-52 OOCSS)。こうなってきますと、今度はコンテンツの編集の際に、レイアウトのためのクラスの設定を適切に行わなければならなくなります。結局、HTMLの編集において、テキストや画像コンテンツ、セマンティクスとしてのHTMLタグ、さらにCSSレイアウトのためのクラス属性の設定、という三つを同時に考慮しなければなりません。これはちょっと? です。

見栄えの良いWebページを作るために、CSSが複雑になりメンテナンスしにくいのでクラス属性を組み合わせ、今度は内容を書くのが大変になる! って本末転倒しているように感じます。どうしたら良いんでしょうかね。

また、最近、2回ほど学術情報XML推進協議会のセミナーに参加して、皆さんの意見も伺い、久しぶりにコンテンツ制作の問題がまだ課題なんだな、と痛感している次第です。ということで、HTMLのオーサリングについて、改めて整理し直そうと考えているところです。

[1] oXygen
[2] CAS記法リファレンス
[3] 次回 HTMLを手軽に作る方法を再検討します。手軽といえば、まずWordでHTMLを作ることが思いつきます。

■シリーズ
(1) ワンソースマルチユースの課題:HTMLソースのオーサリング問題を改めて考えてみようと。
(2) HTMLを手軽に作る方法を再検討します。手軽といえば、まずWordでHTMLを作ることが思いつきます。
(3) Word2013のWord文書をHTML形式で保存を試してみる。その問題点は?
(4) HTMLを簡単に作る方法:h1要素の話(1)

Submission Request to W3C from Vivliostyleについての若干の感想

Current Status of Japanese Typography Using Web Technologies(Submission Request to W3C from Vivliostyle)日本語訳

という文書が1月27日付けで発表されているので、ざっと見てみた。以下に若干の感想を記す。

まず、この文書の中で一番重要なポイントは「Implementations that support pagination, such as EPUB readers or PDF formatters, do need to support such features.」(日本語訳「EPUBリーダーやPDFフォーマッタなどのページネーションをサポートする実装は、そのような機能をサポートする必要があります。」)という点だろう。

もともとJLReqは、紙に印刷する書籍の組版に関して整理したものである。従って、JLReqを議論の前提にする以上、縦横の大きさをもつページの概念が必須である。ページの概念を無視すれはかなりの部分が意味を失ってしまう。

一方において、ブラウザは画面に高速に表示することを目的としている。そしてページサイズの概念はブラウザには必要ない。このため、CSSの勧告仕様または勧告候補だけでは、まだページの大きさを指定できない。CSS Paged Media Module Level 3という仕様にページの大きさを規定する方法があるが、これはまだWorking Draftの段階であり[1]、正式な仕様として参照できる状態ではない。

CSS Paged Media Moduleの歴史は古い。一番最初は1999年にHPのRobert Stevahn氏がWorking Draftを出している。その後、2004年に勧告候補まで行ったが、次の2006年版ではまたWorking Draftに戻ってしまった。CSSを紙への印刷に使おうとするとページの大きさの指定は必須であるのに、正式な仕様ではそれができない状態がもう長いこと続いているわけだ。

現在、リフローのEPUB3を表示するリーダーは、ページ捲りを実装しているものが多い。しかし、これらは各リーダーの独自実装である。ページ捲りの一つとして、例えば、章の見出しを画面の上下・左右中央に配置したいときは縦と横のサイズを指定して、その中央に置くのが素直なはずだ。しかし、CSSではそういう指定はできない。このため、日本語のEPUB3ではトリッキーな指定をせざるを得なくなってしまっている。

このように、紙に限らず、画面表示を前提とするEPUBリーダーやブラウザでページめくりをきちんと実装しようとすればCSS Paged Media Module Level3を実装することが必要になる。

そこまでの理屈は良いとして、CSS Paged Media Moduleがブラウザの世界で受け入れられるかどうかが問題である。なぜならば、CSSの仕様開発作業はブラウザベンダーの主導で進んでいて、ブラウザベンダー以外はほとんど影響力を持っていないからである。さらに言うならば、CSS2.0で勧告になった項目でさえも、ブラウザが実装していないことを理由にCSS 2.1で削除されてしまったものもある。その一例がここで問題にしているページの大きさである。CSS2には@pageというルールがあり、CSS2.0ではそこに’size’プロパティでページの大きさを指定できた。しかし、CSS 2.1では’size’プロパティは削除されてしまった。’size’はCSS Paged Media Moduleに移行した。こうした経緯を知っていれば、CSS Paged Media ModuleをCSS3の勧告にもっていくのが困難なことは予想に難くない。

CSSがサポートしないためにできないことがいろいろあるのは確かである。そしてこれに正面から取り組もうとすると、現状のCSSワーキンググループと長く熾烈な論争になるのは確実である。このサブミッションがどう受け止められるか、興味深いところである。

[1] CSS Paged Media Module Level 3 W3C Working Draft 14 March 2013

『XSL-FOの基礎 第2版』は全文をWebでも公開。CAS-UBでプリントオンデマンド用PDFを作り、Web生成機能でWebページもワンタッチで完成。

『XSL-FOの基礎 第2版』では、プリントオンデマンド(POD)版、電子書籍(Kindle、EPUB)版で販売すると同時に、新たにWebページで全文をお読みいただけるようにしました。

本書の目的は、XSL-FOについてもっと多くの人に知ってもらうことです。そこで、PODで売るだけではなくWebページを通じてお読みいただけるようにするのが良いと考えました。こう考えたもう一つの理由は、CAS-UBのマニュアルのWeb版です。CAS-UB V4からマニュアルをPDF版とWeb版で公開しています。

CAS-UBサポート&ガイド一覧

公開してから約半年経過しまして自らの使い方を振り替えってみました。マークアップ(CAS記法)であそこはどうだったかな? というところを見ようとしますと、このオンラインWebページは大変便利です。結局、この半年間PDF版はほとんど利用しなくて、大抵Web版で済ませていることに気が付いてしまいました。これは少々ショックなのですが、やはりマニュアルのようなものはWeb版がPDF版より遙かに便利なことは認めざるを得ません。

Web版はCAS-UBでPDF版の原稿からワンソースで作成できます。

CAS-UBではWeb版の形式として(1)目次と本文を別のWindowに分割した形式と(2)目次を通常のWindowに表示する形式の2種類があります。


図1 目次と本文を別のWindowに分割した形式


図2 目次を通常のWindowに表示する形式

目次と本文を別のWindowに分割した形式は、AH Formatterのページで公開しています。☞『XSL-FOの基礎 第2版』の内容を読む

ちなみに、同じワンソースから作ったPOD版用PDFを表示しますと次の通りです。PDFのナビゲーションもしおりを使えばそんなに悪くないと思うのですが。やはり、Webではワンタッチで表示できるのに、PDFは全文をダウンロードして、別アプリを起動して表示しなければならないという点が煩わしいように思います。

WebにPDFを統合する方法をもう少し考えると良いんでしょうか?

何にしましても、ワンソース・マルチユースで出版物を制作できるCAS-UB、これからはWeb生成機能についても強力アピールして行きたいと考えております。よろしくお願い致します。

【追記】
目次を通常のWindowに表示する形式は、当初公開していましたが、Googleにインデックスされないため削除しました。もしかすると重複コンテンツと見做されているのかもしれません。

『XSL-FOの基礎』画像制作のこと。Word経由でインポートした画像は印刷品質の劣化が激しいため、第2版ではできるだけSVG形式に変更した件。

『XSL-FOの基礎』は初版は2016年5月に初版をリリースしましたが、今回は大幅に改訂して第2版となります。改訂の一部として、多くの画像をラスターからベクトル(SVG形式)に変更しました。以下、このことを少し説明します。

本書にはXSL-FOのオブジェクトとプロパティの説明の一部として組版結果の紹介をしています。例えば、こんな感じです。

組版結果はPDFです。初版では、組版結果の多くはPDFを表示して画像スクリーンキャプチャしていました。最初のうち原稿をWordで書いていましたので、スクリーンから切り取ってWordに貼り付けていたものもあります。原稿のWord文書をCAS-UBで取り込んだとき、このラスター画像もCAS-UBに取り込まれます。途中からはCAS-UBで原稿を直接書いて編集しましたので、スクリーンをキャプチャしてPNGファイルとして取り込んだものもあります。初版の画像制作は、主に次のようなフローになります。

こうした画像を画面で見ている限りでは、それほど見栄えに差がないのですが、プリントオンデマンドで紙に出力しますと画像の品質の差が歴然となります。Wordに貼り付けて(CAS-UBのWordインポートで)CAS-UBに取り込んだ画像は品質が非常に悪くなります。一方、PNGファイルをCAS-UBに取り込むときは、印刷したときの画像の品質はPNGの精度(ピクセル数)次第です。特に、文字がはいっているような画像は品質が低いと問題があります。

ということで第2版ではできるだけPDFからベクトル画像(SVG)を作ることにしました。SVGを作る方法はいろいろあると思いますが。今回は自社開発のPDFビューアのSVG切り出し機能を使いました[PDF加工画像化ツール]。この操作は次のようになります。


図1 PDFを開く


図2 SVGにしたい範囲を選択


図3 SVG形式で保存

SVGにした画像はPNG形式も用意しています。PDF生成時はSVG形式を使い、EPUB生成時にはPNGに差し替えるようにしました。残念ながらKindleではSVGを正しく表示できないことがあるためです。

SVGからPNGへの変換は「置換」機能を使います。

複数の画像ファイルを用意しておき、出力形式によって画像を使い分ける機能はCAS-UBのWeb制作サービスの中に取り込んでいきたいものです。これは次のバージョンアップの課題の一つといたします。

参考資料
1. 技術書典2と『PDFインフラストラクチャ解説』第1.1版、『XSL-FOの基礎 第二版』のご紹介
2. 『XSL-FO の基礎 – XML を組版するためのレイアウト仕様』
3.Wordに埋め込まれたイメージ画像の解像度はどうなるか?
4. Office Server Document Converter Word文書(docx文書)に埋め込まれたイメージ画像はどのように扱われているか
5. Wordに埋め込まれたイメージ画像の解像度はどうなるか? Word2019の場合

技術書典2と『PDFインフラストラクチャ解説』第1.1版、『XSL-FOの基礎 第二版』のご紹介

4月9日にアキバ・スクエアにて技術書典2が開催されます。詳しい情報はこちら:技術書オンリーイベント。僕らが作る。 技術書オンリーイベント 第2回、開催決定!

サークル詳細 | アンテナハウスCAS電子出版(き-07)

CAS電子出版は今年も技術書典に参加します。実は、この1年間、技術書関係の新しい出版物を出していないためちょっと迷いました。しかし、とにかく継続が大事ということで恥ずかしながら昨年と同じタイトルで参戦します。振り返りますと無駄に1歳加えてしまったこの1年でした。

でもそうはいっても全く同じではということで、『PDFインフラストラクチャ解説』を第1.1版に、『XSL-FOの基礎』を第二版に改訂しました。

『PDFインフラストラクチャ解説』1.1版はすでに販売しておりますので、詳しくは次のページをご覧ください。
「PDFインフラストラクチャ解説 電子の紙PDFとその周辺技術を語り尽す第1.1版」

この1年の変化を振り返りますとPDF 2.0=ISO 32000-2がそろそろ出版されることが大きいかなということで、付録にPDF 2.0の概要を追加しています。但し、ISO 32000-2仕様書はまだドラフトのため、本文には加えず付録としました。初版をお求めいただいた方のために付録部分はWebでも公開しています。
PDFインフラストラクチャ解説 付録:もうすぐ出版されるPDF 2.0の概要

『XSL-FOの基礎』第二版はかなり大幅に改訂しています。初版は、昨年6月に開催された初回の技術書典に間に合わせるため突貫で出版したこともあり、説明の内容や特に図版の出来が不十分でした。今回は、昨年の技術書典の後に改訂作業をした分と、さらに第二回に間に合わせるように修正した分を合わせますとかなり大幅な書き直しとなっています。前よりもだいぶ良くなったと思いますが。

こちらは、まだPODで発売になっておりませんので、発売次第ご案内いたします。

参考資料
1.6月25日技術書典 大盛況でした。XMLの本にも大きな関心を寄せていただきました。
2.技術書典 再来週末(6月25日)開催! 出展に向けて準備中!
3.技術書典出展のお知らせ

OOXMLとは (JEPA EbookPediaの原稿ドラフト)

JepaのEbookpediaは3月13日公開されました:

OOXML

最後に互換性について追加しています。
本ブログにいただいたコメントを元にしています。

—————–
JEPA EbookPedia今月はOOXMLの解説を書こうと思っています。

そこで、ドラフトを以下に公開します。ご不明点などのコメントをいただけるとありがたいです。

----
OOXMLとは

 OOXML(Office Open XML)はマイクロソフトOfficeの文書形式をXMLに準拠して規定したファイル形式仕様の名前である。Office 2007のファイル形式が初めて全面的にOOXMLで規定されて現在に至っている。

もっと詳しく
Officeの文書形式は2003まで独自のバイナリー形式であった。マイクロソフトWordでは独自のバイナリー形式とRTFという交換形式が規定されていた。Word 2003で初めて、WordProcessing MLというXML形式が規定された。

Office 2007では、Word、Excel、PowerPointの三つのアプリケーションの文書形式がOffice Open XML というXML形式で規定された。これをOOXMLという。

Office 2007のOOXML形式は2006年12月にECMA-376第1版として出版された。その後2008年12月にECMA-376第2版が出版され、第2版を元にISO/IEC 29500:2008仕様となった。ECMA-376とISO/IEC 29500はOfficeのバージョンアップと並行して改訂されている。最新のOffice 2016の文書形式はECMA-376第5版、ISO/IEC 29500:2016である。

国際標準化競争
マイクロソフトがOfficeの文書形式をOOXMLという形で国際標準化を進めたのは、当時の競合であるサン・マイクロシステムズのオープンソースのオフィスアプリケーションOpen Officeが大きな影響を与えている。Open Officeの文書形式はOpenDocument Format (ODF)というXML形式で策定され、2005年にOASIS標準、次いで2006年にISO/IEC 26300:2006となった。

国際標準化により、政府・地方公共団体などでOpen Officeを採用し、マイクロソフトOfficeを閉め出す動きが見られた。こういった動きに対処するためにマイクロソフトはECMAを通じてOOXMLの国際標準化を急いだのである。

XML形式のメリット
マイクロソフトOfficeの文書形式がバイナリーの時代には、Officeの文書を他のアプリケーションで読むにはマイクロソフトから仕様書を入手すると共にOffice文書を解析しなければならなかった。XML化されてからは比較的簡単にOffice文書の内容を読んで再利用することができるようになった。また、他のアプリケーションでOffice文書と互換のファイルを簡単に出力できるようになった。

マイクロソフトWordの文書はRTFという拡張テキストとして保存して交換することが
できたが、それもすでにWordProcessing MLで置き換えられている。このようにXML技術によってOffice文書の交換方式は一新された。

—-
参考資料

[1] Office Open XML(OOXML)仕様とMicrosoft Officeのバージョンの関係
[2] WordML(Office2003)

もう少し整理してWebページを作ってみました。

サーバベース・コンバーター Office Open XML (OOXML) とは? 概要、メリットと活用アプリケーション

Office Open XML(OOXML)仕様とMicrosoft Officeのバージョンの関係

Microsoft OfficeのXML形式の仕様書はOffice Open XML(OOXML)として規定されている。当初はECMA-376標準として規定され、それを元にしてISO/IEC 29500として標準化された。

Microsoft Officeのバージョンアップにより、OOXMLの仕様も少しずつ改訂されている。特に、ISO/IEC 29500仕様書には移行版(Transitional)と厳密版(Strict)が規定されている[1]。移行版はECMA-376のEdition 1とほぼ同じである。厳密版はECMA-376のEdition 2と同じである。

ECMA-376のEdition 1、ISO/IEC 29500の移行版はMicrosoft Office 2007が読み書きできる。これらの仕様書は概ねMicrosoft Officeのバージョンアップに対応して拡張されている。

Ecma
バージョン番号 リリース ISO
Office 2007 2007年1月30日 ECMA-376 Edition 1
Office 2008 (mac版) 2007年1月30日 ECMA-376 Edition 2 ISO/IEC 29500:2008[2]
Office 2010 2010年6月17日 ECMA-376 Edition 3 ISO/IEC 29500:2011
Office 2013 2013年2月7日 ECMA-376 Edition 4 ISO/IEC 29500:2012
Office 2016 2015年9月23日 ECMA-376 Edition 5 ISO/IEC 29500-1:2016, ISO/IEC 29500-3:2015, ISO/IEC 29500-4:2016

※リリースはパッケージ版

ISOのカタログに記載されているISO/IEC 29500の仕様書一覧[3]を見るとパートによって最新の改訂年度が異なっている。パート2(ISO/IEC 29500-2)は2012年版が最新である。

ISO/IEC 29500-1:2016
Information technology — Document description and processing languages — Office Open XML File Formats — Part 1: Fundamentals and Markup Language Reference
(2008年版、2012年版は撤退)

ISO/IEC 29500-2:2012
Information technology — Document description and processing languages — Office Open XML File Formats — Part 2: Open Packaging Conventions
(2008年版は撤退)

ISO/IEC 29500-3:2015
Information technology — Document description and processing languages — Office Open XML File Formats — Part 3: Markup Compatibility and Extensibility
(2012年版は撤退)

ISO/IEC 29500-4:2008/Cor 1:2010

ISO/IEC 29500-4:2016
Information technology — Document description and processing languages — Office Open XML File Formats — Part 4: Transitional Migration Features

[1] Office Open XML と ECMA-376 仕様(Office 10)
[2] Publication of ISO/IEC 29500:2008, Information technology – Document description and processing languages – Office Open XML file formatsによるとISO/IEC 29500:2008はOffice 2008アプリケーションに基づいている、とされている。
[3] https://www.iso.org/ics/35.060/x/
[4] Office 2010のOOXMLはISO標準に準拠してない!? – 仕様サポート巡って議論

サーバベース・コンバーター Office Open XML (OOXML) とは? 概要、メリットと活用アプリケーション

ECMJ流!Eコマースを勝ち抜く原理原則シリーズ第7弾 『選ばれるEコマースになるために「違い」をつくろう! ~ネットビジネスの原理、購買行動の原理を押さえる~』が発売になりました

ECMJ流!Eコマースを勝ち抜く原理原則シリーズ第7弾『選ばれるEコマースになるために「違い」をつくろう! ~ネットビジネスの原理、購買行動の原理を押さえる~』を紹介します。

本書は株式会社ECマーケティング人財育成の石田社長のブログをプリントオンデマンドと電子書籍で本にするシリーズ第7弾です。今回は「違い」がメイントピックです。マーケティング用語では差別化といいますが、他社製品との違いを作るのはとても大事です。そして商品によっては本のちょっとした違いで選択されることがあります。ですので、選択される理由を調べるのも大事です。

しかし、日本の文化あるいは日本人の考え方には「違い」よりも、「類似性」を重視するという傾向があるように感じます。類似性を重視するとどこもかしこも同じような製品・サービスになってしまいます。結局は価格しか競争手段がなくなり、すべての市場がレッドオーシャンになってしまうのではないでしょうか。石田ブログで「違い」の重要性を考えてみましょう。


現在、Kindle版とアマゾンのプリントオンデマンド(紙)版が発売済みです(上)。

本の情報
書名:『選ばれるEコマースになるために「違い」をつくろう! ~ネットビジネスの原理、購買行動の原理を押さえる~ 』
シリーズ名:ECMJ流!Eコマースを勝ち抜く原理原則
著者:株式会社ECマーケティング人財育成 代表取締役 石田麻琴
出版社: アンテナハウスCAS電子出版
発売日:2017年2月

○プリントオンデマンド版
サイズ:A5判 横二段組み
ページ数:154ページ
価格(税込):1,960円
ISBN:978-4-900552-44-9
販売店:アマゾン(amazon.co.jp)

○電子版
価格(税込):1,250円
ISBN:978-4-900552-45-6
販売店:Kindle版(Kindleアンリミテッド対象)

内容のご紹介
第1章では、ネットビジネスでは、「何をすれば良いかは分からない」が、「やったことが良かったかどうかは客観的な数字で計ることができる」として、インターネットのマーケティングの本質について、暗闇の中で玉を投げて的にあてるゲームであるという著者の基本的な考え方を説きます。

第2章では、ネットショップの運営に役立つ22のポイントについて具体的に説明しています。例えば、人に知ってもらう仕事と人に楽しんでもらう仕事に分けると、後者の方により多くの時間を割いている傾向があります。しかし、ネットでは商圏がないので、知ってもらう仕事にもっと力を注ぎ、最低でも同じくらいの時間にするべきといったことです。

第3章では、潜在顧客、見込顧客、新規顧客、既存顧客というCRMの4つのステップについて話しています。ウェブサイトへの来訪者の多くは実際には潜在顧客なのですが、ネットショップの運営者は、これを見込顧客と混同する傾向があることに注意を促します。

第4章ではリアルを含めてマーケティングで注意するべきポイントについて実際に見聞きした具体的な例をもって紹介しています。

第5章ではブランドとはどのようにできあがるか、自社の強みや良い点をさらに伸ばすことや違いについて語ります。

著者は毎日1500字のブログを手を抜くことなく、全力投球で書いています。これをまとめた本書はテキストの分量も多く読み応えがありますが、本気に取り組む事業者にとって、具体的に役立つ重要でテーマが各ページに盛り込まれています。ぜひ、何度も読んでご自分の仕事にお役立てください。

目次
はじめに
第1章 ネットショップってシミュレーションなんです
第2章 Eコマース運営のポイント
第3章 顧客軸のマーケティング・CRM
第4章 マーケティングのポイント
第5章 選ばれるポイントを知る、違いを出す
第6章 マーケティングの原理原則
第7章 ネット上の購買行動
第8章 商品・商材を考える
第9章 Eコマースの売上目標管理と成果検証
第10章 インターネットの可能性と限界
索引

詳細目次
下記は本文のオリジナルブログ一覧です。

第1章 ネットショップってシミュレーションなんです
「まずやってみる、そうすると予想もしていなかった何かが起きる」。大切なのは、「やったことは良かったか」を知ることだ。 【no.0027】
ネットショップってシミュレーションなんです。 【no.0170】
インターネットを活用する「目的」とコンバージョンを確認しよう。【no.186】
とにかく考えてみる、とにかくやってみる。そうすれば次のチャンスが見えてくる【no.0886】

第2章 Eコマース運営のポイント
ネットショップの売れるページの考え方。【no.0202】
ネットショップ物流のアウトソーシングタイミング。【no.0210】
物流業務をアウトソーシングから自社に戻すタイミング。【no.0213】
物流業務を外注から自社に戻すときのリスク。【no.0224】
ネットショップの商品IDを設定するときに付加できる要素。【no.0223】
変化をし続ければ、最悪でも「効果ナシ」だけ。【no.0284】
「人に知ってもらう仕事」と「人に楽しんでもらう仕事」に同じくらい時間を費やす。前半【no.0540】
「人に知ってもらう仕事」と「人に楽しんでもらう仕事」に同じくらいの時間を費やす。後半【no.0550】
ポジティブなレビューを活かす。ネガティブなレビューも活かす。【no.0801】
市場の流れが向いてこない・・そんなときこそ「原則」を見直す。【no.0814】
自社のネットショップのことを、お客様におぼえてもらうためには【no.0842】
定期チェックリストを作成して、ネットショップの「運営モレ」を防ごう【no.0845】
ネットショプだけではなく、実店舗でもできる「人気(ひとけ)」のアピール。【no.0848】
「アナログな手間」を割いてくれるお客様はどれくらいいるのか【no.0851】
コンセプトは、なぜお客様に伝えても伝えても伝わらないのか!?【no.0869】
マニュアルを変えてから、商品ページを変える。その「ひと手間」が大事【no.0885】
ネットショップは「スキルの高さ=売上」ではありません!【no.0949】
「言葉」に工夫を施して、お客様にとっての「付加価値」をつける【no.0970】
ネットショップの販売スケジュールを立てる。まず軸にするのは?【no.0976】
「カートに入れる」がいいのか、「カートへ入れる」がいいのか【no.1030】
流れが悪いときは、「土台を見つめ直す」「人に会う」「生活習慣を改める」【no.1039】
WEBで使われる「バナー」って、一般的にみんな知ってますかね【no.1074】

第3章 顧客軸のマーケティング・CRM
「ビッグバーZホワイト」を買い占めたのは、私です。 【no.0129】
CRMの4ステップ。潜在顧客、見込顧客、新規顧客、既存顧客【no.0188】
潜在顧客には課題解決の提案で検索ヒットを狙う。【no.0195】
CRM4ステップ戦略を練るときのKPIと数字項目。【no.0201】
既存顧客に向けたCRM戦略のポイント。【no.0207】
潜在顧客は「自分のケース」の解決策を探している。【no.0208】
「顧客軸」のマーケティングを展開して、お客様を深く知ろう【no.0871】
時間帯によって価格を変更するためには、顧客軸・市場軸のデータが必要になる【no.0876】
お客様は「自分のタイミング」で商品を探し、購入を決定している【no.0891】
実店舗がポイントカードを採用することの価値は「顧客データ」にアリ【no.0908】
単品通販のポイントは顧客軸のマーケティングを掘り下げること【no.0968】

第4章 マーケティングのポイント
優良なコンテンツだけではなく習慣化が大ヒットを生み出す。 【no.0119】
弊社取締役の岩佐豊氏による長時間セミナーを開催しました。 【no.0130】
人口動態を見る限り、明るい未来にはならない。 【no.0131】
ドライフルーツを販売する会社が営業に徹底させたこととは。 【no.0132】
ほとんどの人は「真剣に」サービスを見ていない。【no.0187】
真面目な人(特に石田)が陥りやすい改善の罠。【no.0194】
勝ちに近づくビジネスモデル(EXILE・HIROさんの場合)【no.0289】
「パフォーマー」と「ダンサー」のマーケティング的違い。【no.0298】
地域ナンバーワンと全国ナンバーワンなのか、どちらが良いのか。【no.0325】
キャンドゥの「ジグザグ作戦」。ちょっとした工夫に努力と「違い」が隠されている【no.0562】
ネットショップで新規顧客を増やす3つのパターン、既存顧客を活性化させる2つのパターン【no.0836】
在庫を売り切ったA社、在庫が残ったB社。スタッフに対する「指示」の違い【no.0901】
お客さんのアンテナがいつ張られるのかを予測する。絶えず発信する。【no.0642】
問題は、お客様のタイミングがきたときに自社が頭に浮かぶか、否か。【no.0911】
継続するから、アイデアが生まれ、さらに継続するから、深いアイデアが生まれる【no.0920】
売上がヤバい!そんなときにできることはたった2つだけ【no.0955】
ネットで炎上しないためには、情報発信を続けることが大切。【no.1062】

第5章 選ばれるポイントを知る、違いを出す
ブランドは「自分をどう見せるか」ではなく、「自分がどう見られるか」【no.0645】
自分たちの「強み」がわからなかったって心配はいらないですよ。【no.0894】
「それって、みんなやったらどうなるの?」から考えるビジネスの本質【no.0919】
良いところを伸ばす。だから「違い」ができる。「突破」できる【no.0971】
まずはお客様が「選ぶポイント」を改善することで、「勝てること」に繋げていく【no.0960】
お客様が「選んだ理由」は、客観的に「勝っている部分」【no.1088】

第6章 マーケティングの原理原則
Eコマース「成功」のための9テーマ。クイズ編【no.0477】
Eコマース「成功」のための9テーマ。答え合わせ編(前半)【no.0484】
Eコマース「成功」のための9テーマ。答え合わせ編(後半)【no.0485】
ネットのマーケティングとは、データマーケティング【no.0371】
リアルのマーケティングにおける2つのポイント【no.0375】

第7章 ネット上の購買行動
Eコマース(ネットショップ)における、お客さんの購買行動を考えてみましょう。イチ【no.0625】
Eコマース(ネットショップ)における、お客さんの購買行動を考えてみましょう。二【no.0627】
Eコマース(ネットショップ)における、お客さんの購買行動を考えてみましょう。サン【no.0628】
Eコマース(ネットショップ)における、お客さんの購買行動を考えてみましょう。ヨン【no.0631】
ユーザーがどこからやってきて、どうやってサイトを使うのか、を掘り下げる【no.0646】

第8章 商品・商材を考える
商売は商品が命。商品企画/商材開拓、「仕入れ」について考える。1【no.0674】
商売は商品が命。商品企画/商材開拓、「仕入れ」について考える。2【no.0677】
商売は商品が命。商品企画/商材開拓、「仕入れ」について考える。3【no.0683】
商売は商品が命。商品企画/商材開拓、「仕入れ」について考える。4【no.0695】
「型番商品」と「オリジナル商品」のメリット・デメリット、戦略の違い。1【no.0962】
「型番商品」と「オリジナル商品」のメリット・デメリット、戦略の違い。2【no.0963】
「型番商品」と「オリジナル商品」のメリット・デメリット、戦略の違い。3【no.0964】
新しいチャレンジに自ら飛び込み、自社と己の成長の機会とす【no.0887】
ネットで売れている商品が、ネットで競争力のある商品です。【no.1061】

第9章 Eコマースの売上目標管理と成果検証
売上目標と達成指標の考え方。「顧客軸」での目標設定とは!?【no.0635】
2015年の課題を整理し、2016年の売上目標と年間スケジュールを立てよう【no.0827】
一年後、今の実績をこえられているかで評価する。「前年同月」の大切さ。【no.1006】
Eコマースにおけるコストダウンと売上アップ(コスト編)【no.0227】
Eコマースにおけるコストダウンと売上アップ(売上編)【no.0228】
「毎日読む!仕事のすごい考え方」でマインド管理。【no.0232】
販促企画の成果の検証、3つのポイント。【no.0235】
「何かを実践する」ということは、「成果を検証する」ということ【no.0606】
「属人的な業務」を無くすためにやりたいこと。前編【no.0743】
「属人的な業務」を無くすためにやりたいこと。後編【no.0751】

第10章 インターネットの可能性と限界
インターネットにおける共同購入(ギャザリング)のこれからのマーケティングについて考えてみる。 【no.0028】
参入障壁はネットショップより低い。ユーチューバーの可能性【no.0492】
キュレーション(まとめ)サイトやCGMサイトの限界【no.0506】
市場の山は縦長に伸びている。山頂は20年前よりはるか彼方へ【no.0883】

参考資料
[1] ECMJ流!Eコマースを勝ち抜く原理原則シリーズ
[2] アンテナハウス書籍・総合目録