CAS-UBのワードインポート機能を改善しました。またPDFインポートを仮公開しました。

昨日(2/14)の定期メンテナンスで、CAS-UBのインポート機能を改善しました。

1.Word 2003 XML形式のインポートを改善

今回改善したのは、Word 2003 XML形式(通称:WordML)からのインポート機能です。

○機能を追加した項目

・縦組みでワード文書に縦中横が設定されていたとき、CAS-UBでも縦中横のマークアップに変換します
・ワード文書の見出し(アウトラインレベルが設定されている)のルビ・縦中横をCAS-UBの見出しマークアップに変換します
・ワードでは、[Shift] + [Enter] で、段落途中入力した強制改行をCAS-UBの強制改行(\\)に変換します

Word2003以前のdoc形式、Word2007以降のdocx形式からのインポートは従来どおりで変更ありません。このため現在ワード文書のインポートでは、Word 2003 XML形式がもっとも良い変換結果になります。(doc/docx形式は、今後、改善予定)

DOC/DOCXファイルを Word 2003 XML形式にするには、マイクロソフトWordを使ってDOC/DOCXファイルを開き、名前を付けて保存を実行して「ファイルの種類」に Word 2003 XMLドキュメント(*.xml)を指定して保存ください。

2.PDFからのインポートを仮公開

PDFファイルからのインポート機能を仮公開しました。

PDFをEPUBに変換する方式には、(1)PDFの各ページを画像にする、(2)PDFをリフロー型のEPUBに変換するという二通りの方式が考えられます。

今回追加したCAS-UBのPDFインポート機能は(2)のPDFリフロー型のEPUBに変換する方式です。
PDFの中のテキストを取り出してCAS-UBの記事に変換します。

変換対象とするPDFは、文字コードを取り出すことのできるPDFです。スキャンして作成したPDFは対象外となります。

○CAS-UBのインポート機能の概要
Wordなどのインポート