ワンソース・マルチユース実践の難しさを考える

ワンソース・マルチユースという言葉はかなり長く使われています[1]。テクニカルドキュメントなどでは大きなシステムを構築して実現しているケースもいろいろ報告されています。しかし、書籍の出版や学術誌の出版ではワンソース・マルチユースはまだ大きな流れにはなっていません。ここではワンソース・マルチユースがなかなか普及しないのはなぜかを考えてみます。

ワンソース・マルチユースの仕組み

ワンソース・マルチユースを実現するには、まずソースとなる文書の形式を決める必要があります。ソースの形式はXML[2]のようなマークアップ言語[3]のタグセットになります。具体的には、DocBook、DITA、JATS、HTML5などが一般的です。独自のタグセットもよく使われます。XMLはもともとドキュメントをデバイスやアプリケーションから独立の形式で記述するために設計されたものです。

ソースの形式をどのようにするにせよ、ワンソース・マルチユースの制作工程は二つのステップに分けられます。第一はソースとなるドキュメントを用意する編集工程です。第二は、それをいろいろな目的に使うマルチユース工程です。マルチユース工程とはPDF、HTML、EPUB、Helpなどへの出版工程と言って良いでしょう。ソースの形式をどう選択するかで、ソースドキュメントの編集工程が影響を受けます。もちろん、出版工程も影響を受けます。

第一のステップ

ソースとなるドキュメントの内容の執筆、テキストの表現を統一したり、論理的な説明の順序を入れ替えて分かりやすくしたり、内容が正しいか・適切かどうかを校閲する作業を含みます。こうした作業はワープロやテキストエディタで行うことが多いでしょう。次いでテキストにXML/HTMLで決めているタグマークアップする作業が必須です。マークアップまでを総称して編集と言います。もともとマークアップという言葉は編集者が印刷会社のオペレータに指示するマーク付けから生まれたようです。例えば“Chicago Manual”には編集者がマークアップする例が出ています。マークアップが正しくできていないと第二ステップの処理ができません。執筆、校正を初めとして、第一のステップは、人手で行うのが主体です。

ドキュメントを編集する工程は、まだコンピュータで処理できるようになっていません。もっとも、現在、いま問題になっているDeNAのキュレーションサイトのコンテンツの収集についての記事[4]を読むと、文章をリライトするコンピュータ処理は、驚くほど進歩しているようですので、将来は自動的にできるようになるかもしれません。恐ろしいことです。

第二のステップ

第二ステップはソースを加工処理して印刷データとしてのPDF、配布・閲覧するためのPDF、WebページのためのHTML、各種のHELPなどに加工出力する工程です。英語ではパブリッシングと言います。日本語ではそれに相当する適切な言葉がありません。ここでは出版工程という言葉を宛てています。XMLはもともとドキュメントをコンピュータで処理するための技術です。ソースドキュメントをXMLで用意することができれば、プログラムで様々な成果物を用意するのは容易です。

例えば、DITAではあまりレイアウトなどに拘らなければDITA-OTを使うだけで、HTML、PDFを初めとする多種類の出力が得られます。このように、ソース文書さえXMLあるいはHTMLで作ることができれば、いまの技術を使えば多種類の出力を作成するのは比較的容易です[5]

問題はなにか?

ワンソース・マルチユースの難しさはソースをどのように用意するかというプロセスにあり、マルチ出力は大きな問題ではありません。但し、第二のステップはコンピュータ処理で行いますので、現在の技術ではレイアウトは一定のパターンになります。自動で自由自在のレイアウトを実現するのは将来の課題です。

これはXMLやHTMLが技術的に難しいということではありません。上で説明しましたように、第一ステップは人手で行われます。これを担当する執筆者・編集者は、現在、すでに一定のツールを使って一定の手順により作業を行っています。その作業のワークフローをそれまで慣れ親しんできた方法から変更するように説得するのが難しいのです。

特定の企業が主体性をもって限られた数のドキュメントを制作しているテクニカルマニュアルなどの分野でさえもなかなかワークフローの転換は難しいのです。多品種少量制作の典型である商業書籍の出版や事務局が責任をもった意思決定をしにくい学会などはさらに難しくなります。