COLUMN

第8回 − 「文書」を構成する要素、コンテンツ、構造、体裁 −

今週は、本来のテーマに戻って、紙媒体と電子媒体の構造的な違いについて考えてみたい。

このコラムをご覧になっているあなたは、私が書いた文章の運びのままに、また読売が私に提供してくれた、このスペースとレイアウト(体裁)のままに、読んでおられるはずである。これは、すべての読者に共通しているはずである。しかし、ご覧になっている方々の、お手元のコンピュータは、いろいろなメーカが製造しているし、またブラウザも、製造者は異なるし、さまざまなバージョンをお使いのことと想像する。

一昔前を思い出して戴きたい。各コンピュータメーカでは、JEFコード、KEISコードなど、使用している文字コード自体が違うし、もちろんハードウエア・アーキテクチャーやOSなども、それぞれ異なっていた。このような構造のもとにおいては、私の文章を皆さんに提供するためには、ご利用のコンピュータを、広く想定して、各々の機構構成にあったファイルを多数用意するか、またはそれぞれの読者が、私の提供するファイルを、御自身の構成に合せて、変換しなければならないこととなる。
ありがたいことに、今日私は、たった一つのファイルしか用意していない。このファイルを、読売さんでHTML形式に構成して、このコラムに掲載して戴いている。その結果殆どの読者は、私のこの文章をご覧戴けることとなる。

言い換えれば、今日WEB構造の広範な普及は、HTMLの採用によって、だれでもが地球全体を相手に情報発信できるようになったことがもたらしているとも言える。
ただし、HTMLも実はさまざまに制約をもっている。簡単に言えば、HTMLで提供される文書は、私と読売とがデザインしたままの構造と体裁でしかご覧戴けない。
HTMLは、ハイパー・テキストによる情報提供構造を容易な操作性のもとに実現した意味で、画期的な情報記述言語である。その容易な操作性は、単に組織間での情報交換標準と言う枠組みを大きく超え、情報そのものを、広くネットワーク上で共有する構造を実現しつつある。しかし、HTMLは、情報表現における体裁(レイアウト)の制御に限定し、機能面の豊富さよりも操作容易性を重視すると言う設計上のコンセプトのもとにある。このため、

  • 文字列の出現場所や意味を持つ機能がない。
  • (具体的には、同じ「秋田」と言う文字列であったとしても、それが人の姓を指す意味で使われているのか、県名で使われているのか、判断が付かない。)
  • 全ての利用者に共通した一つのタグセットである。
  • 各々のタグの機能はあらかじめ固定されている。
  • データ構造についてもあらかじめ定められている。
  • データのモジュール化が困難である。

という技術的な制約がある。また、今日実質的に、ブラウザ・ベンダーが、二社にほぼ限定されているというポリティカルな問題も指摘される。このため、次のような場合には、実質的に適用が困難となる。

  • 複雑な構造を持つデータ
  • 大容量なデータ集合
  • 同じデータセットの、異なる目的への利用
  • 長期間に亘る情報のアーカイブ

ここに、ネットワーク上での情報蓄積や共有に向けての、新しいコンセプトが必要とされつつある。これが、今日話題を集めつつあるXML誕生の背景の一つがある。

XMLでは(その母体であるSGMLにおいても)、情報の「コンテンツ」、「構造」、「体裁」をそれぞれ分離して扱う。一方、従来の紙媒体上においては、これら三者は一体となって決定されていたし、HTMLによる情報表現においても、提供される情報は、提供者がデザインした構造のままに、いずれの利用者にも提供される(だれもが同じフォーマットで見る)。今日普及が目覚しいPDF(Portable DocumentFormat)による情報表現においても同様である。すなわち、これらのメディアにおいては、同じコンテンツは同じ構造のもとに、同じレイアウトで表示されることが前提に置かれる。
これら三者を分離して扱うことによって、同じコンテンツであってもさまざまな表現体裁を利用者側で選択可能となる。また、利用者があらかじめ構造情報を解析して、必要とする部分コンテンツを特定することも可能とされる。
簡単な例を挙げれば、同じデータから、地域別売上を表示したり、商品別売上を表示させたりする選択が可能となるし、専門家とアマチュアが、同じコンテンツに対して、別な見方をすることも可能となるはずである。
この結果、

  1. 情報の再利用。
  2. メディアに依存しないコンテンツの出力(画面表示/ディジタル出版)。
  3. 情報の部分的利用。
  4. 個別、利用者の要求に応じたコンテンツのワン・トゥ・ワン マーケティング。
  5. 大規模な情報蓄積と管理

などの展開が実現されることとなろう。すなわち、私のこの文章も、皆様が自由に見方を変えたり、編集したりすることができるようになることを意味する。(著作権等の問題は別として)

HTML、PDFの普及と展開とは別な意味において、XMLはWEBの更なる発展の土壌を与えつつあると考えるところである。

執筆 菊田昌弘(前代表取締役)