「コンテンツ」とは何か
英和辞典で「Content(コンテンツ)」の意味を調べてみると、「中身」や「内容物」という訳語が出てきますが、IT用語の「コンテンツ」は、電子ファイルで管理される情報全般を意味します。PDFやエクセルシート、パワーポイント、図面、画像、動画など、皆さんも日々の業務で扱っていると思いますが、それらはすべて「コンテンツ」なのです。
では、なぜ「ファイル」と呼ばずに抽象度の高い「コンテンツ」という言葉を使っているのか。それは、複数の電子ファイルの組み合わせで1つの「コンテンツ」を生成するというケースがあるからです。たとえば、Webページを直接的に表現しているのはHTMLファイルですが、そのページ上で使用される画像ファイルやスタイルシート(CSSファイル)などと組み合わせることで、1つの「Webコンテンツ」が成り立ちます。
また、コンテンツは「非構造化データ」と表現されることもあります。この言葉は、データベースの「テーブル(表)」で管理できる「構造化データ」と対照的な位置づけにある「情報」としてコンテンツを表現する際に使われます。いずれにしても、コンテンツという言葉の厳密な定義などはあまり追及する必要はなく、一旦は「電子ファイル」のことだと思っていただければ問題ありません。
ちなみに企業が持つ情報の2割は「構造化データ」であり、残りの8割は「コンテンツ」であるとも言われています。この割合は、計算根拠が明示されているわけではなく、やや都市伝説的な側面もあるのですが……皆さんが仕事上で扱っている情報が「データ」なのか?「コンテンツ」なのか?と改めて考えていただくと、この「二八ルール」もあながち間違いではないと感じられるかと思います。
ECMはファイルサーバーと何が違ったのか?
「コンテンツ管理」という言葉が多くの人に知られることになったきっかけとしては、2005年にAIIM(Association for Information and Image Management)が定義した「エンタープライズコンテンツ管理(Enterprise Content Management)」という言葉が挙げられるかと思います。ソフトウェアの世界に「ECM」という新しいカテゴリーが誕生し、Documentum、OpenText、Stellent、FileNetなどのベンダーが脚光を浴びたのがこの時代です。ECMが先進的だったのは「コンテンツセントリック」という思想です。たとえば、下図2の左側にあるような業務システムの環境があったとします。契約管理システムは「契約」単位で情報を管理しているので「契約セントリック」な情報の持ち方となります。つまり、顧客情報やコンテンツは1つの「契約」にぶら下がるサブ情報となるわけです。案件管理や稟議など、他システムでも同様の情報管理となっており、全体を俯瞰すると顧客情報やコンテンツが重複管理となっていることがわかります。
そこで、顧客情報を一元管理するべく世に出てきたソリューションがMDM(マスタデータ管理)やCRM(顧客情報管理)などですが、同様にコンテンツも一元管理するべきという発想が生まれ、ECMが登場しました。コンテンツにIDを割り当てて一意に識別できるようにすることで、契約管理、案件管理、稟議などの業務システム側ではコンテンツの原本を持たずにIDだけで管理できるようになりました。また、ECM側で「契約番号」「案件番号」「稟議番号」などを「メタデータ(属性情報)」として保持させることで、ECMを起点にした情報の逆引きも可能になりました。このコンテンツの重複を排除した、コンテンツ中心の考え方が「コンテンツセントリック」であり、単なるファイル置き場であるファイルサーバーとの大きな相違点でした。