塩野義製薬の次世代型データマネジメントの方法とは
「SHIONOGI における次世代データマネジメント」と題した講演に登壇した雑賀氏は、塩野義製薬(以降、塩野義)のデータマネジメント基盤の紹介から説明を始めた。塩野義のデータ基盤はCDM(Central Data Management)と呼ばれるもので、その役割は大きく2つある。
1つは、各種ビジネスアプリケーションのデータ連携における収集と配信のためのデータハブだ。そしてもう1つが、分析や解析のためにデータを活用しやすい形で準備しておくデータウェアハウスになる。雑賀氏は「塩野義のデータマネジメントは、ニーズを先取りし、かつ能動的であること。そして中央集権型を脱却し、分散型のデータコミュニティを形成することを重視しています」と説明した。
連携と分析:データハブとデータウェアハウス
能動的なデータマネジメントを重視するのは、ビジネス側ではデータ二次利用の有用性に気づきにくい点を考慮してのことだ。ビジネス側では社内外全体のデータを俯瞰的に見る視点を持つことが難しい。そこをサポートするのがデータマネージャーである。一般的なデータマネージャーの仕事は、データの収集から、分析担当者が扱いやすい形式に整え、データウェアハウスに蓄積するところまでだ。しかし塩野義の場合は違う。「一般的なデータマネージャーと塩野義のデータマネージャーをあえて区別するならば、ライブラリアンとキュレーターの違いに似ています」と雑賀氏は説明する。塩野義のデータマネージャーは、自らがデータニーズを発掘し、企画提案を行い、川下のエンドユーザーが知見を得てビジネス価値を引き出すまでの一連のプロセスを支援する。
データの「正しさ」を担保する分散型データコミュニティ
その支援で必要な仕組みがデータ基盤である。塩野義の場合、正確で信頼性の高いデータを集め、タイムリーに正しく利用できるよう、分散型データコミュニティを運営している。ここでの「正しい」には、単に誤ったデータを収集しないのみならず、個人情報保護法に代表されるコンプライアンス対応に則した正しさの意味も込められている。スキルの高い分析担当者ほど、既知のデータだけで何とかしようと考える傾向があるが、作業の遠回りを避けるためにも、塩野義のデータマネージャーは目的に最も合致したデータと扱う方法を提案することに注力している。さらに、ビジネス側が取り組むビジネス課題に対し、データから導き出した仮説を提案することまでもが求められているという。