ビッグデータ活用のために企業内の情報地図を作れ
「まずはデータとして何があるかを把握する。何がどこにあるのか、何が入っているのかが分からないと始められません。そのためには、データガバナンスが必要です」と言うのは、エンバカデロ・テクノロジーズのエバンジェリスト 高橋智宏氏だ。データガバナンスが求められる背景には、企業内にさまざまなデータベースが存在することを挙げる。
高橋氏は、企業のシステムがサイロ化された「レベル0」の状態では、まずは他人が見て分かるようにすることだと言う。そのためには標準ポリシーを定めて、それに基づいたデータ管理を行う。これが「レベル1」だ。レベル2では、データ管理のメトリックスが整備され、いよいよ組織全体でデータを活用できる。レベル3は、データガバナンスが文化として定着し、データ活用が行える成熟段階であり、ここでビッグデータが扱えるようになると言う。実際には、レベル0と1の間に0.5という準備段階があり、企業内でシステムやデータの管理、共有を行う。このように、真野氏と同様5つのステップがあると言う。
そして、「データガバナンスというのは、メタデータの管理手法であり、データ活用緒基礎。コンプライアンスをもサポートして共有し、その結果として企業は競争力を高めることができる」と高橋氏。データガバナンスは目標であり抽象的なもの。これに対してシステムやデータベース、そこに格納されているデータなどは対象であり具体的なもの。2つの間にはギャップがあり、これらを結び付けるのがアーキテクチャ。このアーキテクチャの部分を提供しているのがエンバカデロ・テクノロジーズだと言う。
目標に進むには詳細な地図が必要、企業内のデータ情報の地図を作ることができるのがER/Studioというツールだ。これを活用することで、データ資産の可視化、ETLの文書化、情報の格納と共有が容易に実現できる。そのためにコンサルタントを雇い、高い費用が発生するものではないと高橋氏は説明する。
ツールは理想と現実のギャップを埋めてくれる
「理想的なデータ活用とは、いろいろな部署が袖手しているデータを、一元的に管理してビジネスニーズに基づいてさまざまなデータソースを使って分析できるようにすること」と言うのは、エンバカデロ・テクノロジーズのシニアエンジニア 米澤 千賀子氏だ。これを実現するためには、データ品質を確保し、システム間の壁を排除する必要がある。そのためには、具体的なデータ管理の仕組みと基盤がいると説明する。
一口にデータ管理と言っても、ハードウェア、ストレージ、障害からの復旧、セキュリティなどさまざまな要素がある。理想はシステム間の壁がなく、統一されたデータベースがあり、欲しいデータがすぐに取り出せる状況。現実は、部門ごとに壁があり、レスポンスの遅いシステムがある。「ハードウェアの更新やメモリを増やしてレスポンスを改善するという方法もあるが、問題の根本的な解決にはなりません。ハードウェアによる力業は、システムの肥大化につながります」と指摘する。
そして、理想のためにはツールを使うのが早道だと言う。一元管理のためにベンダーの異なる複数のデータベースを、エンバカデロ・テクノロジーが提供する1つのツールで管理できる。その他にもレスポンス改善につながる負荷テストやSQLチューニングなどもDB Optimizerがあれば1つのツールで容易に管理可能。データベースのベンダーごとに異なる管理ツールの使い方を憶え、複数のツールを使いこなす必要はなくなる。
「ツールは、理想と現実のギャップを埋めるためのもの。ツールを使って効率をアップし、基盤をがっちりと管理して今後のクラウドへの対応やビッグデータの活用に向かっていくことが大事」と米澤氏。ツールを使いこなすことで、ビッグデータの活用に大きく踏み出すことができる。ビッグデータ活用へのアプローチは、どうしてもすぐにデータの規模やバラエティ、さらには高度な統計分析という話題になりがちだ。とはいえ、その前にやるべきは、企業全体のデータガバナンスであり、データマネージメント。それが結局は、ビッグデータ活用成功への近道になりそうだ。
本セミナーのPDF資料が、こちらからダウンロードいただけます。