柔軟で安定性のあるデータ分析環境を、Hadoop技術を採用し、構築
DNPは価値観マーケティングを使ったサービス「カスタマーフォーカスマーケティング」を2012年から提供している。このサービスの裏側では、当然ながら膨大なデータ分析が行われる。そして、単にビッグデータ分析を行うだけでなく、さまざまな形で顧客企業に分析結果を提供する必要もある。このサービスだけでなく生活者に関わるデータをさらに収集してビジネスを展開するには、拡張性があり安定した高速データ分析基盤が必要だった。そのため、DNPでは新たなデータ分析基盤の構築を開始する。
「データが増えていくので、クラウドを使う案もありました。けれども価値観マーケティングでは、個人に関わるデータも扱います。DNPには“個人情報は社内に持つ”という規定もあり、オンプレミスでデータ分析基盤を構築することにしました」と語るのは、ABセンター 第2本部 生活者情報ビジネス開発ユニット データマネジメント開発室 室長の村上晶子氏。さらに顧客のデータを預かって分析することもあるので、顧客ごとに確実に分離できるマルチテナント性の確保も重要だったという。
DNPではもともと、データ分析ツールとして「IBM SPSS」を活用してきた。さらにSPSSでビッグデータを高速に分析するために「IBM PureData System for Analytics」とも組み合わせてきた。これらにより、まずは「蓄積してきた構造化データを中心としたデータを、分析者自らが、必要なビューで分析を行うことができる環境を整備しました」と村上氏。

大日本印刷株式会社 ABセンター 第2本部
生活者情報ビジネス開発ユニット データマネジメント開発室 室長
村上 晶子氏
しかし、より高度な生活者情報分析のためには、これまでの構造化データのみではなく、SNSやモバイル端末から取り込まれる各種非構造化データと連携した分析や、さらなる柔軟な分析レポートに対するニーズが出てくると考えた。また、扱うデータ量も大幅に増加していくと予想されることなどを総合的に検討した結果、新たにHadoop環境の導入を決めたという。「これまで活用してきた分析ツールであるSPSSから透過的にHadoopのデータにアクセスできる環境を整えることで、分析者がこれまで培ってきたノウハウを活かしながら、より柔軟かつ高速な処理を実現できる、まさに求めている環境が構築できると考えました」と村上氏。