定着しない全社レベルでのデータ活用
データウェアハウスを構築し、BIツールでデータを可視化できている企業は少なくない。しかし、見られるデータは1週間前や1ヵ月前の集計データで、過去の結果しか得られないことがほとんどだろう。ビジネス環境の変化は激しく、小売業などでは1日前のデータでさえ使い物にならないとも言われる。なるべく新しいデータを見たいとのニーズが現場にあっても、それにどうすれば応えられるかがIT部門ではわからない。
企業がデータウェアハウスやBIツールを導入していても、全社規模でデータ活用ができていない理由の一つは、十分な処理性能が得られないことにある。性能が足りないために、レポート画面などを立ち上げても見たいデータがすぐには見られない。また、データ活用のためにデータウェアハウスを構築したはずが、データを集めてためることに注力してしまい、いつのまにか大規模データウェアハウスの構築が目的になっていることもある。集めることに注力すると、性能確保が二の次になる。せっかくデータを集めても、データウェアハウスが遅ければユーザーは使わないのだ。
特に現場では新たな課題解決のために、新しいレポートが見たくなる。そのためにデータを追加して欲しいとIT部門に依頼しても、多くの場合はかなりの時間を要してしまう。なぜなら、IT部門は他にもセキュリティ対策などやるべきことがたくさんあり、忙しすぎてなかなか手が回らないからだ。しかし、IT部門の対応が遅ければ現場は諦め、やはり使われないデータウェアハウスができあがる。現場とIT部門の乖離も、データ活用がなかなか定着しない理由の1つといえる。
データマートレスがこれからのデータ活用基盤の新しいデザイン
全社レベルでデータ活用する文化の定着に至らない状況を、どう打破すれば良いのか。「最も大事なのはデータベースの性能です」と言うのは、SAPジャパン株式会社 プラットフォーム & テクノロジー事業本部 SAP HANA CoE シニアディレクターの椛田后一氏だ。「何か疑問があって、それを解決するためにデータを見ようとした際に、瞬時に欲しい情報が現れないとユーザーの思考を止めてしまいます。ユーザーの思考を止めないスピードが、データ活用基盤には必要です」と述べる。
データウェアハウスの処理性能不足を補うために、データマートを構築している例がほとんどだろう。部門ごとの要求に応じ、あらかじめ集計したデータのサブセットを持つことでレポート表示の性能などを補う。しかし、データマートにあるのは集計結果だけで明細データがないため、詳細な明細データをさかのぼりながら原因究明をしたくてもできない。また、データマートに新しいデータを追加するのにも手間がかかってしまい、多くの時間を要するのが一般的だろう。さらに、データマートの集計は夜間バッチなどで行われるため、最新のデータでも1日前の集計結果が精一杯だ。過去の集計データしかなければ、今の状況を見て将来を正確に予測しアクションを起こすことはできない。
性能が足りないことから生まれる、これらの課題を解決できるのが、インメモリのデータプラットフォーム「SAP HANA」だ。SAP HANAならば極めて高い処理性能があるため、データマートレスのデータ活用基盤を構築できる。「データマートレスは、データ活用のためのこれからの新しいデザインとなります。SAP HANAならデータマートを作る必要はありません。明細データからオンラインで集計し今のデータを可視化、分析できます」と言う。
データマートレスのメリットは他にもある。部署ごとに用意するデータマートに、重複したデータを持つ必要はなくなる。これにより、全社で常に同じデータを参照でき、企業として整合性のとれたデータをもとに判断ができる。「SAP HANAの場合はOLTP(OnLine Transaction Processing)も高速なので、更新したデータを瞬時にデータウェアハウスに送ることができます。これにより常にデータウェアハウスの鮮度を保てるのです」と椛田氏は言う。
そもそもデータマートを作らないので、データマートを設計し構築する手間からIT部門は解放される。データマートの日々のデータ更新も必要なく、運用管理の手間とコストは大きく削減できる。減らした結果生まれる余裕は、IT部門がより現場の業務を理解し、どうやってデータ活用をすれば良いかを現場と一緒に取り組むのに使える。
インメモリでカラム型のアーキテクチャはチューニングいらず
なぜSAP HANAには、データマートを必要としない高い性能があるのか。その大きな理由がインメモリデータベースにある。多くのデータベースがインメモリの機能を有しているが、HANAはすべてのデータがメモリ上にあるため高速だ。その上で1回の命令で複数データを一括処理できるSIMD(Single Instruction Multiple Data)など、CPUの最新テクノロジーも活用する。他にも複数スレッドでの並列処理など、ハードウェア性能を最大限に引き出せる。
アーキテクチャ面でも、データ分析処理に適したカラム型でデータを格納し、これが全件検索などの高速処理に大きく貢献する。カラム型は圧縮効率も高いため、大規模データの扱いにも有利だ。カラム型はOLTPの処理が苦手と言われてきたが、HANAはトランザクション発生段階では一旦、更新用バッファーに格納するため、OLTPの処理も効率的に行える。結果的にOLAP(OnLine Analytical Processing)もOLTPも高速に処理できるデータプラットフォームとなっているのだ。極めて高い処理性能は、データベース管理者をチューニング作業から解放する。集計処理などを高速化するためのインデックス作成や更新も必要ない。
このSAP HANAを使い大規模データウェアハウスを構築しているのが、NTTドコモだ。通信キャリアとして莫大なデータを扱う同社は、極めてたくさんのデータマートを作り運用していた。特にデータマートの設計、開発、運用には、多大な時間と手間がかかる。ビジネス部門からデータマートを変更するリクエストが来ても、対応には早くて2週間、時間がかかる場合は3ヵ月から6ヵ月もの時間を要したという。
そこでデータウェアハウスをSAP HANAで構築し直し、データマートレスの構成に移行した。これにより、必要なデータはすべてデータウェアハウスにある状態となり、現場担当者がセルフサービスで見たい形のレポートを作りデータ分析できるようになった。チューニングやデータマート運用の手間もなくなり、IT部門担当者に生まれた余裕は、NTTドコモにおける全社レベルでのデータ活用文化定着のために使えるようになっている。「データマートレス化でデータ活用の定着化を図っているNTTドコモの事例は、データドリブン経営を目指す企業にとって大いに参考となるでしょう。これもHANAで構築した、高性能なデータ活用基盤があったからこそ実現できたことです」と椛田氏は言う。
また、イオングループの事例では、在庫、売り上げのデータを1時間ごとにSAP HANAに取り込むことで、ニア・リアルタイムなデータを可視化し受発注や店舗運営の判断に使っている。「今後はもっと短いサイクルでデータを取り込むことも検討しており、よりリアルタイムに近いデータで、正確な判断をしようとしています。これも、データマートレスなSAP HANAだからこそ実現できていることです」と椛田氏。高性能なデータ活用プラットフォームが、現場オペレーションの変革を起こしているのだ。
まずは、データマートレスの高速なデータ活用基盤から始める
コロナ禍の影響でデジタル化が進んでおり、多様なデータが使われるようになっている。IoTのセンサーから得られるデータなども今後は活用し、不確定な時代にデータドリブン経営ができるようにしたいとのニーズも増えている。次々と増えるIoTから得られるようなデータすべてを、HANAのインメモリに載せるとなればコストは大きくなるかもしれない。また、直近のデータの利用頻度は高いかもしれないが、古いデータはそれほど利用しない。データがどんどん増える中で、利用頻度が低く古いデータも含めHANAのインメモリに蓄積するのは効率が悪い。
HANAには、データを利用頻度に応じ階層管理する機能がある。高速処理したい直近のデータだけをHANAのインメモリに置き、それ以外のデータはディスクに配置したり、それぞれのデータソースのデータベースや、膨大なデータを安価に格納できる別のデータベースに格納しておく。HANAにないデータは、仮想的に統合されHANAのテーブルにあるように見える。ユーザーからは、HANAのインメモリのデータも他の場所のデータも、シームレスに統合して分析できるのだ。この機能を使えば、外部のSNSのデータやIoTの非構造化データなども、物理的に1ヵ所に集めずとも仮想的に統合して分析にすぐに活用できる。
とはいえ、まずは既存のシステムから得られるビジネスデータを、データマートレスで高速に扱えるようにするべきだと椛田氏は言う。それを実現してデータ分析を始めれば、さらなる可視化の要求や、深い分析が行いたくなる。そこまでくれば、新たに活用したいデータも明確化してくるはずだ。そのステップを踏まずに、とにかく様々なデータを集めてしまうと、大規模データを溜め込むだけのデータウェアハウスやデータレイクを作ることになりかねないのだ。「慌てることはありません、それぞれの企業のペースでデータを集め、高速に処理できる環境を作れば良いのです。様々なデータを追加し活用することは、後からでも十分間に合います」と椛田氏は言う。
データを可視化し、分析して行動を変える。それができれば、自ずと次のステップで欲しいデータが見えてくる。そのデータを取り込んで高速に分析するテクノロジーは既にSAPが用意している。まずは、SAP HANAでデータマートレスのデータ活用基盤を構築すれば、それぞれの企業の要件に応じアジャイル的にデータを追加し拡張していくことは容易だ。
データマートレスを実感できるキャンペーン
データマートレスの有用性をにわかには信じられないかもしれない。そこでSAPでは、「SAPマートレスチャレンジ」というキャンペーンを展開している。これはクラウド上のSAP HANAを使い、自社のデータウェアハウスのデータなどを取り込んで、データマートレスを実感するプログラムだ。クラウド上のHANAを使うサーバーの導入やデータベース管理者は必要ない。「SQLが使えれば、すぐに利用できるはずです。データマートレスの環境を構築し試すには、恐らく一週間もあれば十分でしょう」と椛田氏。手間がかかる場合はSAPやパートナーの支援も受けられる。
今回は試してみるだけでなく、構築したデータマートレス環境のレポートを応募することで、アワードも実施している。「副賞で豪華景品も用意しており、実際に手を動かすエンジニアにも参加メリットが出るようにしています」と述べる。既にいくつかの企業が、キャンペーンに参加しデータマートレスを体験している。データマートレスが机上のマーケティング的な言葉ではなく、実際にメリットがあることを是非とも実感して欲しいと、椛田氏は改めて強調するのだった。
SAPマートレスチャレンジ開催
- 参加登録受付期間:2020年10月14日(水)~2021年2月28日(日)
- チャレンジ実施期間:2020年10月14日(水)~2021年3月31日(水)