インメモリでカラム型のアーキテクチャはチューニングいらず
なぜSAP HANAには、データマートを必要としない高い性能があるのか。その大きな理由がインメモリデータベースにある。多くのデータベースがインメモリの機能を有しているが、HANAはすべてのデータがメモリ上にあるため高速だ。その上で1回の命令で複数データを一括処理できるSIMD(Single Instruction Multiple Data)など、CPUの最新テクノロジーも活用する。他にも複数スレッドでの並列処理など、ハードウェア性能を最大限に引き出せる。
アーキテクチャ面でも、データ分析処理に適したカラム型でデータを格納し、これが全件検索などの高速処理に大きく貢献する。カラム型は圧縮効率も高いため、大規模データの扱いにも有利だ。カラム型はOLTPの処理が苦手と言われてきたが、HANAはトランザクション発生段階では一旦、更新用バッファーに格納するため、OLTPの処理も効率的に行える。結果的にOLAP(OnLine Analytical Processing)もOLTPも高速に処理できるデータプラットフォームとなっているのだ。極めて高い処理性能は、データベース管理者をチューニング作業から解放する。集計処理などを高速化するためのインデックス作成や更新も必要ない。
このSAP HANAを使い大規模データウェアハウスを構築しているのが、NTTドコモだ。通信キャリアとして莫大なデータを扱う同社は、極めてたくさんのデータマートを作り運用していた。特にデータマートの設計、開発、運用には、多大な時間と手間がかかる。ビジネス部門からデータマートを変更するリクエストが来ても、対応には早くて2週間、時間がかかる場合は3ヵ月から6ヵ月もの時間を要したという。
そこでデータウェアハウスをSAP HANAで構築し直し、データマートレスの構成に移行した。これにより、必要なデータはすべてデータウェアハウスにある状態となり、現場担当者がセルフサービスで見たい形のレポートを作りデータ分析できるようになった。チューニングやデータマート運用の手間もなくなり、IT部門担当者に生まれた余裕は、NTTドコモにおける全社レベルでのデータ活用文化定着のために使えるようになっている。「データマートレス化でデータ活用の定着化を図っているNTTドコモの事例は、データドリブン経営を目指す企業にとって大いに参考となるでしょう。これもHANAで構築した、高性能なデータ活用基盤があったからこそ実現できたことです」と椛田氏は言う。
また、イオングループの事例では、在庫、売り上げのデータを1時間ごとにSAP HANAに取り込むことで、ニア・リアルタイムなデータを可視化し受発注や店舗運営の判断に使っている。「今後はもっと短いサイクルでデータを取り込むことも検討しており、よりリアルタイムに近いデータで、正確な判断をしようとしています。これも、データマートレスなSAP HANAだからこそ実現できていることです」と椛田氏。高性能なデータ活用プラットフォームが、現場オペレーションの変革を起こしているのだ。