データドリブンな意思決定のためクラウド型DWH導入を検討
戸辺氏がノバセルに入社したのは、テレビCMの効果測定を可能にする「ノバセルアナリティクス」がリリースされてから半年ほど経った2020年9月のことだった。当時のノバセルでは、データに基づいた意思決定をしていく雰囲気は醸成されていたものの、データ利活用に関する指針が何も定まっていない、言わば曖昧な状況であった。これに対して戸辺氏は「私は完全に振り切ったほうがよいと考え、『データドリブンな意思決定をしていく』と明確に打ち出しました」と語る。
当時のノバセルのデータ基盤は、トランザクション処理や分析処理を一つのリレーショナルデータベースで対処していた。分析処理に関しては社内分析だけでなく、社外ユーザーにプロダクトとして解放していたこともあり、双方に悪影響を及ぼし合う可能性があったという。「ユーザー様にパフォーマンスの悪いサービスを提供する恐れがありましたし、何より自分たちがやりたいことを実現できるだけの基盤が整っていませんでした」と戸辺氏。そこで手始めに、クラウド型のデータウェアハウス(DWH)導入検討を始めた。
戸辺氏はこの取り組みについて、前職時代の経験を振り返る。前職でもDWHを利用していたが、エンジニアリングの知識や製品そのものの知識が必要になるという課題に直面していたという。ただクエリを発行したいだけの利用者にとって負荷が高すぎたのだ。その後、他社製品への移行も検討したが、既に作り込まれてしまっている状態だったため移行は困難を極めた。
2019年の冬ごろ、戸辺氏は海外にいた知人から気になる話を聞く。「『Snowflake』というクラウド型DWHがあり、大手クラウドベンダーからのリプレイスが進んでいる」というのだ。実際に戸辺氏もSnowflakeを見てみたところ、即座に良い感触を得ることができたと振り返る。しかしながら、当時は前述した状況を鑑みて採用には至らず、それ以来Snowflakeのことを気にかけていたという。
コストや生産性などの課題、なぜ解決できたのか
前述した背景もあり戸辺氏はノバセルのデータ基盤構築にあたり、ずっと気にかけていたSnowflakeを採用することに。導入のメリットとして戸辺氏は、「私が他社DWHに感じていた課題の多くを改善できるところです」と話す。
たとえば、あるクラウド型DWHは常時稼働のインスタンスで、クエリ発行のたびに課金されないため費用を予測しやすいというメリットをもっている。その一方で、誰も使っていない深夜にも稼働することになるため費用がかさんでしまう。
また、前述したような技術知識面でのハードルもあるだけでなく、テスト環境構築も簡単ではない。本番時とまったく同じデータセットをコピーして動作確認をしなくてはならず、データがテラバイト級以上の大規模なものになると非常に困難だ。戸辺氏は「大規模データをコピーすること自体が相当なストレスですし、コピー中にオリジナルに変更があった際、同様の結果が得られる保証はありません」と話した。
一方Snowflakeには、データのコピーを行わなくてもテストを行える「ゼロコピークローン」機能がある。そのため、テストデータ作成時のストレスが軽減されるという。これまでテスト環境を構築するために時間を取られていたこともあり「大幅に生産性を改善できると考えていました。実際にPoCでも、それを確認することができましたね」(戸辺氏)。
そして、戸辺氏がSnowflakeの導入を決定したもう一つの決め手が、クエリ実行単位で過去のデータにさかのぼれる「Time Travel」機能である。データが破損したときの復旧は難易度が高い作業の一つだが、Time Travel機能を使えば安全に適切な時点まで復旧できるうえに、過去データやテーブルを時系列で比較できるという。
とはいえ、こうした機能まで使いこなすことは難しそうにも見えるが、「Snowflakeはフルマネージドのため、初めて触れる人でも悩むことなく利用できています。リプレイスではなく新規導入だったというところも大きかったと思います」と戸辺氏。
部門ごとに閉じてサイロ化していたデータは、SaaSで利用しているデータなども含めてSnowflakeに格納。これにより、Snowflakeに集約すれば社内の様々なデータと連携ができる、利便性の高い環境ができあがった。戸辺氏は「使い勝手の良さもあり、すんなりとSnowflakeが社内に受け入れられました」と語った。
データシェアリングなど新規ビジネス創出へ
こうしたSnowflakeの活用推進が反響を呼び、2022年「Snowflake Data Drivers Awards」における「Powered by」というアワードを受賞した。同アワードは、Snowflakeを活用して様々な角度からユーザーが求めるデータを探索できるアプリケーションを開発。さらに、データシェアリングにより、パートナー企業がデータを活用できるエコシステムを構築することで、Snowflakeの提言する“データクラウド”の世界を体現したことで贈られている。戸辺氏は、「素直に嬉しいと感じました」と笑顔で話すと、受賞を喜ぶチームメンバーも多かったとして、「イベントにも足を運ぶくらいSnowflakeが好きなメンバーもいて、大変喜んでいます」と語る。受賞は、技術的な取り組みが対外的な評価を得られたという点でも社内のエンジニアにとって大きな意味があったようだ。
Snowflakeの今後の活用について戸辺氏は、トランザクション処理と分析処理を同じ環境で実行できる「ユニストア」に関心をもっているとして、「ETL処理のような、今私たちがコードを書いて実装しているもの自体を減らすことができれば生産性が上がり、プロダクトの可用性も広がると考えています」と次の目標を見据える。
また、Snowflake上にデータアプリケーションを構築すれば、現在サーバーサイドで実装されているテレビCMの効果を算出するアルゴリズムをSnowflakeに実装し、社内の分析チームがBIツールから直接参照できるようになる。「これをデータシェアリングのような形でSaaSやアプリケーションとして外部の企業にも有償提供できるようになると思っています」と戸辺氏。ノバセルが持つノウハウとデータを組み合わせ、新たな価値を創出しようと動き出している。