コストや生産性などの課題、なぜ解決できたのか
前述した背景もあり戸辺氏はノバセルのデータ基盤構築にあたり、ずっと気にかけていたSnowflakeを採用することに。導入のメリットとして戸辺氏は、「私が他社DWHに感じていた課題の多くを改善できるところです」と話す。
たとえば、あるクラウド型DWHは常時稼働のインスタンスで、クエリ発行のたびに課金されないため費用を予測しやすいというメリットをもっている。その一方で、誰も使っていない深夜にも稼働することになるため費用がかさんでしまう。
また、前述したような技術知識面でのハードルもあるだけでなく、テスト環境構築も簡単ではない。本番時とまったく同じデータセットをコピーして動作確認をしなくてはならず、データがテラバイト級以上の大規模なものになると非常に困難だ。戸辺氏は「大規模データをコピーすること自体が相当なストレスですし、コピー中にオリジナルに変更があった際、同様の結果が得られる保証はありません」と話した。
一方Snowflakeには、データのコピーを行わなくてもテストを行える「ゼロコピークローン」機能がある。そのため、テストデータ作成時のストレスが軽減されるという。これまでテスト環境を構築するために時間を取られていたこともあり「大幅に生産性を改善できると考えていました。実際にPoCでも、それを確認することができましたね」(戸辺氏)。
そして、戸辺氏がSnowflakeの導入を決定したもう一つの決め手が、クエリ実行単位で過去のデータにさかのぼれる「Time Travel」機能である。データが破損したときの復旧は難易度が高い作業の一つだが、Time Travel機能を使えば安全に適切な時点まで復旧できるうえに、過去データやテーブルを時系列で比較できるという。
とはいえ、こうした機能まで使いこなすことは難しそうにも見えるが、「Snowflakeはフルマネージドのため、初めて触れる人でも悩むことなく利用できています。リプレイスではなく新規導入だったというところも大きかったと思います」と戸辺氏。
部門ごとに閉じてサイロ化していたデータは、SaaSで利用しているデータなども含めてSnowflakeに格納。これにより、Snowflakeに集約すれば社内の様々なデータと連携ができる、利便性の高い環境ができあがった。戸辺氏は「使い勝手の良さもあり、すんなりとSnowflakeが社内に受け入れられました」と語った。
データシェアリングなど新規ビジネス創出へ
こうしたSnowflakeの活用推進が反響を呼び、2022年「Snowflake Data Drivers Awards」における「Powered by」というアワードを受賞した。同アワードは、Snowflakeを活用して様々な角度からユーザーが求めるデータを探索できるアプリケーションを開発。さらに、データシェアリングにより、パートナー企業がデータを活用できるエコシステムを構築することで、Snowflakeの提言する“データクラウド”の世界を体現したことで贈られている。戸辺氏は、「素直に嬉しいと感じました」と笑顔で話すと、受賞を喜ぶチームメンバーも多かったとして、「イベントにも足を運ぶくらいSnowflakeが好きなメンバーもいて、大変喜んでいます」と語る。受賞は、技術的な取り組みが対外的な評価を得られたという点でも社内のエンジニアにとって大きな意味があったようだ。
Snowflakeの今後の活用について戸辺氏は、トランザクション処理と分析処理を同じ環境で実行できる「ユニストア」に関心をもっているとして、「ETL処理のような、今私たちがコードを書いて実装しているもの自体を減らすことができれば生産性が上がり、プロダクトの可用性も広がると考えています」と次の目標を見据える。
また、Snowflake上にデータアプリケーションを構築すれば、現在サーバーサイドで実装されているテレビCMの効果を算出するアルゴリズムをSnowflakeに実装し、社内の分析チームがBIツールから直接参照できるようになる。「これをデータシェアリングのような形でSaaSやアプリケーションとして外部の企業にも有償提供できるようになると思っています」と戸辺氏。ノバセルが持つノウハウとデータを組み合わせ、新たな価値を創出しようと動き出している。