データを誰でも使え、どれだけ貯めても使えるように
橋本氏は、2002年に東工大博士(工学)課程を終了後、東工大助手/特任准教授を10年間務め、2012年にグリーに入社した。「教員で働いていても面白くない」と思ったのがきっかけという。専門は、自然言語処理、情報検索、データマイニング、機械学習だ。
グリーではゲームのデータ分析基盤の開発を担当。同社ではゲームデータの分析を従来から行っていたが、人員やサービスの拡大にともなって、生データを直接さわりたいというニーズが増えてきた。ディレクターが生データをバッチ処理して運用するのはさすがに難しかったため、分析チーム側で要望を聞いてそれを基盤に実装していたが、要望が多くなるにつれ、負担も拡大していた。そこで、データ分析基盤を再構築することになったという。
「コンセプトは、誰でも自由にデータにアクセスできるようにするというAccessibilityと、どれだけ貯めこんでもスケールできるというScalabilityの2つ。従来の基盤を破棄するのではなく、そのまま運営しながらプラスアルファすることで、この2つを実現してくことをめざした」(同氏)
データ分析基盤は、大きくゲームとGREE Platformの2つに分かれている。上述のとおり、ゲームについてはTreasure Dataのサービスを利用することし、Platformについては、Hadoopをつかって自社開発することを決断した。その理由については、ゲームでは分析で扱うデータがゲームへのアクセスログのなかだけであるのに対し、PlatformではゲームからAPIへのログやユーザー情報などを集約する必要があったためだという。
そのうえで橋本氏は、ゲームとPlatformのそれぞれついて、同社の取り組みを解説した。