適切なオープンデータが普及する日を目指して
──オープンデータを加工して共有することの意義はどこにありますか?
オープンデータのほとんどが「オープンにすること」が目的化してしまい、その先の利活用にあまり目が向いていないと思います。つまり、ユーザーからすると使いづらいのです。本来、オープンデータは利用価値が高いはずなのに、共有方法があまりよくないため、データの価値が十分に発揮できていないのが実状だと思います。
現在、「データは21世紀の石油」といわれています。オープンデータも原油のようなものです。精製しないと使えず、せっかくの資源が有効活用できていません。データの使い勝手が向上し、利用者が増えればネットワーク効果でオープンデータの質と量も向上するのではないかと期待しています。
昨年には、気象庁の気象データも公開しました。今後も引き続き、利用者が多く、データ分析に活用しやすいデータのラインアップを増やしていこうと考えています。また、2021年11月30日に総務省統計局より「令和2年国勢調査 人口等基本集計」が公表されたように、既に共有済みのデータ更新も行っていく必要があります。今後は、時系列での分析がしやすくなる環境も整えていきたいと考えています。
現状は、オープンデータの使い勝手がよくないために加工して提供しているのですが、データ所有元が使い勝手のよい形で、簡単にアクセス可能な場所で共有してくれれば「Prepper Open Data Bank」は、お役御免になります。その日が来ることを信じつつ、それまではデータ分析者を下支えするオープンデータ基盤になれるように環境整備に努めたいと思います。
──データ共有の場として、「Snowflake データマーケットプレイス」を選ばれていますね。
最初は自前で共有しようと考えました。そうすると、自分たちで基盤を構築/運用しなくてはなりませんし、コストもかかります。どうしようかと模索していたところ、社内でSnowflakeを紹介してくれた人がいたことがきっかけでした。
調べてみると、Snowflakeにデータ共有に関する機能が十分に備わっており、メンテナンスコストも極めて低い。加えて、特定のクラウドベンダー、特定の分析ツールやソリューションと独立していることが決め手になりました。やはり、ベンダーロックインが起こらないことが重要なポイントだと考えていたので。
Snowflakeなら(ユーザーがクラウドを使うことが前提になるものの)主要クラウドベンダーを選ばずに利用でき、自分たちの環境にデータがあるかのように使えます。どこかから取得して使わなくていけなかったり、アクセスが制限されたりすることもないため、ユーザーにとっても大きなメリットになると思います。
──Snowflakeの使い勝手はどうでしたか?
元々使いやすさが売りだと思いますが、特に引っかかるところなく使えましたね。逆に私たちのほうが機能を知り尽くしていないために「使いこなせていないのでは」と思っているくらいです。また、社内で勉強会を開催したり、有志のユーザーグループで情報共有をしたりしています。とはいえ、習得する以上のスピードで新しい機能が次々に出てきているため、中々追いつけていません(笑)。
そのため、まずはSnowflakeが持つ機能を十分活用できるように知識や技術力を磨いていきたいと思います。サービスの使い勝手が良くなれば、さらにデータが使われるようになり、我々が提供する価値も増えていくと思います。
そして、引き続きSnowflakeには我々も含めたユーザーが驚くような機能を出し続けてほしいと思いますね。日本において、データ分析はまだまだこれからという段階です。この領域を盛り上げ、けん引役になってもらえるといいなと期待しています。
──最後に、御社の展望を教えてください。
メインとしているデータ分析やデータエンジニアリングの領域には取り組み続けていき、データ前処理の領域においては前述した通り、課題が増えていくと踏んでいます。そのため、後方支援できるようなソリューションを提供したいと考えています。
昨今、“データドリブンな意思決定”が話題になっています。我々truestarが黒子として、そうした意思決定を推進し、効率的に行えるような役目を果たしていきたいですね。