データの前処理はデータ分析における長年の課題
──はじめに、truestarと藤さんについて紹介をお願いします。
truestarで代表取締役社長をしております、藤 俊久仁です。truestarは、データ分析やデータ可視化に関するコンサルティングやエンジニアリングを得意としており、既に10年以上の実績があります。実は、2019年に共著で『データビジュアライゼーションの教科書』(秀和システム)を執筆しており、効率的かつ効果的に仕事をすることにこだわりをもっています。
──「Data for Good」受賞おめでとうございます。まずは、率直な感想をお聞かせください。
今回、受賞理由にも挙がっている「Prepper Open Data Bank」は、加工済みのオープンデータを無償共有しているものです。コロナ禍で会社として苦しい時期に取り組み始めたのですが、無償提供していることもあり開発メンバーたちは、ちょっと肩身の狭い思いをしていた部分もありました。その中で、こうしたアワードをいただけることは、本取り組みにおける社会的価値を外部から認めていただいたことでもあるため、メンバーの努力が報われることになりました。非常にありがたいと感じています。
──メンバー皆さまの反応はいかがでしたか?
受賞を社内ツールで共有したのですが、ハートマークをたくさん貰いましたね。ここで、たくさんのコメントを出せればよかったのですが、コメントをする性格のメンバーが少なく…(笑)。
──ありがとうございます(笑)。「Prepper Open Data Bank」について、改めて教えていただけますか。
「Prepper Open Data Bank」における一番の特徴は、データ分析の作業を「超時短」できることです。データ分析では事前にデータを探す、ダウンロードする、加工する、保管する、更新するといった作業が必ず発生します。しかし、本サービスを使うことで、いきなりデータを分析できるようになります。データ分析を一度でも経験した人ならば、時間を短縮できる価値がすぐにわかると思います。
──前処理は、データ分析における長年の課題だとか。
私自身、20年近くデータ分析に携わってきていますが、データ分析における“前処理の課題”というのは今に始まったものではなく、とても身近な問題です。これまでは、当たり前のように前処理をせざるをえなかったというのが実状です。
一方、ここ数年のうちにデータそのものが充実してきており、データ分析のツールやソリューションも登場したことで、多くの企業で当たり前のようにデータ分析を行えるようになりました。我々は、これまで当たり前だった課題を解決し、多くの日本企業に役立つサービスとして提供しております。データ分析の領域においても何かできないかと思っていたところ、今回のサービスに行き着きました。
かつてはデータを集めるだけで何日もかかることがあったのですが、この苦しさはデータ分析に携わった人しか知らない、わからないという難しい領域です。課題は実在するのに、お金がつかない領域でもあるため、まだまだ認知されていません。
ただ、どのような企業でも同様の問題には直面しますし、(放置すれば)今後広がると考えています。データ分析における前処理がすべて要らなくなることは、とても画期的なことです。
──他にもどのようなメリットがありますか?
データ分析者の時間を有効活用できると考えられます。本来データ分析は、分析した結果をどうビジネスに生かすかというところに時間を使わなくてはいけないのですが、前処理に多大な時間を費やしているのが現状です。しかし、「Prepper Open Data Bank」で提供しているデータなら前処理を終えているので、本来データ分析者がやるべきところに時間を使うことができます。これは、とても大きなメリットだと考えています。
また、データ分析の前処理においては、引き継ぎも課題として挙げられます。データ分析では、ぐちゃぐちゃなデータを試行錯誤して加工していくため、どうしても属人化しがちです。しかし、「Prepper Open Data Bank」のデータなら前処理は終えていますので、複雑な処理の繰り返しや引き継ぎも発生しません。そのため、運用のコストを大きく下げることにもつながります。