業務を通してデータサイエンティストに
DXやデータドリブン経営に注目が集まる中で、企業が直面している課題の一つが専門人材不足だ。特に、社内に蓄積されたデータはもちろん、新しく収集したデータに関しても正しく用い、分析することのできるデータエンジニアやデータサイエンティストといったニーズはますます高まっている。もちろん、簡単に優秀な外部人材が確保できないこともあり、自社の業務に精通している社内人材をデータサイエンティストなどに育てようという動きも見受けられる。
そこで今回は、データ活用の第一歩を踏み出すためのポイントやデータサイエンティストに求められる役割などを、書籍『Pythonで動かして学ぶ!Kaggleデータ分析入門』の著者でもあり、実際に博報堂DYメディアパートナーズでデータサイエンティストとして活躍している篠田裕之氏に尋ねた。
篠田氏は現在、WebアクセスデータやGPS位置情報データ、テレビ視聴ログなど幅広いビッグデータを分析し、メディア効果を最大化するためのソリューション開発やメディアコンテンツ開発などに取り組んでいる。その一方で、本書籍の執筆だけでなく、様々な講演会にも登壇するなど活動の場を広げている。
「大学院までコンピューター・サイエンスが専攻だったこともありプログラミングの知識はありましたが、アプリケーション開発がメインで、何かを予測するためのデータ分析はあまり経験がありませんでした。プログラミング言語は、現在データ分析で主に使用しているPythonではなく、当時はJavaやC++を使っていて、就職を機に業務を通してデータ分析やPythonを学んできました」と篠田氏。
データ分析を専門にしようと最初から考えていなかったという同氏が、就職活動の際に興味をもったのが広告会社だった。2006年当時はフラッシュ全盛期ともいえる時代であり、ウェブ広告やキャンペーンサイトも静的なものだけでなく、インタラクティブなものが増えていった時期でもあった。元々学生時代に美術部に所属して絵を描いたり、演劇部の宣伝美術をやっていたりした経験もあり自身が好きな表現と、大学で学んだアプリケーション開発スキルを活かすことのできる環境を探して現職に就いたという。
とはいえ、入社後は思い描いていたような表現に関わる業務ではなく、ウェブ広告の施行結果を分析し、翌週以降の掲載面や広告クリエイティブに反映させていく運用型広告業務がメインだった。しかし、篠田氏は「この経験が今のキャリアにとって、非常に重要だったと思っています。ビジネスとして成立させることやスケジュール通りに案件を進行して成果を出すこと、そのための分析スキルなど、現在の業務のベースになることはここで経験しました」と述べる。
たとえば、広告のA/Bテストにおける有意差検定のために統計学を学びなおしたり、アトリビューション分析が盛んになったときには、膨大なデータを解析するためにSQLを復習したりと、業務を通してデータサイエンティストの基礎を養うことができたという。また、入社当初やりたかった表現に関する業務について携わる機会を得たときは、データビジュアライズに必要なthree.js、Unity、Blenderなどの表現系のツール・プログラミングを自主的に学んだとした。
「私が入社したときは、アドテクノロジーは黎明期でした。その後、DSPやDMPなどWeb広告が進化していくタイミングで現場にいれたのは幸運でした。そして、最初からデータサイエンティストを目指していたというよりは、業務を通してデータサイエンスと呼ばれる領域も好きだということに気づいていき、少しずつ近づいていったのだと思います」(篠田氏)
そうして、データサイエンティストという役割が国内でも浸透してくると、篠田氏もデータサイエンティストとしてセミナーなどに登壇するなど活躍していくが、その一方で若干のジレンマも抱えているという。篠田氏は、「元々、名刺上はメディアビジネスプロデューサーという肩書だったのですが、テレビのプロデューサーや営業職に近い印象を与えてしまうと考え、データサイエンティストを名乗るようにしています。一方で、自身の強みはメディアプランニングやコンテンツ開発に近い領域だと思っているので、世間一般のデータサイエンティストの方々と少し異なる部分もあり、新しいハイブリッドな言葉が見つけられたと考えています」と述べる。
そのため現在は、データサイエンティストという言葉の持つイメージに引っ張られ過ぎないような取り組みも増やしており、データサイエンティストのイメージを広げていきたいとした。