データサイエンティストに必要な3つのスキル
田中さんが所属する日立インフォメーションアカデミーは、日立グループ内のIT人財育成専門会社。日立グループの会社に所属する従業員はもちろん、グループ外の一般企業の受講者に対しても広く門戸を開き、ITやビジネスに関する幅広い研修コースを用意している。田中さんはここでデータサイエンティスト育成のための研修コースを担当するとともに、一般社団法人データサイエンティスト協会において、データサイエンティストのスキルセットを定義する取り組みにも参画している。
「もともと『ビッグデータ』や『データサイエンティスト』といった用語は、定義が曖昧なまま長らく使われてきました。そこでデータサイエンティスト協会では、データサイエンティストの定義を明確にするとともに、実際にデータサイエンティストを目指す方々にスキルアップの指針を提示すべく、必要なスキルセットを約1年間かけて定義しました」(田中さん)
このデータサイエンティスト協会の取り組みの成果は、2015年11月に「データサイエンティスト スキルチェックリスト」として公開されているので、データサイエンティストを目指している方はぜひチェックしてみることをお勧めする。データサイエンティストのスキルレベルを「業界を代表するレベル(Senior Data Scientist)」「棟梁レベル(Full Data Scientist)」「独り立ちレベル(Associate Data Scientist)」「見習いレベル(Assistant Data Scientist)」の4段階に分けた上で、それぞれにおいて身に付けるべき具体的なスキルを約420項目にも分類して詳細に定義している。
興味深いのが、これらのスキル項目が「ビジネス力」「データサイエンス力」「データエンジニアリング力」という3つの分野に分かれており、これらをバランスよく身に付けることが重要だとしている点である。データサイエンティストというとその名前から連想される通り、統計学や数学といったまさにデータサイエンスの学術的な知識や、システム設計や構築で必要となるエンジニアリング力が重要だと思われがちだが、田中さんはむしろ「私見ですが、欠けがちなビジネス力こそ、データサイエンティストにとっては重要」と説く。
「データを分析するそもそもの目的を構造化して、分析計画に落とし込んでいくには、ビジネスの文脈を理解しつつ、ビジネス課題を解決できる力が不可欠です。この能力がないと、いくら統計学やITツールの知識が豊富でも『データ分析のスペシャリスト』止まりで、真のデータサイエンティストにはなれません」
このように、データサイエンティスト協会が育成を目指す「プロフェッショナルとしてのデータサイエンティスト」は、私たちが安易に連想しがちな「こてこてのデータ解析マニア」というステレオタイプとは明らかに異なる。むしろ、ビジネス力とデータサイエンス力、データエンジニアリング力の3つを程よいバランスで身に付けた上で、それぞれの分野のエキスパートやスペシャリストとのパイプ役になれるような、総合力とバランス感覚に優れたプロフェッショナルのことをデータサイエンティストと称しているのだ。
とはいえ、「これらすべての能力を一人で身に付けたスーパーマンを目指せと言っているわけでもない」と田中さんは言う。
「個人ではなく、グループやチームとしてこの3つの分野のスキルをバランスよく揃えられればいいのです。データサイエンティスト協会では、『3分野の専門家をそれぞれどの程度の割合でそろえれば、特定の問題領域の解決に適したチームを編成できるのか』といった指針も作成しています」