必要なのは「問題解決型教育」、入門から実践までデータサイエンスの学び方:EnterpriseZine(エンタープライズジン)
Shoeisha Technology Media

EnterpriseZine(エンタープライズジン)

EnterpriseZine(エンタープライズジン)

テーマ別に探す

必要なのは「問題解決型教育」、入門から実践までデータサイエンスの学び方

2017/11/24 08:00

 ビッグデータ、データサイエンティストのブームを経て今や空前のAIブーム。しかし根底にあるのは、データアナリティクスであることに変わりはない。各省庁や大企業のデータ分析コンテストの運営や、データアナリティクススキルを持つ人材に活躍の場を提供しているオプトホールディングの齊藤秀氏に、人材育成の課題と取り組みについて話を聞いた。

株式会社オプト 最高解析責任者CAO 齊藤秀氏

──DeepAnalyticsというデータサイエンティストが集まるサイトを運営されていますが、これはどんなサイトなのでしょうか?

齊藤:DeepAnalyticsは、データ利活用に課題を持つ企業や省庁とデータサイエンティストをつなぐデータ分析オープンイノベーションプラットフォームで、現在データ分析スキルを持った会員が約6,000人登録しています。

 アメリカにKaggleというデータサイエンティストや統計分析に関わる人がアルゴリズムの精度を競い合うプラットフォームがあるのですが、DeepAnalyticsはそれの日本版に近いと言えます。コンテストに参加するデータサイエンティストにとっては、自身のデータ分析能力を試し、自身のアピールをする場になります。コンテストを開催する企業や省庁は、自社の抱えるデータ課題に対するソリューションと、それを導き出せる人材を発掘するという狙いがあります。私たちは、DeepAnalyticsを通してこのマッチングを数多く生み出し、日本のデータサイエンス業界活性化に貢献できると考えています。

──AI専門人材やデータサイエンティストが不足しているとずっと言われ続けていますね。

齊藤:そうですね。だからこそ、私たちは「実践」にこだわり、データサイエンティストの学びやキャリアをサポートして活躍の場を提供していきたいと考えています。

 これまで、「気象データによる鉄道支障予測」「ネット広告のクリック予測」「人工知能による名刺解読」「医薬情報テキストマイニング」「ファッション画像分析」「料理画像分析」など多種多様なデータ分析コンテストを開催してきました。それらのコンテストで投稿されたアルゴリズムはいずれも簡単には調達できないとても精度の高いものです。

 現在は、経済産業省とIoT推進ラボによる「The 3rd Big Data Analysis Contest」と大手ヘッジファンドによる「金融モデリングチャレンジ」が開催されています。「The 3rd Big Data Analysis Contest」は電力の安定供給・効率利用を目的とした太陽光発電の発電量予測にチャレンジするコンテストで、「金融モデリングチャレンジ」は金融商品の将来の動きを高精度に予測する、従来に無いアルゴリズムの開発に挑戦するコンテストです。こうした実社会に影響を及ぼすコンテストを裾野を広げながら数多く開催し、その成果をまとめていきたい。そしていずれその成果を体系化し、データサイエンス分野の発展に寄与したいと考えています。

──成果をどのように社会に還元していくのでしょうか?

齊藤:現在は文部科学省がAI・データサイエンス教育に力を入れており、滋賀大学をはじめ大学でのデータサイエンス教育が充実していきています。他にも、国主導で様々なプロジェクトが立ち上がっていますが、そういった場に私たちがDeepAnalyticsの仕組みを活かして構築した教育システムが導入されています。DeepAnalytics運営で培った知見を、大学の教授やその他教育者が簡単に利用し実践教育を実現できる、そんなツールです。

──データサイエンスはここ数年ブームでデータ分析の入門書もたくさん出ていますね。教材という意味ではすでに飽和しているのではないでしょうか?

 確かにデータサイエンスブームの追い風もあって、例えばPythonの入門書など非常に優れた教材も出てきています。一方で、「入門」レベルから一歩進んだ「実践」になると、まだまだニーズに応えられているものは少ないのが現実です。大学の統計教育にしても、数理統計に偏っていて実務における問題解決能力を養うにはほど遠い印象です。肝心なことは、その知識や技術が実際の仕事現場で使えることであり、また実際の業務の中でこそ分析能力は磨かれていくのです。

 そこで私たちが重視しているのが「PBL: Problem Based Learning」という教育手法。「問題解決型学習」と言われるものです。例えば、IoTについて学びたければ、まず実際のIoT機器を作ってみる。その作る過程において直面する問題を解決しながら「IoTとは何か」を 学んでいく。このプロセスを通じて学んだ知識や経験は「血肉」となり、別のプロジェクトにも応用していくことができるのです。文部科学省もこのPBLを大学教育の現場において進めようとしています。

課題は「実課題」と「実データ」の不足

──PBLは確かに素晴らしい取り組みですが、授業を作るのが難しそうですよね。

齊藤:学生だと、そもそも産業界の「実課題」を想像できないことがPBL教育を難しくしているポイントですね。あとは、「実データ」が不足していることもハードルです。そこで私たちは、DeepAnalytics上でコンテストを開催する際に企業からお出しいただいたデータを教育現場で使えるよう働きかけを行なっています。そうして私たちのツール上で扱えるデータが増えれば増えるほど、教育現場では様々な業界のデータを用いた実践的授業を行うことができるようになり、教育の質も向上していくと考えています。昨年データサイエンス学部を創設して話題となった滋賀大学では、新入生100名が私たちが集めたデータを使って学ぶことになっています。

 データを提供する企業にもメリットがあります。まず、その企業のデータサイエンスに対する姿勢を学生に認知させることができます。また学生も、その企業が持つデータからその企業が抱える課題や事業の可能性などを推し量ることも可能です。そうして将来のデータサイエンティストへの採用アピールにつなげていくことができるのです。

 コンテストの開催も同様の効果を発揮します。例えばユニクロを展開するファーストリテイリングは、ファッション画像の洋服における「色」分類問題を実施することで、全社をあげてAIに力を注いでいることを社会にアピールすることができました。また先ほどの金融モデリングチャレンジも、高額賞金を用意することでハイレベル人材のコンテスト応募を獲得し、応募をフックに企業自身にも興味を持ってもらうことに成功しています。

──しかし、企業がデータを公開する際に機密情報や個人情報が漏れる心配はないのでしょうか?

齊藤:先の金融モデリングチャレンジの例で言えば、データそのものは暗号化されているので分析者はせいぜいフラグの立っている「買い」や「売り」のシグナルが推測できるだけです。モデルを調達するフェーズではデータを部分的にオープンし、そこで調達したモデルに実際のビッグデータを投入してその企業に最適なアルゴリズムに仕立て上げる「オープン&クローズ」手法を取っています。企業は最後に暗号を解くので重要な情報は守られる。ここが肝です。

入門者からいかに実践者にステップアップするか

──データサイエンス入門者は、まず何から学習を始めたら良いのでしょう?

齊藤:今はデータサイエンスやAIのスキルが混沌としていて、整理されていないので、体系的に学習していくことが難しいのですが、私たちは様々なアプローチで入門から実践までを一気通貫で進められる教育教材を用意していくつもりです。

 まず第一弾として、世界最大級のオンライン教育プラットフォーム「Udemy」と協力し、ビジネスデータを用いた実践演習が可能なデータサイエンス入門講座を開講しました。エンジニアやマーケターの方はもちろん、データ分析とは無縁の方でもゼロから学べるコースになっています。これまでの入門講座や書籍と違い、基礎的な知識の詰め込みからスタートするのではなく、実際に手を動かしてデータを分析しながら学んでいく、まさにPBL形式の授業なので、データサイエンティストの仕事をざっくりと理解することができます。

Udemy: ビジネスケースで学ぶPythonデータサイエンス入門(オプトワークス作成) 動画サンプルはこちらから

 今後は、データサイエンティストに必要な3つのスキル「ビジネス力」「データエンジニア力」「データサイエンス力」の中で、自身の弱いところを補完していける講座を作っていきたいと考えています。他にも、DeepAnalytics上で開催したコンテストで入賞した人の「方法論」自体もコンテンツとして教材に取り入れていきたいですね。入賞者のモデリング方法、ディープラーニングの適用視点、さらに入賞するために行なった学習方法など、実体験を基にしたレクチャーは、データサイエンティストとして一人前を目指す人たちにとって最高の教科書です。そういったものも含め、一人でも多くの方にデータサイエンスの世界を身近に感じてもらうために講座を充実させていきたいと思います。

 解決すべきイシューをどう見極めるか

──エンジニアではなく事業開発や経営企画の人が、社内のプロジェクトでデータ分析をやる場合、何から始めれば良いのかとよく聞かれます。データ分析から知見を導く場合、仮説や課題意識が必要だとよく言われますが、そもそも課題(イシュー)をどう設定して良いのかわからない人が多いようです。。

齊藤:どんなイシューをどう設定するのか、そしてどんなデータを準備するべきなのかに王道はなく、時間はかかります。最も経営的なインパクトがあるイシューをどう発見するかについての明確な方法はない。

 事業開発の人がやりがちなこととしては、不可能なテーマを設定してしまい、ビッグデータとディープラーニングがあれば良いと思い込むことです。適切な課題を設定し、分析を行なって欲しい知見を得るためには、やはりある程度の経験が必要となります。

 まずは、自分が所属する会社や業界に近いデータを準備して基礎分析を行なってみたり、自身の課題感と親和性の高いデータ分析コンテストにチャレンジしてみることをおすすめします。Pythonや機械学習の基礎を、例えば私たちの講座で学びながら、徐々に専門性の高い分野の事例にあたり、自分で考える力を身につけていく。地道ですが、これが最良の道です。

【関連サイト】



著者プロフィール

  • EnterpriseZine編集部(エンタープライズジン ヘンシュウブ)

    「EnterpriseZine」(エンタープライズジン)は、翔泳社が運営する企業のIT活用とビジネス成長を支援するITリーダー向け専門メディアです。データテクノロジー/情報セキュリティの最新動向を中心に、企業ITに関する多様な情報をお届けしています。

バックナンバー

連載:EZ Press

もっと読む

All contents copyright © 2007-2017 Shoeisha Co., Ltd. All rights reserved. ver.1.5