SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

最新イベントはこちら!

予期せぬ事態に備えよ! クラウドで実現するIT-BCP対策 powered by EnterpriseZine

2024年7月10日(水)オンライン開催

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けの講座「EnterpriseZine Academy」や、すべてのITパーソンに向けた「新エバンジェリスト養成講座」などの講座を企画しています。EnterpriseZine編集部ならではの切り口・企画・講師セレクトで、明日を担うIT人材の育成をミッションに展開しております。

お申し込み受付中!

データサイエンティストに会いたい!

機械学習の研究者と、データサイエンティストの顔を持つ NEC 本橋洋介さん(後編)

 前回に引き続き、NECのビッグデータ戦略本部 兼 情報・ナレッジ研究所 主任の本橋洋介さん。後編では、現在本橋さんが携わる、世界最高といわれる、NECの異種混合学習技術について掘り下げていく。

 データサイエンティストが携わる作業は、1)データを集める、2)グラフなどで可視化する、3)傾向を分析することで過去のパターンを見つけ出す、4)結果から将来を予測する、5)予測から最適化して制御するという5つのステップがある。

 本橋さんによれば、「データサイエンティストの本質は、ステップ3以降です。もっと言えば4つ目と5つ目のところで最も力を発揮すべき」だという。

 とはいえ、日本では1から3のステップで終わっていることが多い。なので、日本におけるデータサイエンティストの仕事の多くも、傾向から過去のパターンを見つけるところ止まり。このままではデータサイエンティストの仕事が、今後日本で高く評価されないのではと本橋さんは危惧している。

場合分けを自動化する異種混合学習技術のすごさとは

 「機械学習技術は、人間が解釈できなければダメ」
「機械学習技術は、
人間が解釈できなければダメ」

 5つのステップをすべて1人でやるのも現実的ではない。現実的にはチームを構成し対処することになる。

 「データサイエンティストがどうあるべきか。企業によってチーム構成もさまざまでしょう。自社内に人材を抱えたほうが良い場合もあるし、我々のようなベンダーにアウトソーシングすることもあるでしょう」

 当然ながら社内のデータサイエンティストとベンダーなどに所属するデータサイエンティストはスキルセットも違ってくる。企業内のデータサイエンティストは自社業務に特化したデータ分析手法に長けているはずだ。

 「ベンダーに所属する場合は、どこかの業界に強い場合もありますが、どちらかと言えばドメインには依存せず、分析手法のスペシャリストとなります。我々のようなベンダーのデータサイエンティストの強味は、たとえば鉄道業界でうまくいった分析手法をまったく別の業界に持っていけるところでもあります」

 成功事例の横展開については、強く意識していることの1つとのことだ。

 ところでそんな本橋さんたちが得意としているのが、「異種混合学習技術」を用いたデータ分析手法だ。異種混合学習技術とは、一言で説明すると場合分けの自動化だ。しかし、この技術、とても難しい技術なのだ。

 たとえばコンビニエンスストアでおにぎりが何個売れるかを予測する。その際には平日と休日では予測が異なる。平日でも月曜日と金曜日で異なるし、暑い日、涼しい日でも違ってくる。状況が異なるのでデータを分けて分析することになるが、条件の違いを見ていけば場合分けはどんどん増えてしまい対処しきれなくなる。

異種混合学習技術の概要
異種混合学習技術の概要

 これに対してNECの異種混合学習技術は、「データの塊を分析エンジンに適用するだけで、どのように場合分けすべきかを自動で見つけてくれるのが最大の特長」という。この自動の場合分け技術は、人の行動などに依存しているものを予測するのに適している。パラメータや条件を変え試行錯誤を繰り返しながら場合分けするのではなく一括したデータを投入するだけで自動化できる。

 「通常であればスーパーコンピュータを使ってもなかなか終わらないような計算が、NECの研究所が開発したアルゴリズムを適用することで普通のコンピュータでも実現できるようになりました」

 機械学習技術は、ここ最近かなり大きな進化がある分野だ。進化の中での課題は「精度と解釈性の両立」だという。今流行っているのは「高精度で解釈性が低い」機械学習技術だ。これは、いわゆるニューラルネットワークなどを使って予測をするもので「よく分からないけれど答えが出て、それが高い精度で当たる」というもの。

 とはいえ、オペレーションの改善などビジネス分析で活用しようとすると「人間が解釈できなければダメだとNECでは考えています。なぜなら、結果を理解してビジネスプロセスにフィードバックしたいからです。結果の解釈性が高くないとそれは実現できません」

 世の中にはとにかく精度が高く合致すれば良い世界はある。たとえば、顔認証などで犯罪者などを見つけ出したい場合などだ。しかしながら、オペレーションを変えたい場合はそうではない。答えが合うだけでなく、結果をフィードバックするにはなぜそうなったのかが理解できなければならない。それができるのがNECの異種混合学習技術だと本橋さんは言い、この技術の特長が解釈性の高さなのだ。

予測モデルの解釈性が高い
予測モデルの解釈性が高い

 NECではニューラルネットワークを用いた機械学習ももちろん研究している。しかしビジネスで利用するには、精度の高さだけでなく解釈性、保守性、調整の可能性といったことも必要だ。シーンによっては答えを当てるだけでなく、条件を変えるとどうなるかという観点も必要なのだ。これがまさに、データサイエンティストの5ステップの5番目に該当するところだ。

 「トータルで考えた際に、異種混合学習技術は優位性があると思っています。これを使えば、予測に基づくオペレーションの改善を行うときなどに最適な分析シナリオが提供できます」

次のページ
マメでデータが好きな人はデータサイエンティスト向き

この記事は参考になりましたか?

  • Facebook
  • X
  • Pocket
  • note
データサイエンティストに会いたい!連載記事一覧

もっと読む

この記事の著者

谷川 耕一(タニカワ コウイチ)

EnterpriseZine/DB Online チーフキュレーターかつてAI、エキスパートシステムが流行っていたころに、開発エンジニアとしてIT業界に。その後UNIXの専門雑誌の編集者を経て、外資系ソフトウェアベンダーの製品マーケティング、広告、広報などの業務を経験。現在はフリーランスのITジャーナリスト...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

EnterpriseZine(エンタープライズジン)
https://enterprisezine.jp/article/detail/6120 2014/09/26 00:00

Job Board

AD

おすすめ

アクセスランキング

アクセスランキング

  1. 1
    塩野義製薬データサイエンス部が開発した「AI-SAS」とは?データで変革を起こすチームと開発の裏側を訊ねる
  2. 2
    ITに積極投資する中外製薬に学ぶ「ITガバナンス」のあり方 可視化したデータにもとづく戦略的な判断を
  3. 3
    リリース前の宣伝までしたSaaSの開発が失敗──ベンダーとユーザー、それぞれが負う責任を実際の裁判事例から考える NEW
  4. 4
    生成AIコンサルタントによる5つの「ChatGPT」実務活用例、“3つのポイント”で社内浸透させる NEW
  5. 5
    自治体DXで先行するさいたま市、データ活用は「職員自らする」──“外部委託の限界”を感じ辿り着いた姿
  6. 6
    データ活用の裏に見えるIT部門の疲弊……“誰でもすぐに”を叶えるデータ収集環境の構築術とは
  7. 7
    みずほフィナンシャルCDOや松尾豊氏らが議論「コンタクトセンターへの生成AI実装がなぜビジネスの常識を変えるのか」
  8. 8
    ガートナーの専門家が語るDBMS市場のマジック・クアドラント、熾烈極めるクラウドデータベースの局面
  9. 9
    みずほリース×日立が3ヵ月で全社規模のデータ活用基盤を構築できた理由とは?プロジェクトの裏側を振り返る
  10. 10
    ITRに聞く、生成AIの実態動向と導入のポイント──期待値との調整、RAGの落とし穴、ガイドライン策定のチェックリスト

イベント

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング

  1. 1
    塩野義製薬データサイエンス部が開発した「AI-SAS」とは?データで変革を起こすチームと開発の裏側を訊ねる
  2. 2
    ITに積極投資する中外製薬に学ぶ「ITガバナンス」のあり方 可視化したデータにもとづく戦略的な判断を
  3. 3
    リリース前の宣伝までしたSaaSの開発が失敗──ベンダーとユーザー、それぞれが負う責任を実際の裁判事例から考える NEW
  4. 4
    生成AIコンサルタントによる5つの「ChatGPT」実務活用例、“3つのポイント”で社内浸透させる NEW
  5. 5
    自治体DXで先行するさいたま市、データ活用は「職員自らする」──“外部委託の限界”を感じ辿り着いた姿
  6. 6
    データ活用の裏に見えるIT部門の疲弊……“誰でもすぐに”を叶えるデータ収集環境の構築術とは
  7. 7
    みずほフィナンシャルCDOや松尾豊氏らが議論「コンタクトセンターへの生成AI実装がなぜビジネスの常識を変えるのか」
  8. 8
    ガートナーの専門家が語るDBMS市場のマジック・クアドラント、熾烈極めるクラウドデータベースの局面
  9. 9
    みずほリース×日立が3ヵ月で全社規模のデータ活用基盤を構築できた理由とは?プロジェクトの裏側を振り返る
  10. 10
    ITRに聞く、生成AIの実態動向と導入のポイント──期待値との調整、RAGの落とし穴、ガイドライン策定のチェックリスト