SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

直近開催のイベントはこちら!

EnterpriseZine編集部ではイベントを随時開催しております

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けの講座「EnterpriseZine Academy」や、すべてのITパーソンに向けた「新エバンジェリスト養成講座」などの講座を企画しています。EnterpriseZine編集部ならではの切り口・企画・講師セレクトで、明日を担うIT人材の育成をミッションに展開しております。

お申し込み受付中!

EnterpriseZine Press

連合学習(Federated Learning)とは?──AWSに聞く「プライバシーと機械学習モデルの精度」の両立方法

アマゾン ウェブ サービス ジャパン 益子直樹氏/宇都宮聖子氏インタビュー

 データが足りない。データの機密性が高い。データの多様性に問題がある。このような問題の処方箋として、データを分散させた状態のまま、モデルの学習と再学習を共同で行うFederated Learning(連合学習)に注目が集まる。どのような仕組みでプライバシーに配慮しつつ、モデルを訓練するのか。AWSの識者2人に聞いた。

連合学習(Federated Learning)とは何か?

アマゾン ウェブ サービス ジャパン合同会社 技術統括本部 シニア機械学習量子コンピューティングソリューションアーキテクト 宇都宮聖子氏<br />アマゾン ウェブ サービス ジャパン合同会社 技術統括本部 エンタープライズ技術本部 エネルギー・化学・ヘルスケアライフサイエンス ソリューション部 部長 益子直樹氏
(左より)アマゾン ウェブ サービス ジャパン合同会社 技術統括本部 シニア機械学習量子コンピューティングソリューションアーキテクト 宇都宮聖子氏
アマゾン ウェブ サービス ジャパン合同会社 技術統括本部 エンタープライズ技術本部 エネルギー・化学・ヘルスケアライフサイエンス ソリューション部 部長 益子直樹氏

 Federated Learning(以降、連合学習)は機械学習の手法の1つ。宇都宮氏は「医薬品開発のように、プライバシー保護に配慮しなくてはならない分野で、安全に学習するニーズに対応するべく出てきた機械学習の仕組み」と解説する。通常、データ量が多いほど精度の高い結果が得られるが、研究機関や製薬会社が使いたいデータには、患者のプライバシーに関する情報など機密性の高いものが含まれる。データ管理者には自分たちの組織が保有する個人情報を適切に管理する義務がある。そのため、外部との共同利用などはもってのほかとされてきた。連合学習はこのジレンマを解決する手法として期待されている。

 その仕組みは次のようなものだ。まず、中央にあるサーバーで訓練用の最初のモデルを作成し、ローカルに供給する。ローカルはそれぞれが自分たちのデータでモデルの訓練を行う。その後、個人情報のように共有してはいけないものを除く処理を行った後、抽出したパラメーター(実態は行列)だけを中央に集約し、共通モデルの精度を向上させる(図1)。

図1:連合学習の仕組み 出典:アマゾン ウェブ サービス ジャパン
図1:連合学習の仕組み 出典:アマゾン ウェブ サービス ジャパン [画像クリックで拡大]

 プライバシー保護のためには、学習データの前処理として、個人情報を除いて匿名化しモデルを作成することなどが求められる。モデルのパラメーターを外部に出すことに問題はないのか。この疑問に対し、「大量の学習データから特徴を抽出し、1つのモデルを作成しますが、モデルから学習データを(リバースエンジニアリングにより)復元することは非常に困難です」と宇都宮氏は説明する。パラメーターの中身は数値なので、数値をアップロードしても、元のデータはローカルに残ったままだ。個人情報が含まれているデータはローカルに残し、学習結果の骨子であるモデルのパラメーターだけを中央にアップロードするのが連合学習の仕組みである。

 この仕組みを活用したユースケースとして有名なのが、10社以上のグローバル製薬会社が参加した欧州のコンソーシアムMELLODDY(MachinE Learning Ledger Orchestration for Drug DiscoverY)である。メガファーマと呼ばれるグローバルに事業を展開している製薬会社は、どこも新薬の研究開発に力を入れている。しかし、新薬を市場に出すまでには平均で13年、2700億円が相場と、膨大なコストを要する。AIの貢献できる余地は大きいが、できるだけ多くのデータを集めなければ、満足できる水準の成果は得られない。また、質の高いデータを集められたとしても、それには個人情報が紐づいていて、多様性に問題があることもしばしばだ。だからと言って、お互いのデータを持ち寄ることもできない。さらに、限られたリソースの範囲では連続的な検証が難しいという問題もある。益子氏は「プライバシー」「柔軟性」「スケーラビリティ」の3つの課題を指摘し、お互いに協力するメリットは理解していても、これらの障壁の高さから挑戦しようにもできずにいたことを示した。

次のページ
欧州の製薬コンソーシアム「MELLODDY」が共同開発に成功した理由

この記事は参考になりましたか?

  • Facebook
  • Twitter
  • Pocket
  • note
EnterpriseZine Press連載記事一覧

もっと読む

この記事の著者

冨永 裕子(トミナガ ユウコ)

 IT調査会社(ITR、IDC Japan)で、エンタープライズIT分野におけるソフトウエアの調査プロジェクトを担当する。その傍らITコンサルタントとして、ユーザー企業を対象としたITマネジメント領域を中心としたコンサルティングプロジェクトを経験。現在はフリーランスのITアナリスト兼ITコンサルタン...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

EnterpriseZine(エンタープライズジン)
https://enterprisezine.jp/article/detail/17706 2023/05/15 09:00

Job Board

AD

おすすめ

アクセスランキング

アクセスランキング

イベント

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング