EnterpriseZine Press

連合学習（Federated Learning）とは？──AWSに聞く「プライバシーと機械学習モデルの精度」の両立方法

アマゾンウェブサービスジャパン益子直樹氏／宇都宮聖子氏インタビュー

2023/05/15 09:00

通知

　データが足りない。データの機密性が高い。データの多様性に問題がある。このような問題の処方箋として、データを分散させた状態のまま、モデルの学習と再学習を共同で行うFederated Learning（連合学習）に注目が集まる。どのような仕組みでプライバシーに配慮しつつ、モデルを訓練するのか。AWSの識者2人に聞いた。

通知

連合学習（Federated Learning）とは何か？

アマゾンウェブサービスジャパン合同会社技術統括本部シニア機械学習量子コンピューティングソリューションアーキテクト宇都宮聖子氏<br />アマゾンウェブサービスジャパン合同会社技術統括本部エンタープライズ技術本部エネルギー・化学・ヘルスケアライフサイエンスソリューション部部長益子直樹氏 — （左より）アマゾンウェブサービスジャパン合同会社技術統括本部シニア機械学習量子コンピューティングソリューションアーキテクト宇都宮聖子氏
アマゾンウェブサービスジャパン合同会社技術統括本部エンタープライズ技術本部エネルギー・化学・ヘルスケアライフサイエンスソリューション部部長益子直樹氏

　Federated Learning（以降、連合学習）は機械学習の手法の1つ。宇都宮氏は「医薬品開発のように、プライバシー保護に配慮しなくてはならない分野で、安全に学習するニーズに対応するべく出てきた機械学習の仕組み」と解説する。通常、データ量が多いほど精度の高い結果が得られるが、研究機関や製薬会社が使いたいデータには、患者のプライバシーに関する情報など機密性の高いものが含まれる。データ管理者には自分たちの組織が保有する個人情報を適切に管理する義務がある。そのため、外部との共同利用などはもってのほかとされてきた。連合学習はこのジレンマを解決する手法として期待されている。

　その仕組みは次のようなものだ。まず、中央にあるサーバーで訓練用の最初のモデルを作成し、ローカルに供給する。ローカルはそれぞれが自分たちのデータでモデルの訓練を行う。その後、個人情報のように共有してはいけないものを除く処理を行った後、抽出したパラメーター（実態は行列）だけを中央に集約し、共通モデルの精度を向上させる（図1）。

図1：連合学習の仕組み出典：アマゾンウェブサービスジャパン　[画像クリックで拡大]

　プライバシー保護のためには、学習データの前処理として、個人情報を除いて匿名化しモデルを作成することなどが求められる。モデルのパラメーターを外部に出すことに問題はないのか。この疑問に対し、「大量の学習データから特徴を抽出し、1つのモデルを作成しますが、モデルから学習データを（リバースエンジニアリングにより）復元することは非常に困難です」と宇都宮氏は説明する。パラメーターの中身は数値なので、数値をアップロードしても、元のデータはローカルに残ったままだ。個人情報が含まれているデータはローカルに残し、学習結果の骨子であるモデルのパラメーターだけを中央にアップロードするのが連合学習の仕組みである。

　この仕組みを活用したユースケースとして有名なのが、10社以上のグローバル製薬会社が参加した欧州のコンソーシアムMELLODDY（MachinE Learning Ledger Orchestration for Drug DiscoverY）である。メガファーマと呼ばれるグローバルに事業を展開している製薬会社は、どこも新薬の研究開発に力を入れている。しかし、新薬を市場に出すまでには平均で13年、2700億円が相場と、膨大なコストを要する。AIの貢献できる余地は大きいが、できるだけ多くのデータを集めなければ、満足できる水準の成果は得られない。また、質の高いデータを集められたとしても、それには個人情報が紐づいていて、多様性に問題があることもしばしばだ。だからと言って、お互いのデータを持ち寄ることもできない。さらに、限られたリソースの範囲では連続的な検証が難しいという問題もある。益子氏は「プライバシー」「柔軟性」「スケーラビリティ」の3つの課題を指摘し、お互いに協力するメリットは理解していても、これらの障壁の高さから挑戦しようにもできずにいたことを示した。

会員登録無料すると、続きをお読みいただけます

新規会員登録無料のご案内

・全ての過去記事が閲覧できます
・会員限定メルマガを受信できます
・翔泳社の本が買える！
500円分のポイントをプレゼント

メールバックナンバー

新規会員登録無料

次のページ
欧州の製薬コンソーシアム「MELLODDY」が共同開発に成功した理由

この記事は参考になりましたか？

広告を読み込めませんでした

広告を読み込み中...

印刷用を表示

EnterpriseZine Press連載記事一覧: 「顧客理解」を経営の資産に変えるには？アドビが語るAIエージェント時代のブランド戦略

AIでシニアが無双状態、若手をどう育てるのか？アクセンチュアトップコンサルタントに聞く

元良品計画会長・堂前氏が語る「作業員としての人間」の終焉　AI時代に“自律型組織”をどう実...

もっと読む

この記事の著者: 冨永裕子（トミナガユウコ）

　IT調査会社（ITR、IDC Japan）で、エンタープライズIT分野におけるソフトウエアの調査プロジェクトを担当する。その傍らITコンサルタントとして、ユーザー企業を対象としたITマネジメント領域を中心としたコンサルティングプロジェクトを経験。現在はフリーランスのITアナリスト兼ITコンサルタン...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この著者の最近の執筆記事