トヨタ自動車が構築を目指す「エッジAI分散基盤」とは?高度なモビリティAIの学習を阻む課題と突破口
電力・ファシリティ・通信負荷……その先に直面する多種多様なエッジの制御
AI学習に付きまとう“電力”と“ファシリティ”の課題、「分散AIワークロード」が解決のカギに?
2つ目の課題である効率的な学習基盤の構築についても、従来の発想を大きく転換する必要がある。高度なモビリティAIの学習には大規模GPUクラスターが不可欠だが、昨今、GPUサーバーの電力消費とファシリティ要求が急激に増大している。
「最近のGPUサーバーは空冷では対応できず、水冷のファシリティがなければそもそもデータセンターに設置できない場合もあります。電力消費も激しく、データセンター側の電力供給が追いついていません。そのため、大規模なGPUクラスターを1つの拠点に集中配置することが困難であるのが実情です」(古澤氏)

また、大規模モデルの学習では長時間のGPU占有が必要となるため、パブリッククラウドよりもプライベートクラウド環境のほうが効率的だと同社は判断している。しかし、一極集中が困難な状況では、複数のデータセンターに分散せざるを得ない。
この制約をむしろ機会と捉え、トヨタ自動車が推進するのが、再生エネルギーを積極活用した分散処理アーキテクチャだ。日本国内には様々な再生エネルギーの発電設備がある。北海道のある地域では大規模な風力発電設備があり、西日本のある地域では大規模な太陽光発電設備があるといった具合にだ。しかし、実は電力需要はそれほど高くなく、地域によっては再エネ発電量のほうが上回っている状況なのだという。
そこで、余剰電力をわざわざ遠方に送電するよりも、発電地点の近くにデータセンターを分散配置するほうが効率的という考えから、政府も推進する「ワット・ビット連携」と呼ばれるアプローチに注目が集まっている。トヨタ自動車もこの流れに沿い、クリーンエネルギーが発電される場所にエッジデータセンターを展開することを検討している。
ただし、再生エネルギーには“変動”という課題がある。風力発電なら風量によって発電量が大きく変動し、太陽光発電なら天候や時間帯によって発電量が大きく変動する。安定した電力供給を期待するのは難しいのが現状だ。
こうした変動の影響を考慮した研究開発にも取り組んでいるようだ。「天気予報から、各拠点における太陽光発電量をある程度予測し、最も太陽光発電が活発な場所へAIの学習を優先的に配置する、『分散AIワークロード』の研究開発を行っている」と古澤氏は明かす。エネルギー効率を最大化しながら、学習処理を分散配置するアプローチである。
この記事は参考になりましたか?
- EnterpriseZine Press連載記事一覧
-
- トヨタ自動車が構築を目指す「エッジAI分散基盤」とは?高度なモビリティAIの学習を阻む課題...
- 多忙極める“AI時代”のセキュリティ人材育成、「効果的&リーズナブル」な施策は本当に存在す...
- IT部門は消滅する?大規模開発の常識を覆しかねない自律型AIエンジニア「Devin」のイン...
- この記事の著者
-
森 英信(モリ ヒデノブ)
就職情報誌やMac雑誌の編集業務、モバイルコンテンツ制作会社勤務を経て、2005年に編集プロダクション業務とWebシステム開発事業を展開する会社・アンジーを創業した。編集プロダクション業務では、日本語と英語でのテック関連事例や海外スタートアップのインタビュー、イベントレポートなどの企画・取材・執筆・...
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア