NECは5月17日、数百名のAI研究者が利用できるAIスーパーコンピューターの設計・構築を開始したと発表した。実現に数十億円を投じる本プロジェクトは、2023年3月には国内企業で最大規模の580PFLOPS超となるシステムが稼働予定となっている。
なお同社によれば、既に一部のシステム(100PFLOPS)について数百名のAI研究者が利用を開始しているという。
本システムでは、1ノード当たり8基のハイエンドGPU「NVIDIA A100 80GB Tensor コア GPU」を搭載した最新GPUサーバー116台と、16PB超のEXAScaler高性能並列ファイルシステムを搭載したストレージアプライアンスで構成される。
同社によれば理論上の処理性能は580 PFLOPS超となり、数千万枚の画像を数分間で学習可能とのこと。ネットワークには、高速イーサネットスイッチ「NVIDIA Spectrum SN3700」を採用している。
また、全サーバーを200GbEで接続してRoCE(RDMA over Converged Ethernet)v2により超高速・低遅延での通信を行うことで、高速な分散学習を可能にするという。
さらにKubernetesを中核とした独自の構築技術により、これらの先端ハードウェアとソフトウェア群を密に結合することで、高性能かつ利便性の高いシステムを実現できるとしている。
【関連記事】
・東北大、NECのベクトル型スーパーコンピュータによるクラウドサービスを導入
・NECら3社、SGHDグループの物流センターに協調搬送ロボット導入に向けた実証実験を開始
・日本IBM、国内向けのセキュリティサービスを発表 AI搭載のEDRソリューションなど4つ
この記事は参考になりましたか?
- 関連リンク
- この記事の著者
-
EnterpriseZine編集部(エンタープライズジン ヘンシュウブ)
「EnterpriseZine」(エンタープライズジン)は、翔泳社が運営する企業のIT活用とビジネス成長を支援するITリーダー向け専門メディアです。データテクノロジー/情報セキュリティの最新動向を中心に、企業ITに関する多様な情報をお届けしています。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア