NECは5月17日、数百名のAI研究者が利用できるAIスーパーコンピューターの設計・構築を開始したと発表した。実現に数十億円を投じる本プロジェクトは、2023年3月には国内企業で最大規模の580PFLOPS超となるシステムが稼働予定となっている。
なお同社によれば、既に一部のシステム(100PFLOPS)について数百名のAI研究者が利用を開始しているという。
本システムでは、1ノード当たり8基のハイエンドGPU「NVIDIA A100 80GB Tensor コア GPU」を搭載した最新GPUサーバー116台と、16PB超のEXAScaler高性能並列ファイルシステムを搭載したストレージアプライアンスで構成される。
同社によれば理論上の処理性能は580 PFLOPS超となり、数千万枚の画像を数分間で学習可能とのこと。ネットワークには、高速イーサネットスイッチ「NVIDIA Spectrum SN3700」を採用している。
また、全サーバーを200GbEで接続してRoCE(RDMA over Converged Ethernet)v2により超高速・低遅延での通信を行うことで、高速な分散学習を可能にするという。
さらにKubernetesを中核とした独自の構築技術により、これらの先端ハードウェアとソフトウェア群を密に結合することで、高性能かつ利便性の高いシステムを実現できるとしている。
【関連記事】
・東北大、NECのベクトル型スーパーコンピュータによるクラウドサービスを導入
・NECら3社、SGHDグループの物流センターに協調搬送ロボット導入に向けた実証実験を開始
・日本IBM、国内向けのセキュリティサービスを発表 AI搭載のEDRソリューションなど4つ