寒武纪发布新款 AI 训练卡 MLU370-X8:7nm 工艺,48GB LPDDR5 内存

3 月 21 日信息,据寒武纪官方信息,寒武纪本日正式公布新款练习加速卡 MLU370-X8,搭载双芯片四芯粒思元 370,集成寒武纪 MLU-Link 多芯互联技术,要紧面向练习使命。

寒武纪显露,在业界使用广泛的 YOLOv3、Transformer 等练习使命中,8 卡计较体系的并行性能平均到达 350W RTX GPU 的 155%。

中文国外打听到,MLU370-X8 接纳了 7nm 工艺,融合 48GB LPDDR5 内存,FP32 单精度浮点性能到达 24 TFLOPS。

据说明,MLU370-X8 智能加速卡供应 250W 非常大练习功耗,可充裕发挥 AI 练习加速中多见的 FP32、FP16 或 BF16 计较性能。寒武纪初次将双芯片四芯粒思元 370 整合在 MLU370-X8 智能加速卡中,供应了两倍于规范思元 370 加速卡的内存、编解码资源,同时搭载 MLU-Link™多芯互联技术。

MLU370-X8 智能加速卡支持 MLU-Link™多芯互联技术,供应卡内及卡间互联功效。寒武纪为多卡体系专门计划了 MLU-Link 桥接卡,可完成 4 张加速卡为一组的 8 颗思元 370 芯片全互联,每张加速卡可获取 200GB / s 的通信吞吐性能,带宽为 PCIe 4.0 的 3.1 倍,可高效实行多芯多卡练习和分布式推理使命。

▲ MLU370-X8 单机 8 卡布置建设

您可能还会对下面的文章感兴趣: