英伟达:美团机器学习平台使用 NVIDIA T4 GPU,相比同成本 CPU 性能提升 10 倍

12 月 25 日消息,据英伟达官方消息,美团机械借鉴领域应用 NVIDIA GPU,通过算子配备、计较图等价替代等一系列优化 ,相较于 CPU 在相像老本约束下,NVIDIA T4 GPU 大幅加速美团 CTR(Click-Through-Rate)模子展望机能,神经网页模子吞吐才气提升了 10 倍;同时在搜索精排场景中,端到端整体吞吐才气提升了一倍以上。

英伟达显露,美团的 CTR 模子以前一直在应用 CPU 推理的方式,但跟着用户走访量的提升和深度神经网页的引入,CTR 模子布局趋于繁杂,吞吐和计较量也越来越大,CPU 首先不能够满足模子关于算力的需要,而仅仅通过 CPU 服务器的堆叠带来的机能提升性价比相较偏低。而 GPU 领有数以千计的计较焦点,能够在单机内供应集中的并行计较才气,分外适用深度借鉴场景,能手业内曾经在 CV、NLP 等领域展现了壮大的才气。通过 CUDA 及相关 API,NVIDIA 确立了完备的 GPU 生态体系。基于此,美团底子研发领域将 CTR 模子布置到 GPU 上,并通过一系列针对 CPU 与 GPU 的异构体系并行计较计划、数据存储方式和传输方式上的特定优化。

中文国际打听到,NVIDIA Tesla T4 GPU 是一款推理加速器,搭载 NVIDIA Turing Tensor Core。官方称,NVIDIA Tesla T4 GPU 具备人工智能推理的多精度计较机能,从 FP32 到 FP16 再到 INT8,又到 INT4 精度,T4 的机能比 CPU 凌驾 40 倍,完成机能的重大冲破。

您可能还会对下面的文章感兴趣: