IT之家 12 月 25 日消息,据英伟达官方消息,美团机器学习平台使用 NVIDIA GPU,通过算子融合、计算图等价替换等一系列优化 ,相较于 CPU 在相同成本约束下,NVIDIA T4 GPU 大幅加速美团 CTR(Click-Through-Rate)模型预测性能,神经网络模型吞吐能力提升了 10 倍;同时在搜索精排场景中,端到端整体吞吐能力提升了一倍以上。
文章插图
英伟达表示,美团的 CTR 模型过去一直在使用 CPU 推理的方式,但随着用户访问量的提升和深度神经网络的引入,CTR 模型结构趋于复杂,吞吐和计算量也越来越大,CPU 开始不能满足模型对于算力的需求,而仅仅通过 CPU 服务器的堆叠带来的性能提升性价比相较偏低。而 GPU 拥有数以千计的计算核心,可以在单机内提供密集的并行计算能力,特别适合深度学习场景,在行业内已经在 CV、NLP 等领域展示了强大的能力。通过 CUDA 及相关 API,NVIDIA 建立了完整的 GPU 生态系统。基于此,美团基础研发平台将 CTR 模型部署到 GPU 上,并通过一系列针对 CPU 与 GPU 的异构系统并行计算设计、数据存储方式和传输方式上的特定优化。
IT之家了解到,NVIDIA Tesla T4 GPU 是一款推理加速器,搭载 NVIDIA Turing Tensor Core。官方称,NVIDIA Tesla T4 GPU 具备人工智能推理的多精度计算性能,从 FP32 到 FP16 再到 INT8,又到 INT4 精度,T4 的性能比 CPU 高出 40 倍,实现性能的重大突破。
【 机器学习平|英伟达:美团机器学习平台使用NVIDIA T4 GPU】
文章插图
- 电影|国家发改委:鼓励网络视频平台限时低价电影放映
- 大屏|尺寸直追笔记本 曝国产厂商将推出高刷大屏旗舰平板
- 央视|央视曝光直播电商以次充好乱象!有平台抽样不合格率达50%
- DeepMind首席科学家:比起机器智能,我更担心人类智能造成的灾难
- 将理论注入深度学习,对过渡金属表面进行可解释的化学反应性预测
- 接班人|任正非儿子任平,会是华为接班人吗?他比父亲还低调许多
- 微信小程序|小红书的付费推广获取流量方式有哪些?平台的4种主要营销工具都在这里了
- App Annie:2021 年人们平均每天玩手机近 5 小时
- 体验首款Linux消费级平板,原来芯片和系统全是国产
- iPad|ipad平替电容笔推荐;2022最新性价比电容笔推荐