AMD|国产GPU添新玩家 AMD出身 两款业界第一7nm芯片曾由他打造( 二 )


载天VA10是一款用于数据中心的高性能AI计算、推理的加速卡 。
从性能角度来看,载天VA10所拥有的最大亮点,在于INT8峰值算力达400TOPS!
这一数值便一举刷新业界纪录 。
AMD|国产GPU添新玩家 AMD出身 两款业界第一7nm芯片曾由他打造
文章图片

但若是仅凭借算力峰值来判断加速卡的强弱,那还是有一些片面,需要的更多的综合性比较 。
比如要考虑“算力密度”,算力密度可以从两个维度来讲 。
第一是按芯片单元面积将算力平均下来,比如一平方毫米芯片的算力如何 。另外一个,是每单元瓦的算力,也即每瓦功耗能够提供多大的算力 。
例如载天VA10的设计功耗为150W,而在同等条件之下:
最高吞吐率是主流GPU的2倍以上
最高性能延时是主流GPU的6%
不仅如此,在低延时场景(低于4毫秒的YoloV3检测算法场景)下,载天VA10的推理性能,更达到同功耗市场主流GPU的3倍以上 。
AMD|国产GPU添新玩家 AMD出身 两款业界第一7nm芯片曾由他打造
文章图片

也正是得益于载天VA10的如此性能,它便非常适合“上岗”一些需要高实时性的云端AI场景,例如直播视频增强、智慧交通管理、实时语义理解等 。
以智能ROI优化为例,载天VA10的效果如下:
AMD|国产GPU添新玩家 AMD出身 两款业界第一7nm芯片曾由他打造
文章图片

不难看出,无论是实时处理效率,亦或是色彩增强效果,载天VA10都是肉眼可见的更胜一筹 。
边缘AI推理加速卡——载天VE1
除了数据中心端,瀚博半导体聚焦在边缘端同样发布了新品,载天VE1 。
AMD|国产GPU添新玩家 AMD出身 两款业界第一7nm芯片曾由他打造
文章图片

不同于载天VA10,载天VE1更侧重的发力点,是在那些大算力的需求场景 。
例如车路协同、低速自动驾驶(无人配送车、港口物流园区无人驾驶的车辆)等 。
而载天VE1之所以能够“胜任”于这些场景,还是得益于它自身的性能:
在 40~65瓦功耗下,INT8峰值算力达100TOPS
吞吐率达到主流GPU的2倍,但延时不到主流GPU的5%
AMD|国产GPU添新玩家 AMD出身 两款业界第一7nm芯片曾由他打造
文章图片

软件平台VastStream
但也诚如刚才所言,硬件性能上的“单打独斗”并不能将其功力全程发挥出来 。
因此,瀚博半导体对此的破解之道,便是“软硬一体”——VastStream 。
AMD|国产GPU添新玩家 AMD出身 两款业界第一7nm芯片曾由他打造
文章图片

据了解,VastStream软件平台,可以加速各类AI应用的部署 。
例如计算机视觉、视频处理、自然语言处理、搜索与推荐、算子自定义扩展等 。
而其全新软件组件,还提供了系统管理等三大管理工具,方便客户部署 。
与此同时,VastStream的基础软件栈功能也变得更加丰富 。
主要特性包括统一接口、灵活调度、通用AI计算、多路高效视频转码+AI增强、易编程快迁移、工具链完备等 。
至此,不难看出瀚博半导体已经出现一条清晰可见的业务线:
芯片、推理加速卡、一体机的硬件产品,再到软件整合的系统解决方案 。
那么对于这位新晋的“GPU玩家”来说,如今也到了回答这个问题的时候: