AMD|国产GPU添新玩家 AMD出身两款业界第一7nm芯片曾由他打造( 二 ) 显卡|国产显卡|国产GPU添新玩家

载天VA10是一款用于数据中心的高性能AI计算、推理的加速卡。
从性能角度来看，载天VA10所拥有的最大亮点，在于INT8峰值算力达400TOPS！
这一数值便一举刷新业界纪录。

文章图片

但若是仅凭借算力峰值来判断加速卡的强弱，那还是有一些片面，需要的更多的综合性比较。
比如要考虑“算力密度”，算力密度可以从两个维度来讲。
第一是按芯片单元面积将算力平均下来，比如一平方毫米芯片的算力如何。另外一个，是每单元瓦的算力，也即每瓦功耗能够提供多大的算力。
例如载天VA10的设计功耗为150W，而在同等条件之下：
最高吞吐率是主流GPU的2倍以上
最高性能延时是主流GPU的6%
不仅如此，在低延时场景（低于4毫秒的YoloV3检测算法场景）下，载天VA10的推理性能，更达到同功耗市场主流GPU的3倍以上。

文章图片

也正是得益于载天VA10的如此性能，它便非常适合“上岗”一些需要高实时性的云端AI场景，例如直播视频增强、智慧交通管理、实时语义理解等。
以智能ROI优化为例，载天VA10的效果如下：

文章图片

不难看出，无论是实时处理效率，亦或是色彩增强效果，载天VA10都是肉眼可见的更胜一筹。
边缘AI推理加速卡——载天VE1
除了数据中心端，瀚博半导体聚焦在边缘端同样发布了新品，载天VE1 。

文章图片

不同于载天VA10，载天VE1更侧重的发力点，是在那些大算力的需求场景。
例如车路协同、低速自动驾驶（无人配送车、港口物流园区无人驾驶的车辆）等。
而载天VE1之所以能够“胜任”于这些场景，还是得益于它自身的性能：
在 40~65瓦功耗下，INT8峰值算力达100TOPS
吞吐率达到主流GPU的2倍，但延时不到主流GPU的5%

文章图片

软件平台VastStream
但也诚如刚才所言，硬件性能上的“单打独斗”并不能将其功力全程发挥出来。
因此，瀚博半导体对此的破解之道，便是“软硬一体”——VastStream 。

文章图片

据了解，VastStream软件平台，可以加速各类AI应用的部署。
例如计算机视觉、视频处理、自然语言处理、搜索与推荐、算子自定义扩展等。
而其全新软件组件，还提供了系统管理等三大管理工具，方便客户部署。
与此同时，VastStream的基础软件栈功能也变得更加丰富。
主要特性包括统一接口、灵活调度、通用AI计算、多路高效视频转码+AI增强、易编程快迁移、工具链完备等。
至此，不难看出瀚博半导体已经出现一条清晰可见的业务线：
芯片、推理加速卡、一体机的硬件产品，再到软件整合的系统解决方案。
那么对于这位新晋的“GPU玩家”来说，如今也到了回答这个问题的时候：

AMD|国产GPU添新玩家 AMD出身 两款业界第一7nm芯片曾由他打造( 二 )

AMD|国产GPU添新玩家 AMD出身两款业界第一7nm芯片曾由他打造( 二 )