GPU|一文看懂“风华2号”桌面GPU真实实力( 二 )


本次发布的风华2号 , 仅从单精度来看 , 大约相当于NVIDIA GTX 950显卡水平 , 就像素填充速率和FP32来说 , 和GT1050大致处于同一档 , 3DMark测试分数推算应当在GT75至GT1050之间 。 据芯动官方则表示 , 本次“风华2号”对标AMD公司的Radeon R9系列产品 , 部分性能还超越了后者 。
而芯动去年发布的\t4K级智能渲染数据中心GPU“风华1号” , 单精度浮点运算性能达到5TFLOPS , 和英伟达GTX1070的6.5TFLOPS接近 , 但不及GTX1080的9TFLOPS 。 而显存方面 , 风华1号的性能比较突出 , 采用GDDR6X高带宽显存技术 , 而芯动科技也强调这个技术目前全球只有英伟达和芯动两家公司拥有 。 该GPU的显存速度达到19Gbps 。 比GTX1070的8Gbps速度高出不少 , 后者采用GDDR5技术 。 同时 , 在显存方面 , 风华1号也比GTX1080的10Gbps高 , 甚至比RTX2060的14Gbps要高 。

▲风华1号可同时支持16路1080P云游戏
不过 , 英伟达的RTX2060已支持光线追踪技术 , 而目前风华系列应该还不支持光线追踪技术 。 而据芯动官方透露 , 芯动下一代产品“风华3号”已基本完成研发 , 将为国内用户提供光追等酷炫性能 , GPGPU(通用图形处理器)也正在规划中 , 未来将推出更多计算芯片产品 , 赋能国产GPU产业链 。
国产GPU自研之路 , 到底有多难?
尽管很多人表示 , 国产GPU要真正对标国外英伟达、AMD差距尚远 , 但如果了解GPU技术自研之路的难处 , 或许对我们国产GPU取得的突破会有更多的包容和支持 。
GPU的设计是一项系统工程 , 包含硬件架构、算法、软件生态等多个组成 , 缺一不可 , 专利壁垒极高 , CPU巨头Intel近二十年多次尝试踏足高端GPU领域 , 皆未成功 。 相对于FPGA和ASIC , 不论是从功能上 , 还是硬件上 , GPU设计难度都更高 。 GPU的自主研发之路是艰难且漫长的 , 由于没有像ARM一样的第三方IP授权厂商 , GPU设计商必须完全自主研发 , 从零做起 , 难度较大 。
对此 , 芯动科技选择站在巨人的肩膀上进行设计开发 。 GPU项目总监何颖坦言 , “现代GPU的涉及面广、开发应用方面有很多技术壁垒 。 要拿出一款对标行业先进水平的图形GPU , 且流畅兼容各种应用 , 靠买一款GPU IP是不会有什么建树的 。 芯动一站式IP和全套体系架构定制服务为风华GPU迅速迭代提供了创新动力:打破内存墙 , 全球最强GDDR6/6X Combo IP、HBM3/2e IP、LPDDR5/5X/DDR5 IP等高速存储解决方案;32/56G SerDes(PCIe6/5/4)高速通信接口 , UCIe Chiplet互连解决方案 , 以及GPU内核的自主演进等 。 所以 , 和苹果公司一样 , 芯动在最初架构授权的基础上不断优化GPU内核 , 现已完整独立掌握了GPU内核演进架构图 , 有了自己的GPU架构把控 , 并且有能力做到未来三年每年发布两款GPU 。 ”
相比于前些年火热的AI芯片 , GPU无疑在技术上有更高的门槛 , 一直以来都是国内半导体产业中的弱项 。 芯动科技“风华2号”的面世 , 意味着国产GPU正在进入一个从可用到好用的阶段 , 让我们看到了“芯”希望 。
【GPU|一文看懂“风华2号”桌面GPU真实实力】其实除了芯动科技之外 , 也有很多其他企业正在国产GPU的道路上艰难探索前行 , 相信不久的将来 , 我们会看到更多国产GPU产品的出现 。