显卡|神秘莫测的国产显卡,到底是真科技,还是行为艺术?( 二 )


3D游戏出现早期 , 电脑需要带一个图像加速卡 , 英伟达正是看到了机会 , 在图形加速卡的基础上 , 发展出了专注并行计算的GPU , 内部拥有大量的计算单元 , 可以同时进行大量并行计算 。
世界上第一款GPU是英伟达的GeForce256 , 可以说是划时代的产品 , 老黄和英伟达也从此坐稳了显卡界的第一把交椅 , 然后AMD也从惨烈的竞争中杀了出来 , 与英伟达二分天下 。
随着显卡技术的发展 , 图形渲染逐步形成了一套处理流水线:用点构成面、几何变换、光栅化、像素着色……这套流程通常被叫做“渲染管线” 。

开发者们都想利用显卡完成更加酷炫的视觉效果 , 所以需要架构设计师开放管线内部分节点的权限 , 能够自主编程 , 英伟达引以为豪的CUDA核就是这个设计思路 , 把可以自主编程的节点放到通用的并行计算池来计算 。
完成了这些架构后 , GPU的格局就打开了 。
因为除了游戏图形渲染 , 会用到大规模并行计算的领域还有很多 , 比如加密货币挖矿和目前已经渗透到各行各业AI计算 , 干这些并不需要用到“渲染管线”的其他功能 , 明显浪费了服务于游戏的GPU的能力 。
所以为了进一步强化并行计算能力 , 各大厂商开始研发有一种非图形渲染的通用GPU(GPGPU) , 最好的还是英伟达和AMD 。
比如英伟达的H100能达到每秒钟3.2亿亿次浮点数计算(3.2petaFLOPS FP8) , 毕竟本质还是并行计算 , 强者恒强 。

图形渲染和通用并行计算也许总有一天会整合到一起 , 但目前来说还属于两个赛道 。
对于国内来说 , 这几年数据中心、AI、自动驾驶等应用越来越火热 , 国内厂商的积累和精力投入有限 , 先把被英伟达和AMD统治的游戏显卡放在次要位置 , 更多都扑在通用GPU上 。
图形渲染显卡优先满足的是汽车、飞机、工厂这些对渲染性能要求不那么高 , 但应用更广泛的领域 。 相比之下 , 高性能游戏显卡的需求是靠后的 。
有了早年间被美国芯片技术封锁的教训 , 国内的GPU研发和量产工作已经有一段时间了 。 果不其然 , 就在今年10月 , 美国再一次升级了对中国的芯片管制 , 禁售高性能的通用GPU , 台积电这种生产代工厂也同样受到约束 。 虽然对美国这种变本加厉的行为有预判 , 但还是有一些国内厂商中招了 。 一家叫做壁仞科技的7nm通用GPU原本已经准备在台积电量产了 , 但因为参数中的传输速率刚好超过了新规中600GB/s的阈值 , 生产被直接叫停 。 壁仞科技不得不主动降低性能 , 直到现在也没有恢复生产 。
前景未知导致公司在这个月计划裁员三分之一 , 是对国产GPU的一次严重打击 。 这次的芯片管制升级 , 美国意图很明显 , 为的就是打击国内的AI发展 。 10月份 , 正是AI绘画让专业画师和吃瓜群众都直呼“卧槽”的时间啊!上一次的芯片法案直逼我国的芯片生产 , 这一次更是封锁了AI发展的上限 。 那下一步呢 , 有没有可能连玩家们视若珍宝的游戏显卡也遭殃呢?其实这个可能性并不低 , 无论是图形渲染显卡还是通用GPU , 都在未来有着不可限量的广阔应用 , 甚至关乎到国家信息化水平和国防安全 。
我们可以做个畅想 , 假如在10年后 , 元宇宙的虚拟世界初见规模 , 成为大家工作、生活、娱乐的基础建设 , 单眼16K、120Hz刷新率的VR头显变成了我们和虚拟世界交互的媒介 , AI构筑了大量的虚拟内容并担当起了交互NPC的角色 。
要支撑起这么庞大的虚拟世界的外在和内在 , 图形渲染和AI训练推理都是不可或缺的 。 到那时 , 图形渲染显卡将会变得和CPU、通用GPU一样重要 。 面对这种主导了一个时代的大机遇 , 美利坚会怎么做 , 想必不用我说了吧 。