平庸向左,黄仁勋向右

1.
创立一家公司很容易 , 保持一家公司活着很难 。
为了让曾经多次处在存亡之际的英伟达能够活下去 , 联合创始人兼CEO黄仁勋(JensenHuang)在过去的29年里曾经做出许多在当时极具风险的决定 。
神奇的是 , 这些决定当中的绝大多数 , 最后竟然都被证明是正确的:从TNT , 到可编程Shader(着色器) , 再到CUDA架构以及其开源和前向兼容 , 以及总是超过当前图形市场主流应用场景需求的算力和存储性能水平——这些关键的技术和产品 , 以及革新性的战略决策 , 一次又一次将英伟达在计算市场的地位推至新高 。
在营销策略助推下 , 今天的人们尊称黄仁勋为“AI教父” , 夸张地将英伟达的图形计算产品描述为“核弹” 。 然而实际上 , 黄仁勋并没有什么封神的幻想——他做出的很多决定 , 完全是为了避免自己最害怕的事情发生:
英伟达沦为一家平庸的个人电脑零部件供应商 。
“屏幕上就有那么多像素 , 芯片上能加的功能就那么多 , 但晶体管的数量还在不断增加 。 这样下去 , 在某个时间点上 , 图形计算性能完全可以足够任何人使用 。 你看今天各种集成显卡 , 性能又好 , 又不要钱 , 就会发现这个分析是完全正确的 , ”
“那么 , 如果我们不重新发明电脑图形计算 , 不革自己的命 , 不彻底解放这块图形处理器的能力的话 , 结局就是英伟达必然会被商品化(commoditized) 。 ”
——黄仁勋 , viaStratechery
带着这样的恐惧 , 黄仁勋走上了一条自己革自己命的创业路 。 这条路 , 走到今天 , 已将近三十年 。
2.
最近 , 英伟达召开了年度技术大会GTC2022 , 发布了最新一代商用级H100GPU , 和以知名计算机科学家GraceHopper命名的Hopper架构 。 新架构采用台积电4纳米制程工艺 , 内存带宽达到每秒3TB , 在32和64位浮点计算上相比前一代Ampere架构的A100GPU快了三倍 。
H100已经成为最新一代“核弹” , 但英伟达还有更多杀手锏:
通过最新的互联技术NVLink技术 , 8张H100单卡连接构成了的DGXH100模组化超级计算机 , 算力达到了惊人的1EFlops;而NVLinkSwitch技术在扩展性上也获得了史诗级提升 , 支持最多256张H100GPU互联 。
由于GPU进行深度学习计算需要大量的内存带宽 , 英伟达甚至和ARM合作开发了一款采用全新Grace架构的CPU , 专门用来辅助GPU进行带宽分配 , 从而让GPU可以全力开动进行计算 , 不会因为在内存带宽上受到限制而影响发挥 。
平庸向左,黄仁勋向右
文章图片
早已在深度学习计算方面身位领先的英伟达 , 再一次打造了新的GPU、CPU架构、互联技术 。 今天这家公司早已不再是单纯的显卡技术公司——它已经将图形加速计算的功力推到极限 , 为深度学习计算带来了新的可能性 。
在GTC大会上 , 黄仁勋认为人类将会迎来AI被AI(而不只是人类)所创造出来的时代 , 并将其称为“生产智能”(intelligencemanufacturing) 。
会后 , 黄仁勋接受了Stratechery博客主笔/知名分析师BenThompson的采访 。 特别的是 , 黄仁勋在这次采访中谈到了一些过去鲜少讨论的话题——特别是对于公司平庸化的恐惧 , 以及英伟达三十年的创业路走到今天的感悟 。
在他看来 , 没有比让英伟达变成“Wintel”生态下的一家普通供应商更可怕的事情了 。
2009年 , 黄仁勋在斯坦福大学做了一场名为“VisionMatters”的演讲 。 其中 , 他回忆起了公司在2000年推出可编程像素着色器(programmablepixelshader,以下简称可编程shader) , 在当时差点要了公司的命 。