thread|卡位元宇宙世界硬件底层：英伟达，深耕GPU技术，占据重要的地位( 二 ) 编程

2.1. 硬件入口：引领 GPU 持续迭代发展
回溯英伟达26年GPU发展史，持续创新、前瞻布局助力其逐步制霸全球GPU市场。
1999年，英伟达推出全球首款图形处理器GPU——GeForce 256 ，将其定义为具有集成变换、照明、三角设臵/裁剪和渲染引擎的单芯片处理器，每秒处理至少1000万个多边形。
2006年起，英伟达在全球GPU市场逐步占据主导；这一年，英伟达推出CUDA——一种用于通用GPU计算的革命性架构。
CUDA使科学家和研究人员能够利用 GPU 的并行处理能力来应对最复杂的计算挑战。
有了英伟达的CUDA 计算框架之后，开发者可以不再使用复杂的机器语言进行编程，而是直接通过CUDA框架，将高级语言编写好的程序用GPU进行计算。
同时，首席科学家戴维〃柯克竭力劝服董事长黄仁勋将GPU通用化——让一块只能渲染图形的独立显卡，变成一个通用计算图形处理器，并且强烈要求英伟达现有与即将推出的所有GPU都必须支持CUDA程序。
这次大胆的尝试，使得英伟达从优秀的硬件制造商跃升为具备核心软件系统的生态创造者。英伟达率先将垂直应用与游戏领域的GPU业务复制至其他领域。
英伟达GPU最早拓展的是游戏领域，其一方面向开发者开放GameWorks SDK ，方便开发者便捷获取GPU性能，另一方面通过其合作网络向游戏玩家售卖GeForce GPU 。
在游戏领域取得成功之后，英伟达很快将GPU架构进一步拓展至汽车、数据中心以及专业视觉化领域，并针对不同市场主打不同产品形成对应生态，如 GeForce 主打游戏， Quadro 主打办公， Iray 主打 VR ， DRIVE 主打自动驾驶， Tesla 主打数据中心。
英伟达前瞻性预见 GPU 在 AI 市场的广泛应用前景并果断布局。
英伟达从2006年起开始重点投资 CUDA 项目，通过一系列改动和软件开发，将 GPU 转化成更通用的计算工具。
随着人工智能、深度神经网络技术的突破发展，基于 CUDA 架构的大规模并行运算 AI 芯片开始迎来广泛应用。
2012年，英伟达与 Google 的人工智能团队合作，建造了当时最大的人工神经网络，之后各深度学习团队开始广泛大批量使用英伟达显卡。
2013年，英伟达与 IBM 在建立企业级数据中心方面达成合作。
2017年，英伟达发布了面向 L5 完全无人驾驶开发平台 Pegasus 。
2021年起，英伟达进军 CPU领域，基于 ARM 架构构建了三款新处理器——NVIDIA Grace、BlueField-3 DPU、NVIDIA DRIVE Atlan 。
其中， NVIDIA Grace 是专为大规模人工智能和高性能计算应用而设计；BlueField-3 DPU 是首款支持第五代 PCIe 总线并提供数据中心时间同步加速的 DPU；NVIDIA DRIVE Atlan 则是新一代 AI 自动驾驶汽车处理器，其算力将达到1000TOPS 。
持续迭代 GPU 架构，从 Tesla 到 Ampere、从 GTX 到 RTX 性能稳步提升。
英伟达的 GPU 架构历经多次变革，基本保持两年一迭代，从最初的 Tesla（2008），到 Fermi（2010），之后 Kepler（2012）、Maxwell（2014）、Pascal（2016）、Volta（2017），再到 Turing（2018），然后是现在的 Ampere（2021）。
从 Turing 开始，英伟达 GPU 也启用了全新的品牌名，从 GTX 变更为 RTX 。 NVIDIA CEO 黄仁勋表示， Turing 是近 12 年来 GPU 架构变化最大的一次，原因在于 RTX 通过专用的 RT Core 核心实现了游戏中可用的实时光线追踪渲染。
目前，NVIDIA RTX 技术凭借其强大的实时光线追踪和 AI 加速能力，已经改变了最复杂的设计任务流程，例如飞机和汽车设计、电影中的视觉效果以及大型建筑设计，并且驱动着后续的协作和模拟平台 Omniverse 。英伟达最新一代的 Ampere 建立在 RTX 的强大功能之上，进一步显著提高其渲染、图形、AI 和计算工作负载的性能。