NVIDIA正在使用AI开发和设计GPU 在过去几年时间里

在过去几年时间里， NVIDIA深耕AI领域，他们的GPU不仅成为HPC的首选，也成为包括AI和深度学习生态系统在内的数据中心的首选。
现在，在最新公布的开发者博文中， NVIDIA宣布正利用AI来设计和开发GPU ，其最新的HopperGPU拥有将近13000个电路实例，而这些实例完全由AI创建。

文章图片
在NVIDIADevelope上发布的新博客中，该公司重申了其优势以及它自己如何利用其AI功能来设计其迄今为止最强大的GPU--HopperH100 。 NVIDIAGPU主要是使用最先进的EDA(电子设计自动化)工具设计的，但在利用PrefixRL方法的AI的帮助下，使用深度强化学习优化并行前缀电路，公司可以设计更小、更快、更节能的芯片，同时提供更好的性能。
计算机芯片中的算术电路是使用逻辑门网络(如NAND、NOR和XOR)和电线构成的。理想的电路应具有以下特点：
●小：较小的区域，以便更多电路可以安装在芯片上。
●快速：降低延迟以提高芯片的性能。
●消耗更少的功率：芯片的功耗更低。
NVIDIA使用这种方法设计了近13000个AI辅助电路，与同样快速且功能相同的EDA工具相比，它们的面积减少了25% 。但是PrefixRL被提到是一项计算要求非常高的任务，并且对于每个GPU的物理模拟，它需要256个CPU和超过32,000个GPU小时。为了消除这个瓶颈， NVIDIA开发了Raptor ，这是一个内部分布式强化学习平台，它特别利用NVIDIA硬件进行这种工业强化学习。

文章图片
Raptor具有多项可提高可扩展性和训练速度的功能，例如作业调度、自定义网络和GPU感知数据结构。在PrefixRL的上下文中， Raptor使得跨CPU、GPU和Spot实例的混合分配工作成为可能。
这个强化学习应用程序中的网络是多种多样的，并且受益于以下几点。
●Raptor在NCCL之间切换以进行点对点传输以将模型参数直接从学习器GPU传输到推理GPU的能力。
●Redis用于异步和较小的消息，例如奖励或统计信息。
●一种JIT编译的RPC ，用于处理大容量和低延迟的请求，例如上传体验数据。

文章图片
NVIDIA得出结论，将AI应用于现实世界的电路设计问题可以在未来带来更好的GPU设计。
【NVIDIA正在使用AI开发和设计GPU】目前AI的应用越来越广泛，用于设计芯片也是很多硬件厂商都在尝试的事，未来，也许AI会在芯片制造中占据越来越重要的地位。