NVIDIA正在使用AI开发和设计GPU

在过去几年时间里 , NVIDIA深耕AI领域 , 他们的GPU不仅成为HPC的首选 , 也成为包括AI和深度学习生态系统在内的数据中心的首选 。
现在 , 在最新公布的开发者博文中 , NVIDIA宣布正利用AI来设计和开发GPU , 其最新的HopperGPU拥有将近13000个电路实例 , 而这些实例完全由AI创建 。
NVIDIA正在使用AI开发和设计GPU
文章图片
在NVIDIADevelope上发布的新博客中 , 该公司重申了其优势以及它自己如何利用其AI功能来设计其迄今为止最强大的GPU--HopperH100 。 NVIDIAGPU主要是使用最先进的EDA(电子设计自动化)工具设计的 , 但在利用PrefixRL方法的AI的帮助下 , 使用深度强化学习优化并行前缀电路 , 公司可以设计更小、更快、更节能的芯片 , 同时提供更好的性能 。
计算机芯片中的算术电路是使用逻辑门网络(如NAND、NOR和XOR)和电线构成的 。 理想的电路应具有以下特点:
●小:较小的区域 , 以便更多电路可以安装在芯片上 。
●快速:降低延迟以提高芯片的性能 。
●消耗更少的功率:芯片的功耗更低 。
NVIDIA使用这种方法设计了近13000个AI辅助电路 , 与同样快速且功能相同的EDA工具相比 , 它们的面积减少了25% 。 但是PrefixRL被提到是一项计算要求非常高的任务 , 并且对于每个GPU的物理模拟 , 它需要256个CPU和超过32,000个GPU小时 。 为了消除这个瓶颈 , NVIDIA开发了Raptor , 这是一个内部分布式强化学习平台 , 它特别利用NVIDIA硬件进行这种工业强化学习 。
NVIDIA正在使用AI开发和设计GPU
文章图片
Raptor具有多项可提高可扩展性和训练速度的功能 , 例如作业调度、自定义网络和GPU感知数据结构 。 在PrefixRL的上下文中 , Raptor使得跨CPU、GPU和Spot实例的混合分配工作成为可能 。
这个强化学习应用程序中的网络是多种多样的 , 并且受益于以下几点 。
●Raptor在NCCL之间切换以进行点对点传输以将模型参数直接从学习器GPU传输到推理GPU的能力 。
●Redis用于异步和较小的消息 , 例如奖励或统计信息 。
●一种JIT编译的RPC , 用于处理大容量和低延迟的请求 , 例如上传体验数据 。
NVIDIA正在使用AI开发和设计GPU
文章图片
NVIDIA得出结论 , 将AI应用于现实世界的电路设计问题可以在未来带来更好的GPU设计 。
NVIDIA正在使用AI开发和设计GPU】目前AI的应用越来越广泛 , 用于设计芯片也是很多硬件厂商都在尝试的事 , 未来 , 也许AI会在芯片制造中占据越来越重要的地位 。