输入法|搅局GDC GTC AMD提前推出Instinct MI210加速器( 二 )


MI210的推出也标志着AMD将改进的矩阵核引入PCIe卡 。 对于CDNA 2 , 它们已经被扩展到允许全速FP64矩阵运算 , 使其达到与FP32矩阵运算相同的256次浮点运算的速率 , 比以前的64次浮点运算/时钟/CU速率提高了4倍 。
接下来 , PCIe格式的MI210还可以在卡的顶部获得三个Infinity Fabric 3.0链路 , 就像MI100一样 。 这允许MI210卡与一个或三个其他卡连接 , 形成一个2路或4路卡簇 。 同时 , 通过PCIe 4.0 x16连接提供到CPU或任何其他PCIe设备的回程 , 该连接由GCD的一个灵活IF链路供电 。
如前所述 , MI210的TDP设置为300W , 与之前的MI100和MI50相同 , 基本上是PCIe服务器卡的限制 。 与大多数服务器加速器一样 , 这是一种完全被动的双插槽卡设计 , 依靠服务器机箱的大量气流来降温 。 GPU本身由PCIe插槽和卡后部的8针EPS12V连接器的组合供电 。



除此之外 , 尽管外形因素发生了变化 , AMD仍在追求与MI250(X)大致相同的市场 。 也就是说 , 特别需要快速FP64加速器的HPC用户 。 由于MI200系列是一款首先为超级计算机(即Frontier)设计的芯片 , 其FP64矢量和FP64矩阵性能目前独树一帜 , 因为竞争对手的GPU专注于在大多数工业/非科学工作负载中使用的较低精度下提高性能 。 尽管精度较低 , 但MI200系列在FP16和BF16矩阵运算中的每CU 1024次失败率也不值得一提 。
总而言之 , AMD的服务器合作伙伴包括华硕、戴尔、超微、HPE和联想 , 今天将推出MI210 。 这些供应商现在还提供基于AMD的MI250(X)加速器的服务器 , 因此AMD更主流的客户将能够访问基于AMD的全系列MI200加速器的系统 。