燧原科技发布第二代业云端AI推理加速卡“云燧i20”

基于全新一代“邃思”推理芯片,满足云端AI业务高吞吐、低延时的性能需求
2021年12月7日,专注人工智能领域云端算力平台的燧原科技正式发布第二代云端人工智能推理加速卡“云燧i20”,创新性地采用了高带宽HBM2E存储,从而使得AI加速卡存储带宽高达819 GB/s,为各类云端推理业务提供高吞吐、低延时的性能,这是目前为止业内宽带最大的云端AI推理卡。
燧原科技发布第二代业云端AI推理加速卡“云燧i20”
文章插图
燧原科技发布第二代人工智能推理加速卡“云燧i20”
此前,在2021世界人工智能大会上,燧原科技推出第二代云端AI训练芯片邃思2.0及训练产品云燧T20/T21,成为国内首家发布第二代人工智能训练产品组合的公司。
“云燧i20的发布标志着燧原科技在云端AI算力加速领域,从训练到推理的完整产品线已全面迭代到第二代,能够以更有竞争力的产品,为互联网、智慧城市、智慧政务,以及金融、交通、能源等传统行业客户提供更优的AI计算方案。”燧原科技CEO赵立东表示,“当前,我国芯片产业正处于激烈的成长与蜕变时代,燧原科技以‘做大芯片,拼硬科技’为时代使命,基于原始创新的软硬件架构,正在不断加速技术创新与产品迭代。”
燧原科技发布第二代业云端AI推理加速卡“云燧i20”
文章插图
燧原科技发布第二代业云端AI推理加速卡“云燧i20”
文章插图
燧原科技发布第二代人工智能推理加速卡“云燧i20”
自主创新芯片架构和技术升级,以更高性价比提供极致化性能
新一代“邃思”AI推理芯片采用第二代高性能计算核心和数据引擎,由12nm工艺打造,通过架构升级,大大提高了单位面积的晶体管效率,从而实现了与目前业内7nm GPU相匹敌的计算能力。基于12nm成熟工艺带来的成本优势,使得云燧i20在相同性能表现下更具性价比优势。
? 算力全面提高:云燧i20全面支持从FP32、TF32、FP16、BF16到INT8的计算精度。单精度FP32峰值算力达到32 TFLOPS,单精度张量TF32峰值算力达到128 TFLOPS,整型INT8峰值算力达到256 TOPS。对比第一代推理产品,云燧i20将浮点算力提升到1.8倍,整型算力提升到3.6倍。
? 性能和效率提升:“驭算TopsRider”升级后,在性能、开发效率和模型覆盖面上得到大幅提升。通过引入通用高层图优化和大规模算子融合技术,将模型平均性能提升3.5倍,硬件算力利用率平均提升2倍。通过升级的编程模型以及算子自动分片、自动生成技术,自定义算子开发效率翻倍,模型迁移成本大大降低。同时,驭算增强了对动态性的支持,使云燧i20在检测、语音识别、语义理解等场景更具竞争力。
? 部署灵活性增强:基于虚拟化和多实例加速技术,云燧i20能够实现单卡多用户,同时支持6个业务互不干扰、安全隔离运行,为客户业务架构带来轻耦合、灵活可靠的实现方式,显著提升资源利用率与投入产出比。
燧原科技发布第二代业云端AI推理加速卡“云燧i20”
文章插图
【 燧原科技发布第二代业云端AI推理加速卡“云燧i20”】燧原科技CEO赵立东和COO张亚林发布第二代云端AI推理产品
燧原科技COO张亚林指出:“云燧i20全面提升了算力,在兼顾全精度算力的同时大幅度提高了整型运算,大力加强了模型覆盖率和泛化支持的能力,可以满足云端推理业务高度多样化的需求。燧原科技目前已经拥有第二代的训练和推理产品,并支持国产服务器和操作系统,提供具有高性能及性价比的‘训练+推理’完整解决方案,持续为客户创造价值。”
(来源:河北网络广播电视台)