本文转自:四川日报成都智算中心航拍图。|探访成都智算中心:算力“底座”里的四川“智造”

本文转自:四川日报
本文转自:四川日报成都智算中心航拍图。|探访成都智算中心:算力“底座”里的四川“智造”
文章图片
成都智算中心航拍图 。 受访者供图
本文转自:四川日报成都智算中心航拍图。|探访成都智算中心:算力“底座”里的四川“智造”
文章图片
成都智算中心智算平台机房内部 。 四川日报全媒体采访人员吴忧摄
近日 , 成都智算中心正式上线 , 一批应用投入运营 。 作为“东数西算”国家一体化大数据中心成渝枢纽节点的样板工程 , 成都智算中心是西南地区最大的人工智能计算中心 , 也是强大的算力“底座” , 首期提供总计300P的人工智能算力 , 相当于15万台高性能个人计算机的算力 。
强大算力从何而来?算力“底座”如何搭建?近日 , 采访人员走进成都智算中心的核心区域探“底” 。
基础平台叫“天宫”从处理器到系统都是自主造
在成都智算中心人工智能算力平台的机房 , 排列齐整的机柜透着蓝光 , 机柜里的服务器指示灯交替闪烁 , 片刻未息 。
“首期300P的算力 , 利用率已超过90% , 可以说上线就是饱和运营 。 ”负责项目运营的智算云腾(成都)科技有限公司智算项目经理王富红介绍 , 目前这里的算力正在为多个项目提供支撑 。 这些强大的算力 , 正是源于眼前的机柜和机柜里的服务器 。
采访人员注意到 , 在每台机柜侧面 , 都有一个红色的“天宫”标识——这是成都智算中心的核心基础设施 , 全称是“天宫”昇腾AI全栈基础软硬件平台 。
“取名‘天宫’ , 凸显自主创新 。 ”四川华鲲振宇智能科技有限责任公司(以下简称“华鲲振宇”)是成都智算中心的承建方 , 也是这些“天宫”的供应商 , 该公司常务副总裁、首席战略官刘东告诉采访人员 , 这个基础平台从处理器到系统都是自主打造 , “实现了全国产化 , 自主可控、安全可靠 。 ”
硬件方面 , “天宫”基于昇腾处理器开发 , 后者是国产自研人工智能处理器 , 具备高算力、高能效的特点 。 软件方面 , 成都智算中心所采用的基础软件 , 以及算力服务管理平台、第三方AI平台、深度学习运营管理平台等 , 也是自主搭建而成 。
“从后端的运行控制 , 到前端的用户交流界面 , 都是从头定制 。 ”华鲲振宇成都智算中心项目技术负责人龙昌伟告诉采访人员 , 与通用算力不同 , 智算中心主要负责人工智能领域的计算 , 而成都智算中心聚焦节能增效、降低延迟 , 按照存储和计算一体、训练和推理一体来建设 , 此前几乎没有先例可循 , “自主开发的全新软件 , 针对性更强、效率更高 , 更能确保智算中心安全稳定运行 。 ”搭建过程像搭积木模块化机房7天完成堆叠
“天宫”造好 , 还需点亮 。 在成都智算中心 , 人工智能算力平台从开工建设到上线点亮只用了120天 , 核心机房的搭建只用了短短7天 。 如此快速的背后 , 是一种全新的建设方式 。
“我们称之为‘乐高式’快速堆叠 。 ”龙昌伟介绍 , 成都智算中心的建设采用预制模块化、钢构和土建三种方案一体推进 , 是国内首个采用这种方式建设的样板工程 。 具体来说 , 整个机房被拆分为65个模块化的箱体 , 全部提前在工厂完成预制 , 再通过吊装的方式在现场进行快速堆叠 , 最后进行调试 。
“30天完成工程预制 , 两天进行运输 , 7天完成现场吊装 , 然后用60天完成内部安装调试和验收 。 ”龙昌伟说 , 依靠这种施工方式 , 整个机房一站式交付 , 让建设工期缩短了50%以上 , “通过这样的模块化设计 , 还能提升运维效率 , 并保证以后可以按需部署、按需扩容 , 实现快速升级 。 ”