智算如火,浪潮如水

传统确定一个蛋白质结构 , 通常需要几个月甚至是几年 , 过去半个多世纪人类共解析了五万多个人源蛋白质的解构 , 但是基于深层神经网络的AlphaFold仅用一年时间就将结构信息预测比例从17%大幅提高到58% 。
在交通领域 , 数字世界和物理世界走向融合 , 未来城市每辆车的具体位置、每个路口有多少辆车、车移动的方向等都能用全量实时数据进行感知和调整 , 每年可为一座千万级人口的城市节约1500亿元 , 避免94%的人为交通事故 , 提升通行效率15-30%……
这些超乎想象的事实背后 , 都有同一个身影:智慧计算 。 《2021-2022全球计算力指数评估报告》显示 , 算力指数平均每提高1点 , 数字经济和GDP将分别增长3.5‰和1.8‰ , 当一个国家的算力指数达到40分、60分时 , 计算力对于GDP增长的推动力将增加1.5倍和3.0倍 。
智算如火,浪潮如水】智算正在以蓬勃的创造力带来磅礴的推动力 。
这是浪潮信息生态伙伴大会IPF这几年持续聚焦“智算”的原因所在 。 今年的IPF2022给人以耳目一新的感觉 , 正如其主题:“智算创见数实相融” 。 智算从看见到创见 , 推动数字世界与物理世界从相联到相融 。
智算如火,浪潮如水
文章图片
算力算法“基建化”的底层逻辑
“智算要想真正迸发出创造力 , 就需要算力算法基建化 , 即国家将算力、算法做成公共资源开放出来 。 ”浪潮信息CEO彭震在接受采访时这样说 。
算力基建化 , 已经得到了业界的广泛认可 , 而且推进迅速 。 在国家统筹布局下 , 全国性的算力枢纽工程开始建设 , 最近资本市场上炙手可热的“东数西算”就是如此 。 算力基建化 , 正在发挥越来越重要的作用 。 以浪潮建设的南京智算中心为例 , 运行一年多的时间 , 算力规模相当于1个小时内可以完成100亿张图像处理、300万小时语音翻译、1万公里自动驾驶数据处理 , 现已服务55家用户单位 , 覆盖了包括智能制造、气象检测和智慧交通等13个行业 。
智算如火,浪潮如水
文章图片
然而 , 为何算法也需要基建化?一方面是源自行业的进化 , 算法正在从专用算法走向通用算法 。 以前人们对神经元计算的认知比较浅 , 自然语义理解、文本识别、语言翻译、问答对话等不同应用场景采用专用算法效率更高 , 但是随着高泛化能力和高通用性的大模型的出现 , 无监督学习也使得开发者在模型训练初期基于高质量的数据 , 让AI可以自动做数据标识和训练 , 一个模型可以覆盖众多场景 。
另一方面是源自AI落地的痛点 , 这几年AI很热 , 但在落地的最后一公里上却遇到难题 , 归根结底是高昂的开发成本和技术门槛 , 数据的收集、标注和训练耗时耗力、复杂繁琐 , 相比起来 , 大模型催生出“预训练大模型+下游任务微调”这样更高效、简单的新模式 , 算法进入工业化时代 。
在这样的背景下 , 算法大模型就成为类似智算中心那样的新基建 。 以浪潮发布的全球最大规模中文人工智能巨量模型“源”为例 , 单体模型参数量达2457亿 , 训练采用的中文数据集达5000GB , “源1.0”上线不到5个月的时间 , 就已有超过200家单位试用 , 支持了100多个行业应用 。
“今时四宇求新 , 於赫有智 , 智隆于算 。 构基建为本 , 利之以芯 , 范之以理 , 修之以智 。 革新凭其威 , 技艺信其敏 。 感世事之大千兮 , 未尝有极 。 识倏忽之人情兮 , 安有常则?故内引智算于先 , 外察渊慧于势 。 智能为炉兮 , 元脑为工 , 算力为炭兮 , 数据为铜 。 汇引众力 , 则无惧关山难越 。 聚用众智 , 则敢为智算之先 。 ”很难想象这段精辟解析智算的诗是“源1.0”所作 , 机器智能正在媲美于人 。