郑纬民|人工智能落地方兴未艾 专家:发展开源和预训练大模型势在必行( 二 )


刘刚指出,不同于消费互联网靠大数据驱动,工业互联网是小数据驱动。“其场景更加复杂、特殊,比如运用在某一个企业的工业AI检查系统,可能在另一个企业就无法使用。这就需要公共的关键技术和公共技术的研发。”
刘刚告诉采访人员,目前人工智能已进入工程化阶段,场景趋于复杂化、碎片化。之所以说建立公共研发平台非常重要,是因为很多技术的底层算法需要高投入,参照国际经验,早期都需要政府的资金投入和研究型大学的科研支持。
今年5月,“科创中国”开源创新联合体成立,“以打造自主开源生态为宗旨,以建设产学研深度融合的开源创新体系为目标,以营造中国开源文化、提升开源创新能力为导向”。中国新一代人工智能发展战略研究院是开源创新联合体的发起单位。“我们作为联合体成员单位之一,要做的就是推动开源发展。”刘刚表示。
实际上,开源已成为全球数字科技创新的大趋势。此前,中国科学院科技战略咨询研究院副研究员隆云滔、中国科学院科技战略咨询研究院研究员王晓明在《科技日报》发表文章指出,“开源所具有的大众协同、开放共享、持续创新等特点,使参与者直接置身于最领先的技术行列。拥抱开源,不仅有利于紧密跟随技术发展趋势,还可对行业发展方向形成影响,真正做到站在巨人的肩膀上创新,最终达到尽最大可能保持和提升竞争力。”
围绕新一代人工智能科学前沿领域攻关,《十四五规划和2035年愿景目标纲要》明确提出了“深度学习框架等开源算法平台构建”等内容。
《纲要》指出,要加强关键数字技术创新应用,支持数字技术开源社区等创新联合体发展,完善开源知识产权和法律体系,鼓励企业开放软件源代码、硬件设计和应用服务。
针对数字经济重点产业中人工智能产业的发展,《纲要》提出,建设重点行业人工智能数据集,发展算法推理训练场景,推动通用化和行业化人工智能开放平台。
据科技部高新技术司相关负责人介绍,科技部在自动驾驶、医疗影像等一批细分领域,打造了16个国家新一代人工智能开放创新平台,发挥了领军企业的引领示范作用。例如,在自动驾驶平台建设上,目前全国范围的测试里程已超过1800万公里;在医疗影像平台方面,以武汉雷神山医院、方舱医院为例,2个月内就完成了2.4万人的远程影像检查。
预训练大模型为人工智能新业态
聚焦人工智能“三驾马车”,吴文峻对采访人员表示,“目前业界的一个共识是,未来新的业态是预训练大模型,即大数据、算法和算力的一个发展的新阶段。”
今年3月,我国首个超大规模人工智能模型“悟道1.0”发布。据了解,“悟道1.0”由智源研究院学术副院长、清华大学教授唐杰领衔,100余位人工智能科学家团队联合攻关。“悟道1.0”形成超大规模智能模型训练技术体系,训练出中文、多模态、认知、蛋白质预测在内的系列模型。
智源研究院院长黄铁军指出,本轮人工智能浪潮的基本特点是“数据+算力+算法=模型”,模型浓缩了训练数据的内部规律,是实现人工智能应用的载体。
唐杰表示,随着超大规模预训练模型系统的开放,大家不必从零开始,预训练基线智能水平大幅提升,平台多样化、规模化,大家在云上可以找到自己所需的模型。
【 郑纬民|人工智能落地方兴未艾 专家:发展开源和预训练大模型势在必行】郑纬民也在指出,自然语言模型最近几年发展非常迅猛,这个大模型具备很强的文本生成能力。“我们看一个文本数据,很多的数据经过预训练以后,产生一个很多参数的一个模型。用的时候你输了一个‘人工智能让世界变得’,就出来‘更美好’。”