郑纬民|人工智能落地方兴未艾专家：发展开源和预训练大模型势在必行( 二 ) 青城之光|自治区|和林格尔|乳

刘刚指出，不同于消费互联网靠大数据驱动，工业互联网是小数据驱动。“其场景更加复杂、特殊，比如运用在某一个企业的工业AI检查系统，可能在另一个企业就无法使用。这就需要公共的关键技术和公共技术的研发。”
刘刚告诉采访人员，目前人工智能已进入工程化阶段，场景趋于复杂化、碎片化。之所以说建立公共研发平台非常重要，是因为很多技术的底层算法需要高投入，参照国际经验，早期都需要政府的资金投入和研究型大学的科研支持。
今年5月，“科创中国”开源创新联合体成立，“以打造自主开源生态为宗旨，以建设产学研深度融合的开源创新体系为目标，以营造中国开源文化、提升开源创新能力为导向”。中国新一代人工智能发展战略研究院是开源创新联合体的发起单位。“我们作为联合体成员单位之一，要做的就是推动开源发展。”刘刚表示。
实际上，开源已成为全球数字科技创新的大趋势。此前，中国科学院科技战略咨询研究院副研究员隆云滔、中国科学院科技战略咨询研究院研究员王晓明在《科技日报》发表文章指出，“开源所具有的大众协同、开放共享、持续创新等特点，使参与者直接置身于最领先的技术行列。拥抱开源，不仅有利于紧密跟随技术发展趋势，还可对行业发展方向形成影响，真正做到站在巨人的肩膀上创新，最终达到尽最大可能保持和提升竞争力。”
围绕新一代人工智能科学前沿领域攻关，《十四五规划和2035年愿景目标纲要》明确提出了“深度学习框架等开源算法平台构建”等内容。
《纲要》指出，要加强关键数字技术创新应用，支持数字技术开源社区等创新联合体发展，完善开源知识产权和法律体系，鼓励企业开放软件源代码、硬件设计和应用服务。
针对数字经济重点产业中人工智能产业的发展，《纲要》提出，建设重点行业人工智能数据集，发展算法推理训练场景，推动通用化和行业化人工智能开放平台。
据科技部高新技术司相关负责人介绍，科技部在自动驾驶、医疗影像等一批细分领域，打造了16个国家新一代人工智能开放创新平台，发挥了领军企业的引领示范作用。例如，在自动驾驶平台建设上，目前全国范围的测试里程已超过1800万公里；在医疗影像平台方面，以武汉雷神山医院、方舱医院为例，2个月内就完成了2.4万人的远程影像检查。
预训练大模型为人工智能新业态
聚焦人工智能“三驾马车”，吴文峻对采访人员表示，“目前业界的一个共识是，未来新的业态是预训练大模型，即大数据、算法和算力的一个发展的新阶段。”
今年3月，我国首个超大规模人工智能模型“悟道1.0”发布。据了解，“悟道1.0”由智源研究院学术副院长、清华大学教授唐杰领衔，100余位人工智能科学家团队联合攻关。“悟道1.0”形成超大规模智能模型训练技术体系，训练出中文、多模态、认知、蛋白质预测在内的系列模型。
智源研究院院长黄铁军指出，本轮人工智能浪潮的基本特点是“数据+算力+算法=模型”，模型浓缩了训练数据的内部规律，是实现人工智能应用的载体。
唐杰表示，随着超大规模预训练模型系统的开放，大家不必从零开始，预训练基线智能水平大幅提升，平台多样化、规模化，大家在云上可以找到自己所需的模型。
【郑纬民|人工智能落地方兴未艾专家：发展开源和预训练大模型势在必行】郑纬民也在指出，自然语言模型最近几年发展非常迅猛，这个大模型具备很强的文本生成能力。“我们看一个文本数据，很多的数据经过预训练以后，产生一个很多参数的一个模型。用的时候你输了一个‘人工智能让世界变得’，就出来‘更美好’。”

郑纬民|人工智能落地方兴未艾 专家：发展开源和预训练大模型势在必行( 二 )

郑纬民|人工智能落地方兴未艾专家：发展开源和预训练大模型势在必行( 二 )