受访者|超级大脑！AI大模型有望重塑信息产业格局( 二 )

田奇介绍， AI大模型已应用于国网电力部门的日常线路检测。 “以前要识别各种电力传输线上的缺陷，需要针对每一类缺陷单独做一个小模型，有几百种缺陷就要做几百种模型，现在利用一个大模型就可完成各类缺陷的识别。 ”
值得注意的是， AI大模型目前的技术进步，是人工智能从感知向认知演进的关键环节。清华大学计算机科学与技术系副教授刘知远表示，古今中外一切文章、资料，都可作为训练大模型的数据。通过分析并“内化”海量知识，不仅让智能产品拥有更高性能，如机器翻译更加准确、机器写作更加生动有逻辑；还能品读人类情感，用于情感标注。此外， “它可能识别到‘弦外之音’ ，甚至有希望发现人类未曾掌握的知识。 ”
这一技术的发展，也可能给部分产业带来重大变革。周明说，未来将产生新一代搜索引擎。 “目前大部分搜索引擎是基于关键词识别，只将库里已有的包含关键词的结果‘搬运’给用户，而基于大模型的新一代搜索引擎，通过理解人类语言，可以自主生成回答，且支持文字、图片、音频、视频等多模态搜索。 ”
田奇表示，新一代搜索引擎具备创作能力，比如搜索“长翅膀的猫”“会飞的猪”等现实中不存在的事物，搜索引擎也可根据描述生成相应照片。
多重发展难题待解
当前，美国OpenAI、谷歌、微软、脸书、英伟达等海外公司纷纷布局AI大模型产业，国内的华为、阿里巴巴、百度等大型企业，以及高校、科研机构也加入研发赛道。 AI大模型正成为人工智能“新高地” 。
采访人员调研了解到，从技术上讲，国内AI大模型已初步成熟，下一步将聚焦行业推广，并结合具体问题对模型进行迭代。田奇预测， AI大模型的大规模应用“可能还需要两到三年时间” ，且未来AI大模型还有望集纳于芯片上，更方便落地应用。
专家指出，我国有较大的AI大模型应用市场，在应用领域具有优势，但发展过程中也面临一些挑战。
刘知远介绍，很多核心技术目前仍然掌握在发达国家手中，训练AI大模型需大量GPU（图形处理器）芯片，但当前国产GPU芯片技术相对薄弱。同时，我国在算法上的原始创新能力也有待提升。
多位受访者表示，目前从事AI大模型研发且能产出创新性成果的高校、科研机构和企业屈指可数，与国外相比，我国相关领域高水平基础人才培养力度有待加强。
此外，训练大模型需要较高的电力成本、设备成本等，很多中小企业、科研单位囿于高昂成本，无法搭建拥有充足算力的机房，面临算力不足的问题。
多措并举抢占“新高地”
【受访者|超级大脑！AI大模型有望重塑信息产业格局】多位专家表示， AI大模型有望实现人工智能从感知到认知的跃迁，将更高效地赋能AI产业化和产业AI化。相关技术研发和产业布局引导、配套支持政策、合理监管等举措能否有效落地至关重要。
首先，推进AI大模型标准化。受访专家指出，大模型的训练过程具有高能耗的特点，制定标准后，许多工作可基于已经开发的标准化大模型进行适配和二次开发，无需每次从头训练，以降低能耗。同时，大模型发展的过程中，也可能衍生违法违规信息生成、隐私泄露、虚假信息传播等风险，对用于训练模型的源头数据等做好规范，有利于规避相关风险。国家相关部门可牵头或引导企业、研究所、高校等共同定义大模型的标准。
其次，适当开放训练数据。受访者表示，训练大模型需要海量数据，出于对数据的隐私、安全等方面的担忧，一些领域难以获取数据，形成数据孤岛。建议在国家机构监管和宏观把控的前提下，各方数据能够对白名单企业、机构、高校适当开放，在确保数据安全使用的同时，增强我国AI大模型实力。例如，医院等机构适当开放数据，将有利于训练更懂医疗的大模型，赋能健康医药领域发展。