受访者|超级大脑!AI大模型有望重塑信息产业格局( 二 )


田奇介绍 , AI大模型已应用于国网电力部门的日常线路检测 。 “以前要识别各种电力传输线上的缺陷 , 需要针对每一类缺陷单独做一个小模型 , 有几百种缺陷就要做几百种模型 , 现在利用一个大模型就可完成各类缺陷的识别 。 ”
值得注意的是 , AI大模型目前的技术进步 , 是人工智能从感知向认知演进的关键环节 。 清华大学计算机科学与技术系副教授刘知远表示 , 古今中外一切文章、资料 , 都可作为训练大模型的数据 。 通过分析并“内化”海量知识 , 不仅让智能产品拥有更高性能 , 如机器翻译更加准确、机器写作更加生动有逻辑;还能品读人类情感 , 用于情感标注 。 此外 , “它可能识别到‘弦外之音’ , 甚至有希望发现人类未曾掌握的知识 。 ”
这一技术的发展 , 也可能给部分产业带来重大变革 。 周明说 , 未来将产生新一代搜索引擎 。 “目前大部分搜索引擎是基于关键词识别 , 只将库里已有的包含关键词的结果‘搬运’给用户 , 而基于大模型的新一代搜索引擎 , 通过理解人类语言 , 可以自主生成回答 , 且支持文字、图片、音频、视频等多模态搜索 。 ”
田奇表示 , 新一代搜索引擎具备创作能力 , 比如搜索“长翅膀的猫”“会飞的猪”等现实中不存在的事物 , 搜索引擎也可根据描述生成相应照片 。
多重发展难题待解
当前 , 美国OpenAI、谷歌、微软、脸书、英伟达等海外公司纷纷布局AI大模型产业 , 国内的华为、阿里巴巴、百度等大型企业 , 以及高校、科研机构也加入研发赛道 。 AI大模型正成为人工智能“新高地” 。
采访人员调研了解到 , 从技术上讲 , 国内AI大模型已初步成熟 , 下一步将聚焦行业推广 , 并结合具体问题对模型进行迭代 。 田奇预测 , AI大模型的大规模应用“可能还需要两到三年时间” , 且未来AI大模型还有望集纳于芯片上 , 更方便落地应用 。
专家指出 , 我国有较大的AI大模型应用市场 , 在应用领域具有优势 , 但发展过程中也面临一些挑战 。
刘知远介绍 , 很多核心技术目前仍然掌握在发达国家手中 , 训练AI大模型需大量GPU(图形处理器)芯片 , 但当前国产GPU芯片技术相对薄弱 。 同时 , 我国在算法上的原始创新能力也有待提升 。
多位受访者表示 , 目前从事AI大模型研发且能产出创新性成果的高校、科研机构和企业屈指可数 , 与国外相比 , 我国相关领域高水平基础人才培养力度有待加强 。
此外 , 训练大模型需要较高的电力成本、设备成本等 , 很多中小企业、科研单位囿于高昂成本 , 无法搭建拥有充足算力的机房 , 面临算力不足的问题 。
多措并举抢占“新高地”
【受访者|超级大脑!AI大模型有望重塑信息产业格局】多位专家表示 , AI大模型有望实现人工智能从感知到认知的跃迁 , 将更高效地赋能AI产业化和产业AI化 。 相关技术研发和产业布局引导、配套支持政策、合理监管等举措能否有效落地至关重要 。
首先 , 推进AI大模型标准化 。 受访专家指出 , 大模型的训练过程具有高能耗的特点 , 制定标准后 , 许多工作可基于已经开发的标准化大模型进行适配和二次开发 , 无需每次从头训练 , 以降低能耗 。 同时 , 大模型发展的过程中 , 也可能衍生违法违规信息生成、隐私泄露、虚假信息传播等风险 , 对用于训练模型的源头数据等做好规范 , 有利于规避相关风险 。 国家相关部门可牵头或引导企业、研究所、高校等共同定义大模型的标准 。
其次 , 适当开放训练数据 。 受访者表示 , 训练大模型需要海量数据 , 出于对数据的隐私、安全等方面的担忧 , 一些领域难以获取数据 , 形成数据孤岛 。 建议在国家机构监管和宏观把控的前提下 , 各方数据能够对白名单企业、机构、高校适当开放 , 在确保数据安全使用的同时 , 增强我国AI大模型实力 。 例如 , 医院等机构适当开放数据 , 将有利于训练更懂医疗的大模型 , 赋能健康医药领域发展 。