潘云鹤:元宇宙要模拟物理世界与人类社会,难点是“数字人”

人工智能未来的创新方向是什么?
在9月1日举行的2022世界人工智能大会科学前沿全体会议上 , 中国工程院院士、浙江大学教授潘云鹤在演讲时指出 , 大数据和跨媒体智能、跨媒体知识表达相结合 , 将是人工智能第四次创新方向 。
潘云鹤是在做《人工智能的走向:知识的登台与升级》主题演讲时说这番话的 。 他说 , 回忆60年来人工智能的主流核心技术 , 已经创新了三次 。
潘云鹤:元宇宙要模拟物理世界与人类社会,难点是“数字人”
文章图片
2022年9月1日 , 上海 , 2022世界人工智能大会科学前沿全体会议 , 中国工程院院士、浙江大学教授潘云鹤在演讲 。 澎湃新闻采访人员俞凯图
第一阶段:最早的人工智能大概在上世纪50、60年代 , 是规则和逻辑驱动的人工智能 。
第二阶段:到了上世纪60、70年代 , 人工智能进化到了知识和推理驱动的人工智能 , 知识不但使用逻辑 , 而且使用比逻辑更加广泛的人类经验 。
第三阶段:知识工程很快被深度神经网络替代 , 原因是那时候的知识表达都是字符型的 , 那时候的人工智能只能处理符号型的人工智能 , 只能把人类的符号知识、语言知识进行表达 。 这就留下了一大块空白 , 这块空白刚好由深度神经网络进行替代 , 因此 , 深度神经网络在视觉识别、听觉识别、文字识别、多媒体人工智能方面得到了极大的突破 。 但是 , 也产生了很多缺点 , 这就是现在大家正在讲的不可解释、不可以迁移使用 , 而且大量需要标识化的数据 。
潘云鹤:元宇宙要模拟物理世界与人类社会,难点是“数字人”】所以潘云鹤认为 , 大数据和跨媒体智能、跨媒体知识表达相结合 , 将是人工智能第四次创新方向 , 这个方向是数据和知识双轮驱动的人工智能 。 而且这其中开路先锋的 , 很可能就是视觉知识、文字知识等其他知识的多重知识表达 , 而且对视觉的对象要进行理解和识别 , 第一要识别 , 第二要分析 , 第三要进行模拟 。
潘云鹤说 , 跨媒体人工智能、多媒体人工智能的应用 , 不仅仅将用于图像识别 , 而且将用于视觉生成 。 这次大会讨论的中心问题“元宇宙” , 实际上不仅要有大量的设备识别 , 还要有大量的视觉生成 。 元宇宙的本质 , 是建立在互联网上可以体验的虚拟世界 , 元宇宙是在人的世界中从两元空间转向三元空间 , 三元空间可以把物理世界和人的社会投射到信息空间中 , 这就是元宇宙的重要基础 。 因此 , 全世界都纷纷转向重视元宇宙的发展 , 像英国、欧盟、美国等地的各大公司都在探索中 。
元宇宙一方面要模拟物理世界 , 一方面要模拟人类社会 , 而其中的难点是“数字人” 。 表面上 , “数字人”是有数字化外形的虚拟人 , 不但要表现人的外观、人的动作、人的感知认知能力 , 而且还要表现人的个性化数据 。 因此 , 本身是一个人的跨媒体知识表达 。 大家都已经看到了“数字人”有各种各样的应用 , 比如说数字主播、虚拟社交、智慧诊疗、人体工学 。
“视觉知识多重知识表达、视觉理解和NDD相结合 , 将生成双轮驱动的人工智能大潮 。 估计在未来的人工智能发展中将成为主流的发展方向 。 因此 , 要记住 , 大数据、大模型固然很重要 , 但是大知识同样很重要 , 要在大知识中提早布局 , 并且取得快速推进 。 ”潘云鹤给出了自己的建议 。