潘云鹤：元宇宙要模拟物理世界与人类社会，难点是“数字人” 人工智能未来的创新方向是什

人工智能未来的创新方向是什么？
在9月1日举行的2022世界人工智能大会科学前沿全体会议上，中国工程院院士、浙江大学教授潘云鹤在演讲时指出，大数据和跨媒体智能、跨媒体知识表达相结合，将是人工智能第四次创新方向。
潘云鹤是在做《人工智能的走向：知识的登台与升级》主题演讲时说这番话的。他说，回忆60年来人工智能的主流核心技术，已经创新了三次。

文章图片
2022年9月1日，上海， 2022世界人工智能大会科学前沿全体会议，中国工程院院士、浙江大学教授潘云鹤在演讲。澎湃新闻采访人员俞凯图
第一阶段：最早的人工智能大概在上世纪50、60年代，是规则和逻辑驱动的人工智能。
第二阶段：到了上世纪60、70年代，人工智能进化到了知识和推理驱动的人工智能，知识不但使用逻辑，而且使用比逻辑更加广泛的人类经验。
第三阶段：知识工程很快被深度神经网络替代，原因是那时候的知识表达都是字符型的，那时候的人工智能只能处理符号型的人工智能，只能把人类的符号知识、语言知识进行表达。这就留下了一大块空白，这块空白刚好由深度神经网络进行替代，因此，深度神经网络在视觉识别、听觉识别、文字识别、多媒体人工智能方面得到了极大的突破。但是，也产生了很多缺点，这就是现在大家正在讲的不可解释、不可以迁移使用，而且大量需要标识化的数据。
【潘云鹤：元宇宙要模拟物理世界与人类社会，难点是“数字人”】所以潘云鹤认为，大数据和跨媒体智能、跨媒体知识表达相结合，将是人工智能第四次创新方向，这个方向是数据和知识双轮驱动的人工智能。而且这其中开路先锋的，很可能就是视觉知识、文字知识等其他知识的多重知识表达，而且对视觉的对象要进行理解和识别，第一要识别，第二要分析，第三要进行模拟。
潘云鹤说，跨媒体人工智能、多媒体人工智能的应用，不仅仅将用于图像识别，而且将用于视觉生成。这次大会讨论的中心问题“元宇宙” ，实际上不仅要有大量的设备识别，还要有大量的视觉生成。元宇宙的本质，是建立在互联网上可以体验的虚拟世界，元宇宙是在人的世界中从两元空间转向三元空间，三元空间可以把物理世界和人的社会投射到信息空间中，这就是元宇宙的重要基础。因此，全世界都纷纷转向重视元宇宙的发展，像英国、欧盟、美国等地的各大公司都在探索中。
元宇宙一方面要模拟物理世界，一方面要模拟人类社会，而其中的难点是“数字人” 。表面上， “数字人”是有数字化外形的虚拟人，不但要表现人的外观、人的动作、人的感知认知能力，而且还要表现人的个性化数据。因此，本身是一个人的跨媒体知识表达。大家都已经看到了“数字人”有各种各样的应用，比如说数字主播、虚拟社交、智慧诊疗、人体工学。
“视觉知识多重知识表达、视觉理解和NDD相结合，将生成双轮驱动的人工智能大潮。估计在未来的人工智能发展中将成为主流的发展方向。因此，要记住，大数据、大模型固然很重要，但是大知识同样很重要，要在大知识中提早布局，并且取得快速推进。 ”潘云鹤给出了自己的建议。