AI|借助AI 人类能听懂动物的“喜怒哀乐”？( 二 ) 喜怒哀乐|同步采集|动物叫声

发表在《自然》期刊的科学研究证明，人工智能在破译古代人类语言方面非常有效。这为使用AI探索动物语言开辟了可能性。该研究称，机器学习技术提供了新的工具，可以帮助考古学家更快地了解过去，特别是在破译古代文字时。该AI系统采用了古希腊语言和整个古代地中海世界的铭文进行训练，训练数据来自相关人文学院提供的最大的希腊铭文数字数据集，而且这些铭文中的每一条都标注了元数据，其中描述了由历史学家考察出来的铭文的书写地点和时间。有了这些数据， AI就能在这些信息中寻找模式和规律，并利用复杂的数学模型来对这些信息进行编码，然后进一步使用这些推测出的信息来对其他铭文的内容、编写地点和年限进行推断。研究显示，该AI在修复受损文字方面达到了62%的准确率。这也为翻译动物语言提供了灵感。
人工智能在破解古文字和翻译动物语言上往往遵循同样的方法和准则。谭茗洲表示：在翻译这一经典任务上，机器不需要理解语言，而是仅靠单一语言的语料，即可掌握该语言的句法、语法等关键要素。也就是说，深度学习不懂英语和中文，但是通过大量学习语料即可获得中英互译的能力。
归根到底， AI能够翻译、理解动物语言，其背后依然是基于人类对语言进行的有效解读。谭茗洲说。
实现跨物种交流尚有很长的路要走
【AI|借助AI 人类能听懂动物的“喜怒哀乐”？】人类的语言有规律可循，因而不同国家的语言是可以遵循规律去学习的。但动物的语言规则存在未知壁垒，因此AI要实现跨物种语言翻译，尚有一段很长的路要走，需要克服一些困难。谭茗洲表示。
首先，事实证明，利用受人为偏见影响的数据进行训练的算法很容易将结果导向歧途。比如，狗会发出急促的叫声，可能是因为想要向主人乞食，也可能是因为提醒主人警惕陌生人，还可能是对主人不陪自己玩的责怪。但如果研究人员仅基于自己的认知，在对这种叫声数据进行标记的时候，认为这种叫声只表达宠物向主人要食物的需求，从而对数据进行单一标记处理，那么人工智能在学习数据、翻译的时候往往就会产生很大的局限性。这种翻译很容易导致人和宠物的沟通障碍，从而丧失宠语翻译的意义。
在研究中，科研人员需要去‘人类中心’ ，也就是说，借助于算法实现的跨物种沟通，需要算法避免人类某些偏见。谭茗洲指出。
其次，通过AI算法将人类语言与动物语言对应，需要大量、广泛、完善的数据采集和场景训练，以完成对动物语言的解读，实现对规则的总结。这需要广泛同步采集动物叫声和脑电波数据并进行比对，再将其纳入数据库。然而不同犬种声带特点不同，面对同一场景的发声表现也不同，而这样的场景和叫声的组合有无数个，这为数据采集工作带来了巨大的挑战。
谭茗洲说，在技术方面，一个AI翻译产品做到精确翻译至少需攻破几个难题：在形式端，如果使用拍译的形式要攻克图像识别相关问题，同声翻译形式则要攻克语音识别相关问题；在内容端， AI翻译产品还要攻克文本语言分析、大数据采集等问题。由于AI缺乏对视觉场景、听觉场景、自然语言处理的常识判断，这还需要AI发展到能够极为精确地处理这些问题的阶段。
此外，有学者指出，动物语言和人语之间的代沟是客观存在的， AI所能做的，只能是不断改进自身的功能，用科学手段完善数据库、内容、语料和场景；形式和内容双管齐下，才能将这条横亘在动物和人之间的语言鸿沟填平，在坚实的地基上实现人和动物的有效沟通。