叫声|借助AI 人类能听懂动物的“喜怒哀乐”?( 二 )

一位研究人员曾经旁听了两只位置相对静止的抹香鲸之间断断续续长达40分钟的“对话” , 它们的“对话”几乎每一句都不重样 , 并且伴有各种动作 。 这令人不禁猜测:是否这两只母鲸在“拉家常”、分享育儿心得?对抹香鲸“对话”内容的研究 , 正是近几年由国际科学家团队发起、《国家地理》支持的“鲸语翻译计划”(Project CETI)中的研究内容之一 。据报道 , 研究人员正在使用自然语言处理系统(NLP)分析抹香鲸的40亿个交流代码 。 NLP是人工智能的一个子领域 , 专注于处理人类的书面和口头语言 。 研究团队计划让人工智能将每个声音与特定的背景联系起来 , 这一过程预计至少需要5年时间 。 如果该团队实现了这些目标 , 下一步将是开发和部署一个互动聊天机器人 , 与生活在野外的抹香鲸进行对话 。
发表在《自然》期刊的科学研究证明 , 人工智能在破译古代人类语言方面非常有效 。 这为使用AI探索动物语言开辟了可能性 。 该研究称 , 机器学习技术提供了新的工具 , 可以帮助考古学家更快地了解过去 , 特别是在破译古代文字时 。 该AI系统采用了古希腊语言和整个古代地中海世界的铭文进行训练 , 训练数据来自相关人文学院提供的最大的希腊铭文数字数据集 , 而且这些铭文中的每一条都标注了元数据 , 其中描述了由历史学家考察出来的铭文的书写地点和时间 。 有了这些数据 , AI就能在这些信息中寻找模式和规律 , 并利用复杂的数学模型来对这些信息进行编码 , 然后进一步使用这些推测出的信息来对其他铭文的内容、编写地点和年限进行推断 。 研究显示 , 该AI在修复受损文字方面达到了62%的准确率 。 这也为翻译动物语言提供了灵感 。
人工智能在破解古文字和翻译动物语言上往往遵循同样的方法和准则 。 谭茗洲表示:“在翻译这一经典任务上 , 机器不需要理解语言 , 而是仅靠单一语言的语料 , 即可掌握该语言的句法、语法等关键要素 。 也就是说 , 深度学习不懂英语和中文 , 但是通过大量学习语料即可获得中英互译的能力 。 ”
“归根到底 , AI能够翻译、理解动物语言 , 其背后依然是基于人类对语言进行的有效解读 。 ” 谭茗洲说 。
实现跨物种交流尚有很长的路要走
“人类的语言有规律可循 , 因而不同国家的语言是可以遵循规律去学习的 。 但动物的语言规则存在未知壁垒 , 因此AI要实现跨物种语言翻译 , 尚有一段很长的路要走 , 需要克服一些困难 。 ”谭茗洲表示 。
首先 , 事实证明 , 利用受人为偏见影响的数据进行训练的算法很容易将结果导向“歧途” 。 比如 , 狗会发出急促的叫声 , 可能是因为想要向主人乞食 , 也可能是因为提醒主人警惕陌生人 , 还可能是对主人不陪自己玩的责怪 。 但如果研究人员仅基于自己的认知 , 在对这种叫声数据进行标记的时候 , 认为这种叫声只表达宠物向主人要食物的需求 , 从而对数据进行单一标记处理 , 那么人工智能在学习数据、翻译的时候往往就会产生很大的局限性 。 这种翻译很容易导致人和宠物的沟通障碍 , 从而丧失宠语翻译的意义 。
“在研究中 , 科研人员需要去‘人类中心’ , 也就是说 , 借助于算法实现的跨物种沟通 , 需要算法避免人类某些偏见 。 ”谭茗洲指出 。
其次 , 通过AI算法将人类语言与动物语言对应 , 需要大量、广泛、完善的数据采集和场景训练 , 以完成对动物语言的解读 , 实现对“规则”的总结 。 这需要广泛同步采集动物叫声和脑电波数据并进行比对 , 再将其纳入数据库 。 然而不同犬种声带特点不同 , 面对同一场景的发声表现也不同 , 而这样的场景和叫声的组合有无数个 , 这为数据采集工作带来了巨大的挑战 。