扎克伯格|市值狂跌2300亿后,扎克伯格把压箱底的技术掏出来了( 三 )


扎克伯格|市值狂跌2300亿后,扎克伯格把压箱底的技术掏出来了
文章插图
“最近,我们在两个顶级翻译比赛中获胜。”她讲到,“我们证明了多语种系统确实比双语系统更好,通过增加模型大小,例如通过生成更多培训数据和缩小翻译规模,我们证明了多语种翻译是一个非常有前途的发展方向。”
扎克伯格|市值狂跌2300亿后,扎克伯格把压箱底的技术掏出来了
文章插图
除此之外,Meta还可以自动创建一些翻译数据的示例,而无须雇用人员手动翻译大量数据。目前,Meta已经支持一百多种语言实现自动创建数据集,并且部分数据集开源。
四、Meta计划打造超级语音助手,连续决策成AI交互关键Meta AI的高级研究经理Alborz Geramifard谈到语音交互助手可以分为三个类别。
第一类是初级的语音助手。比如说我们想要查询话费,打电话给客户服务,你会听到请按1键获得话费信息,请按2键获得订阅服务等。“你常常会发现你想要的服务不在选项列表中”。第二类语音交互助手,但拥有可能有一些智能模型。“你可能会在家里和它们简单的互动。但它们不能理解语义背景,也不能进行深度交流。”第三类是Meta想要打造的超级语音助手。这类超级语音助手延续了深层次的语境,可以为用户提供个性化体验。比如你想早晨放一首歌曲,同时窗外又在下雨,超级语音助手就会根据此刻的场景为你推荐一首歌曲播放。
他还谈到,能理解的AI和能交互的AI是两种不同的概念。能理解的AI是一个单向的过程,从输入到输出,比如说转录音频解析可以得到相应的文本。
扎克伯格|市值狂跌2300亿后,扎克伯格把压箱底的技术掏出来了
文章插图
理解式AI和实时交互AI的区别
而交互是用户和AI之间能实现连续对话。例如,詹姆斯可能想向尼克发送一条消息,说他将迟到五分钟。当AI完成相关操作时,詹姆斯想将时间修改到10分钟,在这种情况下,詹姆斯可以继续修改他的时间安排,AI也能完成相关操作。在交互式的对话中往往会涉及连续决策的问题。
扎克伯格|市值狂跌2300亿后,扎克伯格把压箱底的技术掏出来了
文章插图
“我们的目标是将我们的项目打造的新模型与VR/AR设备相结合,通过AI实现更具沉浸式和多模态的交互形式。”
比如说,你的语音助手可以帮助你制作美味的食材,根据你的食谱列出食材,并主动引导你完成整个过程菜谱。并且,当你在这道菜中添加了盐时,超级语音助手注意到你的盐越来越少了,所以帮助你下了一个购物的订单。超级语音助手与你之间的互动越来越紧密。
五、开放数据集,Meta力图消除数据偏见去年夏天,Meta就曾发布了文章,概述了其AI原则的五大支柱,包括隐私和安全、公平和包容、稳健性、安全性、透明度和可控性。
面对AI公平性,Facebook AI的项目经理Jacqueline Pan谈到AI团队与另一个内部团队合作发布了一些对话数据集,这些数据集旨在帮助评估AI系统中可能存在的潜在算法。
最新的数据集将包含超过45000个付费参与者进行非脚本对话的视频,这些参与者透露了他们的年龄和性别,让AI能够相对公正地分析信息。
此外,Meta还能够提供肤色和声音的标签,该数据集旨在帮助研究人员评估其计算机视觉和音频模型在这些维度上的准确性。
扎克伯格|市值狂跌2300亿后,扎克伯格把压箱底的技术掏出来了
文章插图
Meta还曾在2020年与佐治亚理工学院的合作教学项目,以培养AI人才。
AI研究人员将与佐治亚理工学院教员一起打磨一门深度学习课程开发课程,并作为该大学计算机科学在线硕士课程的一部分,其主要目标是帮助学生体验现实世界中学习扩展算法时会用到哪些技术。