趋势|谷歌大神 Jeff Dean 领衔,万字展望五大AI趋势( 五 )


人们比以往任何时候都依赖他们的手机摄像头来记录日常生活和创作灵感。机器学习在计算摄影中的巧妙应用提升了手机相机的功能,使它们更易于使用,产生了更高质量的图像。一些先进的技术,如改进的 HDR+,在弱光下的拍摄能力,更好的人像处理功能,及更大的包容性使得手机摄像可以更真实地反映拍摄对象。Google Photos 中基于机器学习的强大工具如 Magic Eraser 等还能进一步优化照片。
趋势|谷歌大神 Jeff Dean 领衔,万字展望五大AI趋势
文章插图
除了用手机进行创造外,许多人还依赖手机与他人实时跨语言沟通,例如在打电话时使用 Live Translate 和 Live Caption。由于自我监督学习(self-supervised learning)和有噪音的学生训练(noisy student training)等技术,语音识别准确率持续改善。对有口音的语音、嘈杂的语音或重叠语音等有明显的改善。在文本到语音合成的进步基础上,人们可以使用谷歌朗读技术 Read Aloud 在越来越多的平台上收听网页和文章,使获取信息更加便宜,跨越了模态和语言的障碍。通过稳定生成的即时翻译,谷歌翻译(Google Translate)的实时语音翻译水平显著改善。高质量的语音翻译在多语言交流时提供了更好的用户体验。在 Lyra 语音编解码器和 Soundstream 音频编解码器中,机器学习与传统编解码器方法相结合使语音、音乐和其他声音能够以低得多的比特率保真地传送。
趋势|谷歌大神 Jeff Dean 领衔,万字展望五大AI趋势
文章插图
智能文本选择(Smart Text Selection)等工具得到了改进,它可以自动选择电话号码或地址等信息,以便复制和粘贴。此外,Screen Attention 可以防止手机屏幕变暗,凝视识别技术有所的改进。机器学习还让人们的生活更加安全。例如, Suspicious Message Alerts 对可能的网络钓鱼攻击提出预警,Safer Routing 提出更加安全的替代路线。
考虑到这些功能使用数据的敏感性,把它们默认设置为不共享是很重要的。以上提到的许多功能都在 Android的Private Compute Core 中运行。这是一个开源的、安全的环境,与操作系统的其余部分隔离开。Android 确保未经用户同意,不会将在 Private Compute Core 中的数据共享给任何应用程序。Android 还阻止 Private Compute Core 的任何功能直接访问网络。功能通过一小部分开源 API 与 Private Compute Services 进行通信,这样就能剔除身份敏感信息并使用联邦学习、联邦分析和私人信息检索等功能保护隐私。
这些技术对于发展下一代计算和交互范例至关重要,个人或公共设备需要在不损害隐私的情况下学习并帮助训练(算法)模型。联邦的无人监督学习方法,可以创造出越来越智能的系统。这些系统的交互更加直观,更像是一个社交实体,而不是一台机器。只有对我们的技术进行深刻变革,才有可能广泛而公平地拥有这些智能系统,让它们支持神经计算。
趋势4:机器学习在科学、健康和可持续发展方面的影响越来越大近年来,我们看到机器学习在物理、生物等基础科学科的影响越来越大,在可再生能源和医学等领域也有许多令人兴奋的应用。计算机视觉模型对个人和全球问题都有所功效。它们可以帮助医生进行工作,扩大我们对神经生理学的理解,还可以提供更好的天气预报,加快救灾工作。其他类型的机器学习模型能发现减少碳排放和提高替代能源产量的方法,在应对气候变化方面至关重要。这样的模型甚至可以作为艺术家的创作工具!随着机器学习变得更加强健(鲁棒)和完善,它在的应用潜力继续扩大,有助于解决我们面临的一些最具挑战性的问题。
计算机视觉提供新的洞察力: