如今AI语音识别已经有了越来越广泛的应用场景,比如在PC端、手机端都有用例的语音输入;录音笔的同步文本转写等等。可以说,更精准的语音识别可以带来更便捷的使用体验。
特别是在国际化、多语种的使用场景中,对于PC等设备的语音识别能力有着更高的诉求。例如,在很多公司的视频会议中,可能会跨国家和地区进行多语言交流,想要通过语音识别同步产生字幕或者进行文本分享给与会者,那么显然需要语音识别更快,且支持多语种的精确识别和翻译。
文章插图
值得关注的是,在此前举行的NeurIPS大会上,由英特尔提供支持的关于口语数据集的两册白皮书发布——《人的语言》、《多语种口语语料库》。据悉,这两个项目的数据集都贡献了大量丰富的音频数据,且每个数据集在同类中都拥有最大的可用体量,其中《多语种口语语料库》由英特尔软件与先进技术事业部(SATG)的机器学习工程师Keith Achorn参与撰写。
“多语种口语语料库”是一个音频语音数据集,不仅拥有超过30万个关键字的数十种语言,能够通过智能设备访问,还涵盖了50多亿用户的日常对话。通过使用这些数据集,有助于推动全球范围内受众语音应用的研发,同时也可以提升PC等设备的AI语音识别能力,高效实现语音转文本或者翻译,甚至语音操控。对于很多商务人士而言,这能够在工作中起到很大的帮助。
文章插图
另外,英特尔在AI领域的布局不止于此,对于很多消费者而言,英特尔加速推动AI在PC端落地带来的一系列创新或许已经广泛的应用到日常生活中。比如在系统层级的智能调优,智能人脸识别,智能电源管理等等,而且这也是英特尔推出Evo平台中的重要组成部分之一。
此外,基于酷睿平台丰富的AI特性,英特尔还携手合作伙伴在视频观看、内容创作、视频及语音通话方面实现了用户体验的提升。例如,爱奇艺发挥11代酷睿中英特尔锐炬Xe显卡性能,在显卡驱动中集成了AI视频超分辨率算法,在不增加网络带宽的同时,实现更高分辨率且清晰的画面呈现效果。
文章插图
还有国内专业的对话式人工智能平台思必驰充分利用了加速AI性能的英特尔Gaussian Neural Accelerator 技术,实现了较低功耗的动态神经网络降噪功能,让体验更流畅。并且,思必驰也推出实时语音转文字和机器翻译功能。
文章插图
总之,你或许没有感知到PC端AI的存在,但是在日常使用中,越发强大的AI特性也在不断帮助你更好地完成各项工作。除了上面提到的两项用例外,还有在剪辑视频时的智能抠图,或者处理图片时的智能识别及模糊等等,是不是感觉很熟悉?
【 数据集|未来PC或能听懂你的话?英特尔助力AI语音识别】所以随着英特尔助力人工智能语音识别,或许在英特尔携手合作伙伴的努力下,未来PC或将听懂用户的需求,只需要一道语音指令,就能完成更多任务,为更多用户在日常使用中提供更多交互方式。
- text|《2021大数据产业年度创新技术突破》榜重磅发布丨金猿奖
- 酷睿处理器|关键数据出炉,京东比阿里差远了
- OpenHarmony 项目群 12 月新增捐赠人美的集团、深圳开鸿
- 本周华为小米相继报出的新闻,让我看到中国科技公司未来发展希望
- 财智干货|数智化发展任重道远,财务中台提升数据服务价值 | 大数据
- 支付宝集五福活动 1 月 19 日正式开始,现可提前领福
- 美少女1985集
- 央媒表态后,联想关键数据出炉,柳传志这回要扳回一局?
- 电子封装技术、微电子、集成电路等,电子信息类专业,研究方向
- 数据库|OPPO悄悄上新机,骁龙8核+5000mAh电池,256G仅售1599元