语音|【大咖开讲】杭州国芯凌云:AI语音交互在穿戴产品中的应用实践


自从iPhone 4S推出SIRI后,智能语音交互应用得到飞速发展。天猫精灵或小爱就是最典型的例子,疲惫的回家之后,叫一声天猫精灵就能放出一首安静的音乐。


随着计算机技术的普及,当今人们的生活已经逐渐走入智能时代。不仅仅是电脑,手机,PAD,人们的衣食住行的方方面面都开始应用出现不久的智能技术,智能电视,智能导航,智能家居等等,智能技术将在人们生活的各个方面提供方便快捷的服务。

那么,TWS如何更好的实现语音交互呢?在12月8日《潮涌国产芯,TWS创变全球》峰会上,杭州国芯凌云的演讲《AI语音交互在穿戴产品中的应用实践》为大家解答了这个问题。

语音|【大咖开讲】杭州国芯凌云:AI语音交互在穿戴产品中的应用实践
文章插图



智能三要素

这么多年来,电子消费品厂商一直在干的事情,就是智能。从最早智能手机开始,到机器人,到智能音箱,现在是穿戴。穿戴,以前只是一个装饰品,比如耳环、手表,现在也要智能。背后到底做一些什么东西,它可以智能呢?有三样东西很重要。

【 语音|【大咖开讲】杭州国芯凌云:AI语音交互在穿戴产品中的应用实践】第一点是连接,手机从过去的只能通话到现在有这么丰富的内容,因为它的连接可以获取到很多的信息。iphone的火起来,也是因为3G、4G的发展。

第二点是交互。智能,很重要的一点是非常轻松自然的舒适的。

第三点是产品具有可扩展性。功能机跟智能机最大的区别在于,智能机可以装APP,可以有无限扩展的能力。

今天的智能穿戴,怎么把这三件事情做好?

首先是连接部分,现在要么是用蓝牙,要么是用WIFI,已经形成标准化了。

其次是交互,交互在穿戴产品上仍然是很大的难题,因为手段目前来说是非常少。再次是扩展,现在也是一个问题。用AI语音的方法是交互和扩展的很好解决方案。现在想去操作TWS,你的手段很有限,因为你的耳机可能就那么一个触点。

一般的厂家会设计敲一下是什么功能,敲两下是什么功能,敲三下是什么功能,甚至有的厂家做到了敲四下,实际这个可操作性是非常差的,因为有时候敲一下没反应,敲一下又变成另外的功能了。

AI语音是非常好的的交互形态,可以直接说,电话来了接听电话。如果觉得这是骚扰电话,就用语音挂掉电话。或者你听着歌走进星巴克,买一杯咖啡,这时候你说暂停播放,就进去了。语音有它的便利性、直达性,可以延伸出很多的功能。

怎么去做

AI语音在手机音箱上已经发展到比较成熟的阶段了,今天探讨的问题是怎么样让AI语音在穿戴的场景去做。

在穿戴的场景去做,显而易见,最大的问题是功耗的问题。整个产业,以前做智能音箱,智能音箱的芯片一般来说都要到1000mW。后来做一些IOT类的产品,基本上也是100mW。大家用麦克风,最简单的一个数字麦克风,它的功耗差不多要1mW。

怎么解决功耗的问题呢?杭州国芯在2019年就针对这样的场景专门做了一个芯片,型号叫GX8002,是针对穿戴产品做的一颗超低功耗语音唤醒芯片,主要是解决功耗的问题,同时还便宜,让大家用得起。

这颗芯片采用了MCU+NPU的方式。我们做的硬件VAD,NPU也是我们公司自研的第二代NPU。芯片用了一个平头哥的MCU,可以接模拟麦克风,也可以接数字麦克风,接骨传导麦克风。为了提高集成度,我们还内置RC晶振。