VAD有70uW,工作的时候只有0.7mW,怎么让更多的时候停留在VAD状态呢?杭州国芯对VAD这块专门做了非常多的研究和设计,需要尽量识别准你这个时候有没有在说话,我们在很多典型的场景做了测试,比如在办公室、在地铁、公交车、咖啡馆。在这些场景,做一个小时、半个小时的测试,70%、80%的时间都可以让让它工作在VAD待机的状态。
这颗芯片可以做唤醒,唤醒率控制在比较好的水平。同时还可以做自定义词条,比如接听电话、播放控制等。同时可以做AI降噪,也有比较好的效果。
杭州国芯可提供两个封装,一个是QFN3×3,一个是WLCSP,也是比较小。
在具体耳机应用的时候其实非常简单,就跟用一个按钮差不了太多。可以跟蓝牙共用一个麦克风,所以不会增加一个麦克风。被唤醒之后会发一个中断,用户可查询一下是什么东西唤醒就可以,所以整个过程是非常简单的。内置了Flash,也内置了晶振,外围非常精简。
针对耳机场景,如果要去做产品会有几个注意事项。
第一个是去做语音识别对声学结构是有要求的,大家千万不要用特别粗暴的方式去做这个事情。声学结构要求也不高,主要是两点,一是麦克风的密封还是要做的;二是喇叭的回声是要控制不能让喇叭的声音给漏回麦克风,这样语音识别效果就很差了。
第二个是与手机打通,唤醒词是有标准协议,HFP调语音助手。一些快捷词,蓝牙的协议也有定义,上一首、下一首包括接听电话等。通过BLE接入手机APP,同时还有小度、小爱同学、天猫精灵、Alexa等等。第三个是低功耗设计,Always ON供电,蓝牙芯片可以完全休眠。
杭州国芯今年做了几个客户,像QCY、漫步者,以及科大讯飞的iFLYPODS PY1。
然后是头盔场景的设计,怎么做听电话、怎么做导航、怎么做我想做的事情,AI语音就有非常大的帮助。这里有风噪的控制,首先声学结构一定要处理好,比如一定要有挡风的罩子,或者你的结构能够让麦克风藏起来,千万不要让麦克风直接吹风,直接吹风就搞不定了。另外是在麦克风的出口放一张防风棉,去过滤气流的直接冲击。结构搞定之后,通过一些AI的算法,就可以做一些降噪,比如你打电话的场景,可以AI降噪的算法帮你做通话降噪等。
不仅如此,杭州国芯跟一些行业内做摩托车的、电动车的都有很多的合作,做起来的效果也不错。
第三块是手表,手表+AI语音相对做得更晚一点,杭州国芯也有一些案例,一方面是唤醒语音助手,一方面增加可玩性。另外一个有意思的东西,因为现在手表功能单一,加上了AI语音后会有更多的扩展性。
- 凯帕|德布劳内任意球打门,凯帕扑出皮球
- 分成|YY直播:2021年公会和主播分成超50亿
- 凌晨,南京市雨花台区地震!
- gtx1060|GTX1060上古神器?
- 显示器|微信新功能开始!长语音可以暂停
- 微信上线“语音暂停”功能
- 微信聊天最令人头疼的场景是什么?一定有人会说是对方发来一连串语音还都是超过30秒的长消息...|终于!微信上线万众期待的新功能!网友:总算等到了
- 《吉星高照》的谢怜杀青啦,半年的拍摄
- 封顶|雄安新区:城市计算(超算云)中心提前完成主体结构封顶
- |既能打造你的品牌又能促进销售的广告宣传方法?