沃达丰|36氪首发|「芯声智能」获数千万人民币A轮融资,低功耗音频NPU芯片已落地沃达丰、3M等头部企业

作者|韦世玮
编辑|石亚琼
**
36氪获悉,近日音频NPU芯片及算法公司「芯声智能」宣布完成数千万人民币A轮融资,由光远资本独家投资,戈杨资本担任本轮独家财务顾问。该轮资金将主要用于扩充研发人员和技术支撑团队,以及芯片迭代的研发投入。
芯声智能成立于2018年9月,主要基于自主研发的可重构神经网络引擎,开发面向智能语音识别领域的AI芯片及算法,具有高性能、超低功耗、高识别率、低成本、算法扩展性强等特点,适用于智能手机、耳机、白色家电等品类。
声学赛道的覆盖面十分广泛,人们日常使用的智能手机、蓝牙耳机、智能音箱等设备,在听歌、通话、语音交互等一切和声音有关的应用背后,都需要对声音信号进行环环相扣的处理,同时也有着一条长长的元器件供应链。
例如,语音识别、语音助手、通话降噪应用主要涉及声音的前处理,与麦克风有关,设备的音质、主动降噪、音效,主要涉及声音的后处理,则与喇叭有关。
但芯声智能CEO汤健告诉36氪,他发现目前业内许多玩家设计语音芯片时,大多侧重在前处理应用的技术创新,而后处理环节仍是传统方法。因此,公司的初衷是能设计出一款同时兼顾声音前处理和后处理的语音芯片。
那么,公司为何选择从NPU(嵌入式神经网络处理器)切入?一方面,大型SoC的研发周期长、成本高,对初创公司来说落地门槛较大;另一方面,产品主要面向低功耗、锂电供电的场景,主控芯片跑算法的功耗太高,因此比较适合开发一款NPU芯片,作为协处理器与主控芯片进行配合。
目前,芯声智能的低功耗语音芯片XS200X已实现量产出货,这是一款专用的语音识别前端芯片,基于RISC-V架构,采用小型化神经网络设计,突破了超低功耗ADC、低功耗PLL系统设计、低功耗数字系统设计、小型化封装等多个难点。
具体来看,XS200X芯片拥有四大特点:一是采用超低功耗设计,支持Always on唤醒模式,唤醒功耗小于1mW;二是具有远场识别高强度计算能力,支持AGC、AEC、波速成型、去混响、复杂降噪、多命令词识别等14种算法,其中KWS唤醒率在无噪达98%以上;三是基于DNN+CNN神经网络降噪算法,能较好实现通话降噪(ENC)和主动降噪(ANC)效果;四是配置了4麦克风接口,支持多路模拟MIC输入或多路数字MIC输入,支持多通道TDM(I2S)输入和输出。
沃达丰|36氪首发|「芯声智能」获数千万人民币A轮融资,低功耗音频NPU芯片已落地沃达丰、3M等头部企业
文章插图
【 沃达丰|36氪首发|「芯声智能」获数千万人民币A轮融资,低功耗音频NPU芯片已落地沃达丰、3M等头部企业】芯声智能的超低功耗语音唤醒识别芯片
基于这些特点,芯声智能的语音降噪方案能很好地解决大风噪场景下的降噪问题,这也是现在许多音频产品主要面临的难题。汤健举例,在摩托车车速为120码情况下,公司的单麦克风降噪解决方案能大幅度地过滤风噪和路噪,实现清晰通话,而业内知名厂商的蓝牙芯片方案最多只能实现30码车速的通话。
在这背后,正是芯声智能采用神经网络降噪技术,通过对大风噪、马路、地铁、广场舞等场景下的6000多种噪音进行训练,大幅度地解决了各类噪声问题。
从市场层面看,目前芯声智能主要对标美国DSP Group,后者为全球领先的通信语音和无线芯片组解决方案提供商,在音频数字信号处理器、AI内核、音频物联网无线芯片等方面有丰富技术经验。同时,该公司已于2021年8月被Synaptics公司宣布以5.28亿美元收购。
汤健谈到,芯声智能核心团队从四年前就开始基于RISC-V架构开发芯片方案,积累下不少成本控制和技术开发经验,这恰恰是公司和其他玩家相比的差异化优势。