科研|科研团队如何探索商业化落地?这家语音AI公司用十年试验打了样( 二 )


云知声的这条深度学习升级之路,正是其核心技术团队追求卓越的实战精神体现。
随后,在2013年初,云知声发布了一个微信语音输入插件,一周即登顶APP Store免费工具排行榜首位。日激活量接近4万,使用该插件的用户很快接近100万规模。
科研|科研团队如何探索商业化落地?这家语音AI公司用十年试验打了样
文章插图
与此同时,在锤子发布会和LeTV超级电视上的亮相,引发业内和各方资本关注。
创业不到一年,云知声就获得了启明创投领投的亿元级A轮融资。
这时,云知声在业内已经小有名气。但在梁家恩博士看来,他们只是打了个技术基础。
简言之,就是AI三驾马车基本成型:云平台积累海量真实数据,基于GPU的超算能力,还有深度学习技术。
而与行业伙伴合作、推出微信语音输入插件,则属于是完成技术应用的初步验证。
但要想实现创业初心——推动语音产业的发展,光打好技术基础还不够。
按照科学思维,还需要商业化求证和举一反三。
这时候,云知声已经想好了下一步的路。
云端芯:全栈AI能力的构建云端芯。
2014年年初,云知声官宣了这一战略。
三个字拆解来看,云端智能解决业务深层问题;终端应对各类应用场景的差异化需求;物联网专用芯片,则支持规模化应用。
如今已被公认为行业热词,但放在当时,却属于业内首次。
而启发云知声提出这一前瞻性战略的,正是基于开放云平台的应用数据和用户反馈的综合分析。
一方面,开放云平台运行期间,有开发者反馈能否用语音解决车载导航、病历录入、英语学习等场景。
另一方面,实际应用中也发现,LeTV超级电视语音助手与搜狗智能手机语音助手之间的活跃度有十倍以上的差异。
以手机语音助手为例,如果没有充足的资源去宣传和推广,那么大概就只有2%的活跃度。但如果在智能电视,不需要任何推广,全年基本上保持接近40%的活跃度。
对于梁家恩团队来说,这是一个关键的发现:
智慧物联也许是个更刚需的智能交互应用场景。
但物联网并不是一个新鲜的概念,1999年就提出来了;行业巨头IBM,在2008年又提出了智慧地球,但也始终停留在概念阶段,可见挑战之大。
科研|科研团队如何探索商业化落地?这家语音AI公司用十年试验打了样
文章插图
对云知声而言,既是机遇也是挑战。顶层构想有了,在具体实践上又该如何破局呢?
云端芯,简单来说,就是构建软硬件一体的全栈技术与服务能力。
全栈?这时候质疑声音又来了:大公司巨头都不一定能完成的能力,却成为他们正在实践的目标。
面对质疑,梁家恩用他们在A轮融资发布会上引述道德经的名言 “图难于其易,为大于其细”做了回应——从解决实际问题出发,各个击破。
最先发力的技术,就是远场降噪与识别技术,这是智慧家居中一个关键技术问题。
通过声学结构设计和麦克风阵列降噪技术,解决3-5米范围内的目标语音提取和背景噪声消除问题,实现真实场景下的语音交互,从而使得感知技术能力得到更大范围拓展,在更多真实应用场景下达到实用效果。
科研|科研团队如何探索商业化落地?这家语音AI公司用十年试验打了样
文章插图
与此同时,为更好支持对话式交互的体验,云知声还发布了语用计算平台。
简单来说,就是能结合上下文语境去做语义理解,跟用户进行可快速配置的多轮对话,从而更顺畅完成复杂场景的人机交互任务。加上后续拓展的知识图谱技术,实现了从感知到认知的技术能力跨越,能解决更加复杂的业务深层问题。