微软|你的手机助手能被唤醒,真的不是因为它在偷听?( 二 )



理由很简单 。
因为协处理器的功耗很低 , 哪怕一直计算数据 , 对续航也没啥影响 。
这事要是给 A 系列处理器做 , 手机相当于时刻都在唤醒 , 续航早 TM 崩了 。
另外 , 指南针、压力感知器也都协处理器负责 。
到了 2014 年苹果推出了 Hey Siri 功能以后 , 协处理器又多了一项任务:处理 Siri 音频 。
麦克风收录声音 , 协处理器进行识别 。

因此 , 手机确实是一直在听周围声音 , 来判断你有没有说 Hey Siri 。
问题来了 , 这时的手机能听懂周围声音吗?
很难 。
我们先捋一下 Siri 的识别原理 。
在和 Siri 对话时 , 手机收集的声音会被送到 Apple 服务器计算 , 这样你说了啥 , 它很轻松就知道 。

但在触发 Siri 之前 , 手机一直在收集声音 , 数据非常大 , 要是几千万台 iPhone 的数据全送去 Apple 那儿 , 服务器早炸了 。
所以触发 Siri 之前 , 手机收集到的声音 , 其实是在本地计算的 。
这个计算很复杂 , 可以参考下图 。

因为世超不是相关专业的 , 这图只能看懂一小半 , 大概给大家解释下 。
你的声音进入麦克风后 , 经过处理会切成很多份小音频 , 接着协处理器会计算这些音频的“ 分数 ” 。
最后把这些音频分数累计起来 , 看看有没有达到你“ Hey Siri ”的声音阈值 。

一旦达到了 , 协处理器就会唤醒主处理器 , 主处理器会用一套更精准的算法确定一遍 。
确认是你在喊“ Hey Siri ”后 , Siri 才会出来上钟 。
总结一下:
协处理器不断检测周围的声音 , 确认为“ Hey Siri ”后 , 主处理器再算一遍再请求 Siri 服务器 。
如此一套复杂的流程后 , iPhone 才能判定它听到的是“ Hey Siri ” , 你说它要听懂其他所有的话 , 那工作量翻个百倍千倍也不够啊 。
所以 , Siri 在触发之前能听懂你的话 , 根本不现实 。

那有没有一种可能 , 不管听没听懂 , 它只是收集声音 , 直接传给 Apple 呢?
从技术上说可行 , 但从续航上说 , 也不太行 。
你想想 , 如果手机一直往外传数据 , 那电池比你头都大 , 续航也顶不住吧?
哪怕苹果足够阴险 , 只在充电时偷偷传 , 这么大数据流量不是明着送人头么 。
看到这会有差友会说 , 你是不是在洗苹果啊 。
之前都有个国外新闻说 , 苹果通过 Siri 听到了不可描述的声音吗?

那个我也去查了一下 , 文章是半个标题党 , 实际情况不是 Siri 偷听 , 而是用户误触发了 Siri , Siri 开始听了 , 此时用户正在做羞羞的事情 。。
而苹果为了判定 Siri 工作得好不好 , 会提取不到 0.2% 的音频信息交给人工查看 , 最后就这么撞上了 。。
用户也可以拒绝共享音频▼

当然除了 Siri , 还有其他的智能语音助手 , 它们绝大多数也是通过一个低功耗芯片来监听唤醒词 。
可以说 , 这些智能语音助手( 包括 Siri )在触发之前 , 能听懂周围声音或者把所有声音上传进服务器 , 不管是从科技水平 , 还是从逻辑上判断 , 都不太现实 。
【微软|你的手机助手能被唤醒,真的不是因为它在偷听?】那有没有一种可能 , 在某种条件下 , 语音助手会悄咪咪联网 , 偷听个十几秒呢?
不经常有人说 , 前脚刚聊到一个产品 , 后脚它就出现在了网购平台 , 怀疑是不是语音助手啥的偷听聊天了 。

其实世超觉得这事情大概率得赖广告联盟 。 他们有大量的用户精确画像 , 比如谁谁喜欢二次元 , 最近在看日用产品 。