谷歌|Google自研手机SoC深度揭秘:翻车了?( 五 )


让人不解的是,今年这批 SoC 都设定了高得不切实际的 GPU 频率,一跑就降频 。可能是为了应对突发的 GPU 负载?或者是其他什么原因?但无论怎么样,实际能效比是受累了 。
TPU:极强的推理性能
这是 Google Tensor 挽回颜面的地方 。MLPerf 测试中,Pixel 是在 NNAPI 跑的,其他厂商是各自的库,高通是 SNPE(最近优化了 MLPerf 1.1,提升了成绩)、三星是 EDEN,联发科是 Neuron,而苹果没有 coreML 加速,所以吃亏 。
谷歌|Google自研手机SoC深度揭秘:翻车了?
文章图片

在图像分类、目标检测和图像分割工作负载中,Tensor 成绩低于高通,但强于三星 。而在语言处理(MobileBERT 模型),Google Tensor 提供了骁龙 888 3 倍的性能,推理部分强得很 。Google 在宣传里,确实也提到过实时转录、翻译等使用场景是其差异化所在 。
谷歌|Google自研手机SoC深度揭秘:翻车了?
文章图片

谷歌|Google自研手机SoC深度揭秘:翻车了?
文章图片

谷歌|Google自研手机SoC深度揭秘:翻车了?
文章图片

还没发布的 GeekBench ML 测试,用是 TensorFlow 模型,代表的是 GPU 的机器学习性能 。这时候 Google Tensor 就弱于  Exynos 2100 。如果用 NNAPI 模型,此时是 CPU+GPU+NPU 的混合工作,Google Tensor 就可以大幅领先骁龙 888 。
除了绝对性能,跑 AI 测试时,Pixel 6 Pro 的整机功耗和 Exynos 2100 的 Galaxy S21 Ultra 接近 。单独进行推理任务时,Exynos 2100 的爆发功率达到 14W,骁龙 888 也有 12W 。但因为 Google Tensor 的 AI 性能更高,所以最终能效比要更高一些 。
不过 Google 还没有计划推出相关的 SDK 让开发者去更好地利用这颗强大的 TPU。但再看看三星,它的 NPU 发布都 2 年了,现在都没有 SDK…… 现在 TPU 的强大性能,主要集中体现在官方 app 里,像是给摄像头加入更多的机器学习功能,以及各种翻译功能 。
总结
谷歌|Google自研手机SoC深度揭秘:翻车了?
文章图片

Google 表示,他们搞自研 SoC 的主要原因是现有的 SoC 在机器学习上的性能和能效比太低,而 Tensor 的机器学习性能和能效,被用来支撑新的用例和体验 。
例如我们在 Pixel 6 系列上看到的很多机器学习特性 。像是实时转录、实时翻译和图像处理等算法,所有这些都是运行在 Tensor 的 TPU 上的 。
虽然 Google 可能不想承认或者谈论,但 Google Tensor 确实就是和三星合作的产物,大部分都源自 Exynos,并继承了三星在能效比方面的弱点 。
CPU 被古老的 A76 拖后腿,规模庞大的 GPU 被散热拖后腿,但 TPU 确实表现很好,特别是自然语言处理方面,远远抛离所有竞品 。
但总的来说,我们认为 Google 已经通过 Tensor 实现了最初的目标 。我们不知道 Google 下一代的 SoC 会走什么样的路线,但我们很有兴趣等等看 。