谷歌|Google自研手机SoC深度揭秘：翻车了？( 五 ) CPU处理器|Pixel|Google自研手机

让人不解的是，今年这批 SoC 都设定了高得不切实际的 GPU 频率，一跑就降频。可能是为了应对突发的 GPU 负载？或者是其他什么原因？但无论怎么样，实际能效比是受累了。
TPU：极强的推理性能
这是 Google Tensor 挽回颜面的地方。MLPerf 测试中，Pixel 是在 NNAPI 跑的，其他厂商是各自的库，高通是 SNPE（最近优化了 MLPerf 1.1，提升了成绩）、三星是 EDEN，联发科是 Neuron，而苹果没有 coreML 加速，所以吃亏。

文章图片

在图像分类、目标检测和图像分割工作负载中，Tensor 成绩低于高通，但强于三星。而在语言处理（MobileBERT 模型），Google Tensor 提供了骁龙 888 3 倍的性能，推理部分强得很。Google 在宣传里，确实也提到过实时转录、翻译等使用场景是其差异化所在。

文章图片

文章图片

文章图片

还没发布的 GeekBench ML 测试，用是 TensorFlow 模型，代表的是 GPU 的机器学习性能。这时候 Google Tensor 就弱于 Exynos 2100 。如果用 NNAPI 模型，此时是 CPU+GPU+NPU 的混合工作，Google Tensor 就可以大幅领先骁龙 888 。
除了绝对性能，跑 AI 测试时，Pixel 6 Pro 的整机功耗和 Exynos 2100 的 Galaxy S21 Ultra 接近。单独进行推理任务时，Exynos 2100 的爆发功率达到 14W，骁龙 888 也有 12W 。但因为 Google Tensor 的 AI 性能更高，所以最终能效比要更高一些。
不过 Google 还没有计划推出相关的 SDK 让开发者去更好地利用这颗强大的 TPU。但再看看三星，它的 NPU 发布都 2 年了，现在都没有 SDK…… 现在 TPU 的强大性能，主要集中体现在官方 app 里，像是给摄像头加入更多的机器学习功能，以及各种翻译功能。
总结

文章图片

Google 表示，他们搞自研 SoC 的主要原因是现有的 SoC 在机器学习上的性能和能效比太低，而 Tensor 的机器学习性能和能效，被用来支撑新的用例和体验。
例如我们在 Pixel 6 系列上看到的很多机器学习特性。像是实时转录、实时翻译和图像处理等算法，所有这些都是运行在 Tensor 的 TPU 上的。
虽然 Google 可能不想承认或者谈论，但 Google Tensor 确实就是和三星合作的产物，大部分都源自 Exynos，并继承了三星在能效比方面的弱点。
CPU 被古老的 A76 拖后腿，规模庞大的 GPU 被散热拖后腿，但 TPU 确实表现很好，特别是自然语言处理方面，远远抛离所有竞品。
但总的来说，我们认为 Google 已经通过 Tensor 实现了最初的目标。我们不知道 Google 下一代的 SoC 会走什么样的路线，但我们很有兴趣等等看。