谷歌|Google自研手机SoC深度揭秘:翻车了?( 二 )


谷歌|Google自研手机SoC深度揭秘:翻车了?
文章图片

理论上有两颗 X1 超大核,其 CPU 多核性能会比单颗 X1 的产品更强 。而频率上,Google Tensor  的 X1 都是 2.8GHz,略低于骁龙 888 的 2.84GHz 和 Exynos 2100 的 2.91Hhz 。此外,Google 还和骁龙888 一样给了 1MB L2 缓存,比 Exynos 2100 的 512KB 残血 X1 更猛 。
大核(编者:你喜欢叫中核也行)这边,Google 选择了古早的 A76 架构,这是件很有争议性的事(2.25GHz,256KB 的 L2 缓存) 。毕竟这并不合理,因为 A77 和 A78 的性能和能效比都更高 。连 Anandtech 都没从 Google 那里得到明确的解释 。
他们猜测可能是几年前设计芯片的时候,三星手上也没有更新的 IP 供 Google 选择 。也可能是在超大核换成X1 的时候,没有时间连大核也一起换了 。但 Google 应该不是特意选用 A76 的,因为从下面的测试可以发现,A76 真的是跟不上时代了 。
小核这边,4 个 1.8GHz 的 A55 。Google 选择了 128KB 的 L2 缓存,而不是三星 Exynos 自己用的 64KB,这让这个 CPU 更像骁龙888 了 。但比较奇怪的是,Google 把集群的 L3 缓存频率和 A55 绑定,这会导致延迟和功耗问题 。另外,这也和 Exynos 2100 的 L3 频率是不同的 。
Google Tensor  的 GPU 是 Mali- G78 MP20,规模仅次于麒麟 9000 的 G78 MP24(编者:G78 的极限) 。大家最开始以为 Google 会用低点的频率来提升能效比 。但结果 Google 竟然把着色器频率推到 845MHz,把 tiler 和 L2 频率推到 996MHz,简直癫狂 。另外,它也是第一个用上 G78 分离频率特性的产品 。
作为参考,Exynos 2100 的 G78 MP14 也“只是” 854MHz,后者的峰值功耗已经很高了 。结果 Google 增加 42% 的核心,却依然维持高频 。因此它的峰值性能很让人期待,但峰值功耗也会很猛 。而内存控制器似乎和 Exynos 2100 相同,支持 4x16bit 的 LPDDR5,理论带宽 51.2 GB/s 。
【谷歌|Google自研手机SoC深度揭秘:翻车了?】它也用了 8MB 的系统缓存,但还不清楚是否用了和三星 Exynos 2100 一样的  IP,因为它们的架构和行为方式都不太一样 。Google 大量使用 SLC 来提升 SoC 性能(包括他们自己的定制模块) 。这个 SLC 允许自分区,将 SRAM 专门分给 SoC 上特定的 IP 块,使它们在不同用例下,能对全部或部分缓存进行独占访问 。
ISP 与 TPU
大家说 SoC 集成的 ISP 时,经常把它们描述为单个 IP 。但实际上,ISP 是不同的专业 IP 块的组合,每个 IP 块处理成像管线中的不同任务 。而 Google Tensor 非常有趣,因为它将三星用在 Exynos 芯片上的一些片段整合到了一起,同时还将自己开发的定制模块整合到了流水线中 —— 正如 Google 在展示 SoC 时所说的那样 。
成像系统部分和 Exynos 是一样的,如相位检测处理单元、反差对焦处理单元、图像缩放器、畸变校正处理块和纹理遮挡函数处理块等 。比 Exynos 少的部分,可能是三星的一些图像后处理模块 。
谷歌在 ISP 中加入自己的 3AA 模块(自动曝光,自动白平衡,自动对焦),以及一对自己的时域降噪 IP 模块(用于对齐和合并图像) 。这些很可能就是谷歌所说的那些有助于加速图像处理的模块,这些是 Pixel 系列计算摄影的一部分,毋容置疑地地代表了图像处理流水线中非常重要的部分 。
谷歌|Google自研手机SoC深度揭秘:翻车了?
文章图片

TPU 是让 Google Tensor 被称为 Tensor 的地方 。Google 已经用自研  TPU 好几年了,在驱动层面,Google 把 Tensor 的 TPU 称作 Edge TPU( 端侧边缘 TPU) 。这是相当有趣的信号,因为它应该和 Google 2018年发布的 Edge TPU 有关,后者是 Google 为边缘推理而设计的 ASIC 芯片(官网 cloud.google.com/edge-tpu) 。