张建锋|阿里云的边界与底色

张建锋|阿里云的边界与底色
文章插图

图源:图虫创意
编者按:本文来自微信公众号蓝洞商业(ID:value_creation),作者郭朝飞,创业邦经授权转载。
未来所有数据上云,每个人、每个企业在云上有一个专属空间,阿里云却希望能越做越薄。
10月19日,2021杭州云栖大会,阿里云发布自研云芯片倚天710。倚天710采用5nm(纳米)工艺,单芯片容纳600亿晶体管;在芯片架构上,基于最新的ARMv9架构,内含128核CPU,主频最高达到3.2GHz。
用阿里云智能总裁张建锋的话说,这是阿里第一颗为云而生的CPU芯片,将部署在阿里云数据中心。
这也意味着阿里云在芯片领域更进一步,拥有处理器IP、AI芯片及通用芯片等系列产品。
【 张建锋|阿里云的边界与底色】2019年,阿里旗下半导体公司平头哥先后发布RISC-V处理器玄铁910、阿里第一颗芯片含光800。目前,玄铁系列处理器出货量达25亿颗,含光800也实现规模化应用,通过阿里云服务于搜索推荐、视频直播等行业。
阿里云是否有意大规模涉足半导体行业?
“我们是Focus(聚焦)在云计算,不是Focus在半导体。阿里云到目前为止是一家云计算厂商,如果市场上有更好的选择,我们当然会采用市场上的解决方案。今天我们做的很多工作是为了完善云计算,并不是为了完善芯片这个产业,可能当下前面一个选择是我们最重要的选择。”张建锋向「蓝洞商业」等坦陈。
但不可否认的是,围绕云计算,阿里云涉足的领域越来越多,从IT基础设施,到中间的软件层、用户端,从软件到硬件,从芯片、云操作系统、服务器到大数据、AI、IoT等,几乎无所不包。
作为一家云计算厂商,阿里云是否有边界?边界又在哪里?
不卖芯片倚天710的出现,是因客户需求驱动的。
云是高性能服务器芯片最大的应用场景,阿里云在服务诸多用户的过程中,发现经常会有一些特殊需求,主要表现为大规模、多线程、高并发。
张建锋很清楚,“CPU并不完全为了云上负载来设计的”,要更好满足客户需求,提升阿里云的技术能力,有必要针对性地设计一款全新的芯片。
2017年,阿里成立达摩院,芯片是其核心研究方向之一。达摩院组建了一支芯片研发团队,由半导体行业工业界和学术界专家组成,研究方向涵盖系统架构、计算技术、存储技术以及芯片工程等核心芯片设计技术。第二年,阿里收购中天微,其是中国大陆唯一拥有自主嵌入式CPU IP core的公司,由此阿里掌握了芯片底层技术能力。很快,达摩院芯片研发团队与中天微团队合并,成立平头哥。
目前,全球芯片架构主要包括X86、ARM与RISC-V。英特尔的X86架构主要用于PC与服务器;ARM更多的是智能手机与物联网;RISC-V是开源架构,出现于2010年,为一家非营利基金会所有。
芯片要执行软件程序,必须将软件或程序语言翻译成硬件指令,这套标准规范就是芯片架构(指令集)。相关公司要采用哪种芯片架构,需要专利授权,IP授权费用经常会达到百万、千万美元。在服务器芯片架构上,X86仍然占主导地位,长期与微软结盟,但ARM架构逐渐受到亚马逊、苹果、华为等公司的青睐。
阿里云的倚天710采用了ARM架构,针对云场景的高并发、高性能、高能效需求,将芯片设计技术与云场景相结合,实现突破。张建锋解释,CPU一类是单核强性能,一类是多核,从测试的结果来看,云上负载多核明显优于单核强性能,因此倚天710含128核。
张建锋承认,含光800是ASIC(用于供专门应用的集成电路)芯片,其功能、复杂度与通用芯片有很大的不同,倚天710对阿里云能力是一次很大的考验。