英特尔|永远不要投资DPU?( 四 )


张献涛,是KVM跨平台支持以及KVM/IA64的作者和Maintainer 。
QEMU曾是世界上首屈一指的系统仿真器和虚拟器。QEMU支持Xen和KVM,并广泛部署在大多数云环境中。
从Xen到KVM,安东尼和张献涛的技术突飞猛进,天天打破天花板。只要解决性能方面的难题,什么姿势都会。
要知道,那些系统底层,要去解决性能方面的故障或者错误(Bug),都是非常难的,伸出手就能扼住整个项目的喉咙,让人动弹不得。
安东尼和张献涛,身上不断出现“巧合”。
张献涛和安东尼在Xen 和KVM 开源社区都有交集,是享誉社区的极客,令无数开源玩家高山仰止。
经历诸多采访报道,他们在做自我介绍时,都曾说到一句话:“我一直做虚拟化方向的工作。”
同样的话,一个用中文讲出来,一个用英文表达。
只要一有虚拟化安全的新闻热点出现,国外技术媒体都以采访到安东尼为荣。张献涛则是国内第一批参与做KVM的。
巧合的背后,往往是必然。
2013年,安东尼,加入亚马逊云。
2014年,张献涛,加入阿里云。
昔日,在虚拟化开源社区,两位最有“势力”的人。
如今,在头部云计算厂商,主导DPU技术变革。
更巧的是,一个负责Nitro系统,一个负责神龙系统。
亚马逊云和阿里云的DPU,均汲取了开源虚拟化软件Xen和KVM的精华。
云计算带来了虚拟化技术的繁荣,实现了技术的跃迁。
此时,虚拟化的专家,从硬件厂商的宝贝,变成了云计算厂商、大型互联网公司的宝贝。
35岁就淘汰之类的话,在这些人面前,纯当放了一个臭屁。
所有人都意识到,虚拟化技术“值钱”了,蜂拥而至,可惜,门槛很高。
虚拟化是一门非常难的技术,虚拟机是对真实计算环境的抽象,很多人被“抽象”二字难住。
操作系统内核已是扫地僧级别的技能了,虚拟化则是独孤求败。
张献涛说:“以前,我们认为操作系统内核是最难理解的,也是最复杂的系统软件。业界有不少非常资深的内核(kernel)工程师转去做虚拟化,都理解不了,也做不好。”
为什么呢?
因为虚拟化又抽象了一层,其难度大大增加,要用软件去实现硬件(的功能)。
在云厂商没有虚拟化专家的时代,亚马逊云也找英特尔的人去解决问题。
十几年前,英特尔工程师火线救援云厂商的故事,都快被人遗忘了。
2010年,阿里云准备在5月10日发布产品(ECS1.0)。
那时,有三家企业的工程师挤在阿里云攻坚,攻了一个多月,有人都要把头急秃了,眼看到日子了,还有一个坎,过不去。
大概1000台服务器,运行一晚之后,总会发生一件奇妙的事情,硬盘找不到了。
硬盘也很委屈:“我掉线了。”
攻坚小组被死死逼到了墙角,他们拿出了一个负责任的推断:问题要么出在芯片组身上,要么出在芯片身上。攻坚小组在嘶吼,得让英特尔派人来,快点。
命悬一线之际,无论英特尔派谁来,都会被人死盯着,恨不得用秒表计时。
意外的是,英特尔的专家到现场后,看了一下(所有的配置),想了一会,之后说:“改个参数就可以了”。
计时那个人,看了下表,从拿到阿里云的服务器日志到搞定,大约用时3000秒(50分钟)。
这一刻的如释重负,让在场的阿里云工程师一辈子也忘不了。
快拿几条真丝围巾,我们要缠在胳膊上跳广场舞。
这事,让一个外援在阿里云内部,小火了一把。
谁知不久之后,阿里云的章文嵩问了团队一个问题:如果要挖一个虚拟化做得最好的人,应该挖谁?
章文嵩是何人呢?Linux虚拟服务器创始人,开源大神,曾任阿里云CTO,首席科学家。