阿里|帮助阿里省了几百个亿,它开启了分布式数据库新纪元( 五 )


OceanBase做的是用户价值,这是他们开源的重要理念。
从最早先屈指可数的几个客户,到今天400多家全行业的客户;大到支付宝、网商银行,小到占总比66%的小型企业,从蚂蚁独立出来的奥星贝斯仍然在帮助全社会的各行各业。
“让天下没有难做的生意”依然流淌在他们每个人的基因里。
结语:尽管已经年近花甲,阳振坤仍然没有半点停滞的意思。在技术驱动创新的路上,OceanBase的目标是做“无限扩展、永远在线”,意在创造一个不被扩展和故障所限制的数据库系统,而这项成果则可能永远地颠覆数据库,乃至互联网行业。
做技术的人大多是简单的。阳振坤和OceanBase十余年走来,风风雨雨,终于至今。有时他总能想起自己的老师,两院院士王选,当代中国的“毕昇”,颠覆了中国印刷业的科学家。
33年前,阳振坤成为了王选的弟子。
那年,阳振坤22岁,青春写意;王选52岁,也正是当打之年。而今天,王选早已溘然长逝,阳振坤也把自己三十余年的青春献给了科研。
当年,我憧憬你;今天,我仍在以你为灯塔前行。
阳振坤知道,和自己的恩师一样,自己的这一生都将要献给中国的科研事业,但他从没有半分悔意,也没有半分退意。

2022年1月,在由CSDN主办、OceanBase承办的DC 2021分布式数据库开发者大会后,雷峰网采访了阳振坤,并与他进行了一番深谈。以下是我们整理的访谈实录:
数据库技术的发展历程雷峰网:我们知道技术在历史中,发展都存在着不同的阶段。数据库也应该不例外,可以根据技术的突破划分为几个阶段,您可以为我们回顾一下吗?
阳振坤:在最开始,它其实是跟账有关系。最早的数据库叫层次数据库,功能比较简单。而也是因为其功能比较单一,大家有接触大概几年以后,就发明了一种网状的数据库。最大的代表其实就是 IBM 的这一套系统。
到了 60 年代末或者 70 年代的时候,关系模型横空出世。曾经两个这个图灵奖的获得者专门有一次是ACM(国际计算机学会)开大会,两派的人争执不下:一派的人说这个未来一定是关系模型,因为关系模型有更强的表述能力。另一派说关系模型不实用。结构上的复杂性,会导致性能会很差。
此后关于这个问题一直没有定论。所以,关系模型从1970年发表,一直到整个70年代,其实都没有过产品。
到70年代末80年代初,关系型数据库才开始产品化。此后这个模式就一直被沿用,直到差不多互联网之前。集中式,本质上是个单机的系统。一个很关键原因还是因为它太复杂。
雷峰网:为了解决这个难题,科学家做出了哪些努力?
阳振坤:对数据库来说,它有一个特殊之处:人们很难用一个自然的语言,来操作数据库。所以后来,就有人开发出了一种数据库专用的语言,叫SQL(结构化查询语言)。
这个SQL不是告诉数据库干什么的,这个太难描述了;它告诉数据库说我要什么,你怎么干是你的事。
Oracle 算是最早的那批数据库,就是 Oracle 、DB2,SQL Server,还有像对后面是 PGSQL 跟 MySQL。在之后的 20 多年的时间里,都没有如此体量的数据库面世。数据库到今天都是个非常大的挑战,也导致这么多年格局大致不变,一个新的数据库的研发特别困难。
而互联网时代,有许多很新的、完全不一样的需求也随之而来。那我们OceanBase今天才有这机会。
分库分表不是分布式数据库雷峰网:OceanBase将自己定义为“原生”分布式数据库,这个“原生”要怎么理解?
阳振坤:我会讲一个很明确的观点:分库分表不是分布式数据库。我们认为一个原生分布式数据库,它是一个单一的数据库,看起来像使用单台机器的集中式数据库,能够在一套数据库里面又做交易又做分析。分库分表的话,它其实还是说在多个单机数据库上面加了一个中间件。