对话杨传辉:国产数据库新战绩背后,OceanBase坚持自研的初心与决心

对话杨传辉:国产数据库新战绩背后,OceanBase坚持自研的初心与决心
文章图片
智东西(公众号:zhidxcom)
作者|心缘
编辑|漠影
国产数据库正在蓬勃发展 , 借势分布式技术优势 , 冲进了国际巨头的地盘 。
作为管理数据的基础软件 , 数据库掌握着企业的命脉 , 牵一发而动全身 , 尤其是在核心业务中 , 稍有差错便可能造成无可挽回的损失 。 随着国产化呼声渐涨 , 这门长期被海外巨头垄断的关键生意 , 已成为本土企业势必收复的“失地” 。
就在近日 , 全球权威IT咨询机构Forrester发布的2022年度Translytical方向的数据平台厂商选型报告 , 国产自研原生分布式数据库OceanBase赫然在列 。 它也是全球唯三具备实现Forrester定义的分布式数据库细分功能(单云、混合云、多云)全覆盖能力的厂商 。
OceanBase钻研了长达12年的混合事务和分析处理领域 , 如今正在数据库行业热度高涨 。
凭借能承载高并发事务实时处理与大规模数据实时业务决策的能力 , HTAP有望为企业更高效地挖掘数据价值 , 大幅降低总成本 。 随着国内相应需求蓬勃而生 , 投入HTAP方向的数据库从星星之火渐成燎原之势 。
作为创始成员之一 , OceanBaseCTO杨传辉主导了历代数据库架构设计和技术研发 , 使其挺过支付宝交易系统、“双11”等极致并发量场景的考验 , 服务超过400家金融、能源、交通等行业客户 , 并主导OceanBase成为唯一一家在国际数据库基准测试TPC-C和TPC-H上都打破世界记录的国产原生分布式数据库 。
在与我们交流的过程中 , 杨传辉对HTAP数据库如数家珍 , 深入解读了HTAP的核心技术、研发难点、落地挑战 , 并为企业如何做出适合业务的数据库架构选择提供了一些参考建议 。 除此之外 , 作为深耕数据库逾十年的专家 , 他也分享了对国产数据库发展机遇和核心瓶颈的观察 。
对话杨传辉:国产数据库新战绩背后,OceanBase坚持自研的初心与决心
文章图片
杨传辉
一、什么是真正的HTAP?HTAP≠OLTP+OLAP天下大势 , 合久必分 , 分久必合 , 数据库的发展亦是如此 。
早期数据库大包大揽 , 到上世纪末 , 因应用场景日趋丰富 , 逐渐分化成OLTP和OLAP两大类型 , 前者主管交易 , 后者专攻分析 。 如今 , 这两大功能又走向融合 。
随着大数据浪潮奔涌而至 , 数据量急剧膨胀 , 许多业务场景需应对不断增长的实时事务处理和分析需求 。 统一支持两类功能的HTAP数据库横空出世 , 在企业级市场风头渐盛 。
HTAP有两大显著的优势:低成本、低延时 。 这不难理解 , 一套同时能做两件事的系统 , 相比两套系统拥有更高的性价比;而且省去了繁琐费时的ETL过程 , 降低延时 , 更好支持实时分析 。
一时间 , 各路数据库都开始贴上“HTAP”的标签 , 云计算大厂也纷纷摩拳擦掌 。
但对于企业来说 , 给数据库上新 , 不免要付出试错成本 , 因此弄清楚HTAP到底怎么用、怎么选型、重点考量哪些因素至为关键 。 这就涉及一个数据库热门话题——什么是真正的HTAP?
杨传辉的答案是:在高性能OLTP数据库的基础上扩展OLAP的能力 , 能很好支持实时分析 。
国际数据库巨头Oracle、微软SQLServer以及国产分布式数据库龙头OceanBase都采用这种做法 , 与前两者不同的是 , OceanBase底层是原生分布式架构 , 可扩展性强 , 因而能处理更大的数据量 。
也有不少创企走的路线是在OLAP基础上引入实时写入 , 形成一个实时数据仓库 。 走这种路线 , 如果不具备OLTP核心业务经验 , 可能很难做到支持完整的事物处理能力 。 杨传辉解释说 , 业界有些“HTAP产品”的事务处理性能较差 , 不是HTAP的问题 , 而是其产品设计实现的问题 。