数据库|数据敏捷,HTAP数据库既决效率又决生死

数据库|数据敏捷,HTAP数据库既决效率又决生死

文章图片

数据库|数据敏捷,HTAP数据库既决效率又决生死


数据库发展的这50多年以来 , 联机事务处理OLTP和联机分析处理OLAP两条道路上的风风雨雨 , 源自用户需求的驱动 , 也经历了漫长的“融合-分离-再融合”的演进过程 。
但是 , 在没有出现新一代HTAP数据库前 , 想要实现数据敏捷却很困难 。 为什么?
▼▼▼
实际上 , 在同时支持OLTP和OLAP场景的HTAP数据库技术迭代之路上 , 一直存在着“改革派”与“改良派”两大阵营 , 他们从两条路径上探索着“数据敏捷” 。
“改良派”基于结合中间件的模式来实现“OLTP+OLAP”的HTAP , 在规模扩展与性能提升两个重要方面都受限 。 一方面 , 基于中间件实现的HTAP , 其数据必须汇聚到中间件节点 , 然后再执行 , 速度必然就上不来 , 难以实现高性能;另一方面 , 数据节点之间靠中间件来汇聚实现交互 , 数据节点也就成了孤岛 , 规模化扩展受限不说 , 分布式事务也难以支持 。
作为HTAP数据库最早的改革派代表之一 , SAP HANA 通过内存数据库实现了强大的混合负载能力 , 实现了很高的性能 , 快是快 , 但数据量有限 , 毕竟基于单一存储架构 , 在规模化扩展上容易受限 。 更令众多用户望而却步的是HANA“贵且专有” , 仅在使用SAP的大企业有少量用户 。 因而 , 这一代HTAP并没有真正扩展起来 , 也并没有流行成为数据库行业大趋势 。
因为这些不足 , 所以这类数据库厂商也很难构建出数据敏捷(Data Agility)的能力 。
近年来 , 随着互联网的发展 , 数据爆炸式的狂增 , 海量、实时、在线的需求越来越广泛 , 大量采用MySQL和PostgreSQL(PG)开源数据库的新一代企业 , 在针对提升热数据的实时在线分析能力上有着强烈的需求 , 特别是从事线上业务的数字化转型企业 , 这类需求尤为强烈 。 比如电商、游戏、数字媒体、金融科技、网络安全等互联网和数字化业务 , 其新鲜数据的实时分析能力 , 强化了数据敏捷 , 在很大程度上直接决定了企业未来发展的兴衰存亡 。 因为只有构建了数据敏捷 , 才能实现业务敏捷 。
当新一代HTAP的发展成为全球数据库行业中的大趋势之时 , 以Google Cloud谷歌云的AlloyDB、Snowflake的Unistore、PingCAP的TiDB等为代表的新一代“改革派” , 不仅打破了过去OLTP和OLAP两大典型应用场景的传统定位 , 获得了强大的数据实时处理和分析计算能力 , 而且基于分布式架构 , 实现了传统数据库、数据仓库难以实现的高性能、高扩展与实时处理能力 。 与此同时 , “改革派”让数据敏捷(Data Agility)成为了HTAP数据库发展的关键词 。
目前 , 有两大重要原因正在改变着新一代HTAP的市场需求和技术环境 。 一是来自用户实际的实时分析需求在攀升 , 特别是MySQL和PG开源数据库用户对于实时分析的需求在激增 , 迫切需要拥有HTAP的能力 。 二是 , 近些年来随着公有云的快速迭代发展 , 企业上云从刚需再到全面加速应用落地 , 分布式与云原生的叠加效应 , 也正在加速重构企业数据架构 , 并进一步影响着HTAP数据库的发展 。
应尽其用 , 充分展现数据敏捷的行业价值正如PingCAP CEO刘奇之前所言 , 一个好的数据库不是写出来的 , 而是靠用出来的 。 在HTAP赛道上 , 国内外的选手也越来越多 , 数据库行业“HTAP化”趋势日益明显 , 那么新一代HTAP数据库究竟适合哪些用户呢?
在早期还没有诞生新一代HTAP数据库之时 , MySQL和PostgreSQL可以满足用户的基本需求 , 在较小规模数据量情况下MySQL 数据库可以应对OLTP实时业务的挑战 。