数据库|数据敏捷,HTAP数据库既决效率又决生死( 二 )


后来数据仓库兴起 , 诸如数据仓库(Data Warehouse)、数据湖(Data Lake)、湖仓一体(Data Lakehouse)等大数据技术可以处理大规模的数据量 , 但无法实现在线服务 , 可以想象一下 , 要将Hadoop直接当做一个OLTP数据库平台去用 , 将是多么尴尬的事情 。 再者 , 大数据栈要为用户提供毫秒级别的响应 , 也是挑战不小 。
但是 , 新一代HTAP数据库诞生后 , 在扩展性、TP与AP融合的HTAP两个方面得到充分发挥 , 成功开辟并构建了一个数据敏捷(Data Agility)的数据库发展区域 。 以此定位 , 将为用户提供更简单、更易用的新一代HTAP数据库 , 这也成为了TiDB的定位 。

事实上 , 全球已有众多MySQL应用开发者 , 他们都需要更具备数据敏捷(Data Agility)的数据库来承载 。 因此 , 新一代HTAP数据库与传统数据库对比有错明确的错位 。 包括Databricks、MongoDB、Confluent、Snowflake、PingCAP等厂商 , 都基于云生态而发展 , 而得以彰显其价值 。 TiDB也成为了云生态的受益者 , 发布了全托管的数据库即服务(DBaaS)产品TiDB Cloud , 为企业用户提供开箱即用的TiDB服务 。 同时TiDB还陆续上线了亚马逊云科技与谷歌云的Marketplace , 以及阿里云云市场 。
在更完整的生态对接方面 , 数据库从来都不是单独被使用的 , 而TiDB也在持续改进和生态环境的对接 。 在新版本中 , TiDB引入了用户级别锁和TiCDC下的Avro格式向Kafka同步数据的支持 。 TiDB从6.1版本开始支持兼容MySQL的用户级别锁管理 , 支持GET_LOCK、RELEASE_LOCK、RELEASE_ALL_LOCKS 等锁管理函数 , 这使得TiDB得以更好支持现有 ORM框架的生态 。 尤其在数据敏捷(Data Agility)方面 , TiCDC工具表现出色 , 支持将TiDB数据库的增量数据转换为Avro格式 , 并发送到Kafka的方式 , 这将使得TiDB数据库与Kafka、Snowflake、SQL Server等众多生态系统都连接起来 。 从而实现对常用的数据格式的支持 , 降低开发复杂度 。
全球云观察分析指出 , 近年来 , TiDB快速发展并获得先发优势的秘籍 , 必然就在于将“数据规模高扩展性与数据处理实时性”得以有机结合 , 未来也将充分展现出数据敏捷(Data Agility)定位的行业应用价值 。
Scalability x HTAP虽好 , 也需要两大生态的助攻然而 , Scalability x HTAP虽好 , 也需要开源和云两大生态助攻 。
开源优势在于拥有开放生态 , 敏捷创新与更快迭代速度 。 不过 , 在PingCAP联合创始人兼CTO黄东旭看来 , 真正的迭代速度或者说更有价值、更有意义的迭代速度在于开源软件如何帮助应用开发者更快地开发出新应用 。
在这之前 , PingCAP推出一个OSS Insight.io的开源项目 , 采用了46亿个GitHub事件数据来构建 , 开源社区开发者可以凭借这个OSS Insight开源项目分析工具 , 多维度深入洞察开源项目的健康状况 , 从而获得有用的价值分析 。 值得关注的是 , PingCAP只用了两个人一周时间 , 就成功构建了整个OSS insight网站 , 其背后却只有一个 TiDB Cloud 支撑其在线数据、所有数据的分析以及图表等应用 。
可见 , 通过开源数据库与云服务融合发展 , 新一代HTAP数据库能够极大降低应用开发的复杂性 , 加速开发进程 , 为应用和业务赢得更多的时间 , 从而助力数字化企业赶超行业对手 , 占得市场先机 。
在过去几年中 , 开源与多云的融合发展 , 已经凸显出来了三个关键技术赛道 , 包括云原生、数据技术和人工智能 , 新一代HTAP数据库已经融合了这三大关键技术 , 并以云服务方式对外发展 。
基于开源的开放性 , 通过云原生的灵活性 , 发挥公有云带来的低门槛、更快速、更有业务友好性 , 通过与公有云合作 , 新一代HTAP数据库在第三方云平台的公有云上部署 , 可以应对当前企业出海 , 走向全球化发展面临的数据挑战 。