新数据库时代,不要只学 Oracle、MySQL( 二 )


开源已经成为所有开发者的必选项 , 据GitHub统计数据:2016年仅有80万人第一次做出开源代码贡献 , 而2021年 , 这个数字已经增长到300万 。
新数据库时代,不要只学 Oracle、MySQL
文章图片
在数据库领域中 , 开源的“吞噬”情况也十分明显 。 dbdb.io(卡内基梅隆大学维护的全球数据库信息库)分析了全球知名的841个数据库系统 , 其中开源数据库有608个 , 占比72% , 只有200多家是商业数据库 。 在全球顶尖数据库排行榜中 , 开源数据库也占到一半 。
新数据库时代,不要只学 Oracle、MySQL
文章图片
在CSDN制作的2021数据库全景图(V1.0)中 , 我们将不同领域的数据库按照开源和闭源两类进行颜色区分 , 右侧浅绿色的部分是开源数据库 , 左侧深绿色的部分是闭源数据库 。 可以很明显地看到开源在快速发展 , 且有吞噬闭源数据库的趋势 。
新数据库时代,不要只学 Oracle、MySQL
文章图片
来源:《新程序员002》
中国数据库在发展核心技术生态的大背景下 , 也发展得非常的迅猛 。 dbdb.io(卡内基梅隆大学维护的全球数据库信息库)统计的全球800多家数据库企业中 , 中国有56家 , 但实际上中国数据库厂商有200多家 。 尤其在新型数据库上 , 中国企业“冒头”较多 , 例如现在发展势头强劲的TiDB , 在GitHub上非常活跃 。
当然 , 开发者目前使用较多的还是相对传统的基础关系型数据库MySQL , 还有大数据领域Redis、Apache/Hive、MongoDB等相对比较传统的技术 , 但绝大部分都是开源的 。 尽管最普遍被使用的依然是关系型数据库 , 但新型数据库则代表了未来趋势 。 根据CSDN2021-2022年数据库开发者大调查显示 , 在云趋势下 , 有52%的公司已经部署了云数据库 , 只有23%的公司尚未计划部署云数据库 。
新数据库时代,不要只学 Oracle、MySQL
文章图片
新型数据库人才抢手
对于目前的就业环境 , 我认为开发者应当好好学习数据库技术 , 并且不要局限于仅学习关系型数据库 , 更要学新型数据库 。 为什么呢?
新型数据库的技术栈跟过去大有不同 , 关系型数据库只是里面最基础的一环 , 而数据分析、数据仓库、可视化等很多新型技术栈在涌现 。 开源中比较热门的新数据库类型包括分布式数据库、时序数据库、图数据库、流式数据库等都在GitHub上排名非常靠前 , Star数也非常高 。
新数据库时代,不要只学 Oracle、MySQL
文章图片
20年前 , 市面上只有关系型数据库 , 主要面向事务性的交易 。 而如今得益于云、微服务、分布式应用、全球规模、实时数据、深度学习等 , 新的数据库架构应运而生 , 以解决新的性能需求:快速读取和快速写入的不同系统;专门用于支持实时分析的系统;用于非结构化、半结构化、事务性、关系、图形或时间序列数据的系统;适用于缓存、搜索、基于索引、事件等的数据……据统计 , 一家企业平均在七个或更多不同的数据库中存储数据 。
这些新技术带来了新机会 , 同时也加大了市场对人才的需求 。 我国数据工程师真正诞生是在十几年前 。 而现在 , 随着数据量的激增且更多地存储在云端 , 越来越多公司变成数据公司、市场对数据公司的需求也在持续增长 。 基于数据做分析的数据分析工程师也非常重要 , 他们既要了解数据库的技术 , 又要懂业务 , 才能更好地进行数据分析 , 这样的人才在未来会非常紧俏 。