运营商|36氪首发|拥抱开源,专注于云数据平台的大数据服务商「数新网络」完成数千万元Pre-A轮融资( 二 )


「数新网络」认为其对标公司是美国的Snowflake和Databricks , 在陈廷梁看来 , 这两家百亿美金的大数据巨头代表了未来 。
Snowflake 是来自硅谷的独角兽云数仓公司 , 2020年登陆纽交所上市时 , 曾创下史上最大 IPO的记录 。 Snowflake 颠覆了数仓行业 , 将计算分析和存储分离开 , 在云上建立一个高效、便于使用、性价比高的数据仓库 。 Snowflake在2020年做的Data Cloud(数据云)是在云数仓之上 , 大量租户可以在同一朵云上使用的数据平台;还提出了Data Consumer的理念 , 也就是各个租户之间可以进行数据交换 。
Databricks最新估值380亿美元 , 是世界上第一个和唯一一个云中的Lakehouse(数据湖仓一体)平台 。 Databricks拥抱开源 , 优化大数据计算引擎 , 结合最好的数据仓库和数据湖 , 为数据和 AI提供了一个开放和统一的平台 。
Snowflake坚持在PaaS层进行云化的商业模式 , 加上Databricks做大数据平台实时化和支持非结构化数据做智能分析的技术长处 , 是「数新网络」希望借鉴的优势 。
「数新网络」希望结合全球云数仓先进理念 , 打造适合中国落地路径的云数仓体系 。 因此 , CyberMeta , CyberOps和CyberScience这三款产品都结合了云数仓与云湖一体的模式 。
陈廷梁认为 , Snowflake的公有云体系在国外的环境中更容易发展 , 国外的世界500强企业基本都是私营企业 , 可以直接使用公有云 。 而国内只有体量比较大的企业客户对数字化的要求更高 , 才需要用大数据平台和算法平台这种基础设施 , 且他们更倾向于用私有云部署 。 这个矛盾之处让云数仓体系在国内比较难实现 。
然而 , 原来阿里云的公有云架构在做私有云部署时底座过大 , 需要数十台服务器支持;同时 , 这个底座也与开源生态不兼容 , 导致许多大型客户担心被阿里云绑定 , 导致跟主流计算引擎脱节 , 无法迁移替换 。
因此 , 陈廷梁基于在阿里云的经验积累 , 结合国内实际情况 , 对产品做了很大的改变 , 核心打造独立自主可控的一站式、云原生大数据基础设施平台 , 实现弹性可扩展、混合云/私有云的灵活部署 。
「数新网络」采取的核心策略就是基于开源 , 也融入开源生态 , 打造国内云数仓顶级开源社区 。 即对于云的大数据底座 , 尽可能用开源的主流生态 , 产品只做数据平台层的建设 。 对于重要标杆客户 , 还可以基于开源底座做定向代码开源 。
另一方面 , 「数新网络」也顺应大数据架构在近十余年来的变化趋势 , 采用Data Fabric , 也就是数据平台智能化 , 让数据开发和算法开发更加「傻瓜化」 。
据介绍 , 「数新网络」致力于提供大数据时代的主板和操作系统 , 以开源一站式地支持底层的各种计算引擎 , 相当于作为集成不同计算引擎的品牌电脑 , 提供封装以及上层更简单易用的操作系统 。
陈廷梁提到 , 用这个模式尽快确立市场优势后 , 会把基础架构再开源 , 就可以支持大量在此基础上开发的数据中台等系统 。
「数新网络」拓展了适合国内企业的云数仓基建模式 , 成熟的解决方案主要应用于场景金融、政务数字化转型和先进制造等领域 , 也包括医疗、零售、能源等行业 。
目前 , 其标杆客户包括浦发银行、华泰证券、高济医疗、中国石化、国家电网江苏省电力公司、屈臣氏、中国航发、浙江银保监局、香港大学等政企单位 。
【运营商|36氪首发|拥抱开源,专注于云数据平台的大数据服务商「数新网络」完成数千万元Pre-A轮融资】「数新网络」的产品大数据运维平台(CyberOPS) , 帮助浦发银行解决内部五大数据集群(批量数据集群、流式集群、联机查询集群、洞察集群、租户集群)包括其各服务组件安装、升级、监控等运维复杂度高、人力投入大等问题 , 提升平台整体运营服务效率 , 有效保证平台的可用性 。