数据|专访星环科技朱珺辰:大数据和云原生技术融合,中国已经做到事实上的国际领先( 二 )
在我们喊出“大数据和云原生技术融合”,并产生了一些相关业务价值之后,Cloudera也沿着这条路线展开了引进和开发。按照其说法,他们在2019年开始尝试有关技术,并于今年上半年取得了初步成果。因此在技术方向上,我认为星环科技发挥了引领作用。
国外公有云的发展相对来讲是比较迅速的,其接受程度也更高。一些国外公司的发展模态是基于公有云,构建其配套的数据分析产品和相关工具栈。这是国外竞品的基本情况。
观察者网:国内外的发展状态,用“差距”来形容更恰当,还是用“差异”来形容更确切?
朱珺辰:
我觉得在大数据领域,“差距”是谈不上的,国内的技术在某些领域更为领先。
在具体的技术实现上,国内外会存在不同。但在发展路径上,国内外的差异一定程度上在慢慢缩小。就大的发展方向而言,大数据技术是市场以及客户需求在推动的,因此在认知方面,大家的差异会不断趋同。况且在大数据领域,中国确实起到了一定的引领作用。
观察者网:之前看到咱们的公开介绍资料,星环科技基本实现了软件技术的自主重构。围绕这一块,能不能讲解一下背后的技术和产业意义?
朱珺辰:
星环科技选择并坚持了自主路线。不过,这并不是说我们从一开始就是“为了自主”,从而标新立异地去推进这份事业。在很早之前,我们就在软件技术领域有所积累和耕耘。从大环境上来说,彼时还没有中美之间所谓的贸易战,而国家信创(信息技术应用创新产业)也还没有到达今天的高度。
公司创立之初,遇到的问题是客户的需求不能被开源产品及其组件满足。当时我们也曾尝试着加入开源社区并做出贡献,但实际上,开源社区是被国外公司把控的,不是说我们想把技术往哪个方向引导,就能如愿的,这是其中一个方面。
第二个方面,相对来讲,中国早些年对软件价值的重视不足。在市场环境不理想和知识产权保护不足的大环境下,旧有模式其实是不合适的。
实践证明,在中国,企业难以通过之前的开发模式存活下来,并长远发展。
因此,我们当时考虑到两个方面:其一是开源路线本身,它不能满足客户和市场需求;其二是中国的市场和竞争状况,决定了我们不会采取“开源+社区”的方式。
从技术方面来看,我们很早之前就发现,Hadoop架构设计初衷,就是服务于海量数据的批处理计算。在交互分析和数仓等方面,它是没有办法同MPP架构相较量的。它不仅不能完全运作,在性能上也存在明显差距。
结合我们后来迈入银行业的感受。银行是要保障数据最终一致性的,所以银行在数据加工过程中的批量更新和删除等方面存在需求。但开源架构并不能提供有效支持。
在当时的环境下,基于开源模式无法满足客户需求等一系列原因,我们开始做自主研发,沿着业务应用,向底层技术探索。相比于选择“开源”,自研会更早地遇到问题、发现问题并解决问题。
中国市场的数据量远超美国,这是人口基数决定的。特别是银行业、金融业,它们的存量业务系统非常庞大。以我们的从业经历来说,一些正常规模的银行客户有上万张表,其批处理作业规模非常大。
美国总的人口规模决定了其数据量级低于中国,包括银行交易的流水、清单,以及交易平台衍生的其他记录。我们早期涉及的公安和运营商业务,它们的数据量也远超美国。
因此,在服务客户和市场推广过程中,我们会根据实际需要,进行相关的自主研发。
观察者网:在提供基础面支撑性服务的时候,星环科技有哪些发现?我们的国家近些年来有哪些可喜的变化?
- text|《2021大数据产业年度创新技术突破》榜重磅发布丨金猿奖
- 酷睿处理器|关键数据出炉,京东比阿里差远了
- 财智干货|数智化发展任重道远,财务中台提升数据服务价值 | 大数据
- 央媒表态后,联想关键数据出炉,柳传志这回要扳回一局?
- 数据库|OPPO悄悄上新机,骁龙8核+5000mAh电池,256G仅售1599元
- 数据仓库|红米真我moto三款骁龙870手机对比:2000元以内,谁更值得买?
- 中文|爱数智慧CEO张晴晴:基于”情感“的人机交互,要从底层数据开始
- B费全场数据:2次射正打入2球,3次抢断、1次拦截
- iPhone|东芝NAS硬盘N300系列+ORICO硬盘柜=“数据保险柜”
- 数据库|丁磊致歉“鱼眼观察”作者并回应:已撤回删稿函