SREWorks 中统一以应用抽象来描述业务系统 , 在开发人员将研发完成的应用制品交付上线后 , 就会对线上应用实例生命周期进行监测、管理、控制 。 SREWorks所拥有的运维数据能力会提供增值化的运营、服务 , 为有需要的人员提供便捷的视图、管理能力等 。
“交付、监测、管理、控制、运营、服务”六大场景在SREWorks产品手册中有详细的定义及边界说明 。
2 完整的数据化运维体系实践
一套数据化运维体系 , 会把所有系统的运维数据全部采集起来、真正打通 , 并深度挖掘这些数据的价值 , 为运维提供数据决策;同时构建数据化运维业务模型 , 基于该模型建立标准化运维数仓 , 建设数据运维平台 , 在平台中规范运维数据的采集、存储、计算及分析 , 并提供一系列数据化服务 , 供上层运维场景使用 。
有了运维相关的量化数据 , 对运维工作的描述和衡量将更加立体化 , 可以建立长期可持续优化的运维工作模式 , 实现真正的运维价值 。
3 服务化的 AIOps 智能运维平台
在阿里云大数据 SRE 团队看来 ,AIOps 的出现并没有改变运维的表现形式 , 依旧还是“交付、监测、管理、控制、运营、服务”的界面 , 只是在大量运维数据化工作的基础之上 , 利用AI能力探索、挖掘智能化运维场景 。 因此 , 在一开始构筑 AIOps 工程实践时 , 就坚持打造“感知、决策、执行”的闭环 , 类似自动驾驶的理念 。
SREWorks将量身定制的算法与运维场景化结合 , 能够提前预测、关联分析 , 增强风险预防、故障定界定位能力 , 实现传统手段无法获得的运维价值 。 具体而言 , 将每一个智能化的运维服务包装成感知的“监测器”、决策的“分析器”、执行的“策略器” , 供健康管理、变更管理等系列服务调用 , 即可增强已有运维场景 , 解决一些普通手段无法解决的问题 。
4 运维中台化、低代码化及云原生化运维开发体验
SREWorks 套件自身也是云原生化的应用 , 并且采用运维中台思想构建 , 在中台里构建大量的PaaS 化运维服务能力 , 在前台围绕“交、监、管、控、营、服”六大场景提供SaaS 化运维场景应用 。
大部分页面为企业后端控制台类系统 , 不太需要很酷炫的交互设计 , 故而 , 运维开发领域的前端开发始终难于追赶前端流行趋势 。 针对这些特点 , SREWorks 创新性地设计了一套 Serverless 体验的前端开发模式 。
三 为什么要开源? 阿里云大数据 SRE 团队之前在多次技术分享时重点介绍过“DataOps、AIOps”的能力 , 但都是纯理论层面的介绍 。 具体在 SRE 领域 , 到底在工程实践上实现这一套理论?对运维的需求、界面、内核这三层的理解如何落地?
为了把数据化、智能化这套数智内核故事讲明白 , 阿里云大数据 SRE 团队将具有低门槛、高效率特点的云原生运维平台SREWorks开源出来 。
他们坚定地认为 , 运维团队更需要拥抱云原生 , 只有这样 , 运维才能在云原生浪潮下找到一席之地 。
该团队也希望 ,SREWorks 的开源 , 能让更多从业者使用“大数据和AI”的能力做好运维 , 实现“数据+智能”的运维平台内核 。
据介绍 , SREWorks背靠阿里云计算平台系列“大数据AI”产品 , 如 MaxCompute、Flink、DataWorks、Hologres、Elasticsearch 等 , 开源版中同样选取了这些产品对应的开源版本 , 比如开源版 Flink、Elasticsearch 等 。
四 后续规划 SREWorks平台目前每个月会进行一次迭代开发任务 , 后续将由版本管理员统一维护合入相关功能及问题修复等内容 , 以保证最新的云原生化运维能力持续进入后期版本中 。
- 云科技|蒋烁淼云计算创业十二年:从云厂商的影子到打造中国版Datadog
- 阿里巴巴|巨鹿小学生和阿里“音乐派”合奏春日暖歌《茉莉花》
- 腾讯云|周鸿祎:一旦战事爆发关键基础设施可能成为黑客组织攻击的“活靶子”!
- 阿里巴巴|阿里调转船头布局自营,京东唯品会加速前进,电商逻辑变了
- 网易云音乐|网易云音乐发布上市后首份成绩单,净收70亿的网易云该咋看?
- 欧科云链:迎接Web3.0 为安全可信的价值互联网打好技术底座
- 京东云“一码到底”溯源技术,加速汽车后市场“触网”
- 阿里巴巴|没有看错马云,在甲骨文断供后,方才看懂阿里十年前的坚持!
- 是什么让马云预言|新零售是什么模式?解析什么是新零售
- 电力仿真软件上云提速360倍,数字电网建设又进一步