字节跳动|“云网管”- 云上构建网络自动化体系( 二 )



动态拓扑: 通过LLDP和MAC扫描技术准实时拓扑更新 , 设备连接关系、端口信息等实时呈现 。

一体化监控 一个办公分支或者门店的网络 , 一般是涵盖了多个层次的网络 , 包含多种网络形态的设备 。 通常包括接入运营商的网关设备 , 进行数据转发的网络设备(路由器或交换机) , 提供WLAN的无线设备以及五花八门的终端应用 。 一套从网到端全链路覆盖的监控方案是必要的 , 因为往往端侧的异常 , 可能是有线网络的问题 , 有线侧的故障 , 会影响下游端侧多个终端或应用的使用 。

云网管针对有线网络、无线网络、终端应用等不同网络层次的设备 , 通过主动采集、事件接收、插件部署、主动拨测等多种监控技术 , 从网关到终端全链路监控网络运行情况 。 在如下的监控视图里将交换机上联口流量、到运营商的出口流量、AP的终端连接数以及终端的监控信息等有线和无线的指标在一个视图里完成监控 。

网络编排 云网管提供可视化的流程编排引擎 , 用户通过拖拽的方式将网络操作的原子能力串联起来 , 保障业务下发时的事务完整和安全 。
1.完整业务流程编排定义

2.单步配置流程可视化下发

故障自愈 日常高频的故障场景 , 基于云网管的网络编排能力 , 可以将告警联动处理方案 , 快速实现故障止血和业务恢复 。
3.架构介绍 3.1技术架构

协议插件 云网管的协议插件集成了管理网络所需要的ssh、telnet、netconf、snmp、grpc等协议 , 支持管理市面常见的商用网络设备 。 协议插件通过加密的安全通道与云端的采集控制实例进行通信 , 高效执行云端下发的设备操作指令和采集任务 , 并将数据压缩后实时反馈给云端进行分析和展示 。 协议插件的Agent支持以云网管自有硬件、软件安装包、集成SDWAN网关等多种方式输出 。
采集控制 采集控制实例在云端部署 , 在云网管的整体架构中起承上启下的作用 。 调度引擎的工作流程: 1. 接收网络编排下发的任务 , 按任务优先级、调度计划等策略 , 将任务进行合理拆解和调度 。 2. 根据设备厂家型号等维度将指令通过模板翻译映射为操作设备的具体指令 。 3. 将指令下发到Agent执行 , 等待接收执行结果 4. 任务执行结果分析和拼装模板管理: 模板分为“用户模板”和“设备模板”两类 , “用户模板”只具有业务含义 , 屏蔽了厂家差异 , 在网络编排中直接引用 , “设备模板”是细化到厂商、型号粒度 , 不同的厂商之间都有明显差异 。 例如:“ACL策略”的设备模板 , 思科和华为是不同的指令 。
网络编排 网络编排负责业务模型的统一抽象和定义 , 网络编排将原子能力按业务流程进行串连 , 形成具体的网络方案 。 网络方案通过流程引擎驱动采集控制实例执行每一步的原子操作 , 以工单的方式控制事务完整和链路追踪 。
应用 网络编排以API的形式对应用提供能力和数据接口 , 应用层实现具体的“资源管理”、“网络巡检”、“网络变更”、“故障恢复”等能力 , 支持运维人员进行日常的网络运维、业务配置等工作 。
3.2部署架构
云网管SaaS化部署 , 分钟级开通云上网管实例 , 用户侧只用部署探针(硬件版只需要上电和网络可达)即可 。
云网管的计算和存储资源都是使用的阿里云资源 , 可以根据规格随时扩容 , 基于阿里云ASK集群实现的CI/CD功能 , 可以随时迭代上线新功能 。

【字节跳动|“云网管”- 云上构建网络自动化体系】本文为阿里云原创内容 , 未经允许不得转载 。