理论用于实践!华为配置管理研究获SIGCOMM 2022最佳论文奖( 二 )


为了实现这一设计 , 研究者需要解决以下几个挑战:
配置手册制式异构性:不同设备商的手册制式没有统一规范 , 是各设备商自行组织和撰写 , 这给自动化地“读懂”手册造成了挑战 。
配置手册的歧义性错误:手册是由人撰写的文档 , 在文档维护过程中难以避免会出现人工错误 , 由于配置手册可能包含上万个配置命令说明页面 , 人工逐一排查是不现实的 。 自动化地解决这一难点是从手册中提取准确可靠的设备配置模型的关键 。
设备原生配置模型和控制器统一配置模型的异构性:随着设备功能逐步升级 , 通常有大量可选的配置命令和参数 , 人工进行配置模型映射繁琐且容易出错 。 需要一个强大的配置语义理解模型进行自动化配置语义推理和映射 。
最终 , 研究者设计了一个助力网络配置管理最后一公里的辅助框架NAssim , 在设计过程中主要在以下三个方面进行了创新 。
首先 , NAssim设计了统一的手册解析框架解决配置手册制式异构性的挑战 。 研究者基于对一些主流设备厂商手册的深入调研分析 , 洞察到尽管多设备商配置手册制式不一 , 但配置手册的基础功能“向用户展示如何配置设备”是不变的 。 因此 , 手册通常需要描述设备所支持的所有配置命令及其功能、配置参数及其含义描述、配置命令的工作视图和配置样例 。 基于这一洞察 , 研究者设计了一种设备商无关的统一格式 , 用于归一化不同设备商配置手册的制式差异 , 同时平衡了可扩展性和可读性 。 研究者进一步设计了测试驱动的流程 , 保障为主流设备商定制解析器的过程更为高效和可靠 。
其次 , NAssim设计了严谨的校验器解决配置手册的歧义性错误的挑战 。 研究者设计了三个层面的校验 。 在命令级层面 , 研究者通过将配置手册序言的语法说明形式化为BNF范式 , 并用解析器生成工具生成语法解析器 , 对配置命令模版进行自动化校验 。 在命令互关系级层面 , 研究者利用配置手册的配置样例推理出配置命令间的层级关系 , 提取出富含语义信息的设备配置层级模型 , 并能刻画存在可能歧义的推理 。 在命令片段级 , 研究者进一步利用现网具有正确性保障的配置文件 , 对设备配置模型进行校验 。
最后 , NAssim设计了基于配置语义模型的映射器解决设备原生配置模型和控制器统一配置模型的异构性的挑战 。 研究者设计了配置语义理解AI模型NetBERT进行自动化配置语义推理和映射 , 通过语义相似度计算 , NetBERT输出异构配置模型之间的映射推荐 , 运维专家可进一步审阅确认 , 提升运维效率 。
NAssim的效果究竟如何呢?研究者分别对厂商设备配置模型构建阶段(VDMConstructionPhase)和配置模型映射阶段(VDM-UDMMappingPhase)进行了详细评估 。 自动构建阶段的评估表明 , NAssim解析器框架+校验器可以成功从四个主流设备商的配置手册中构建出可靠的设备配置模型 , 在构建过程中 , 校验器识别出配置手册中超过200个歧义性错误 。 映射阶段的评估表明 , 经过配置领域适应的NetBERT模型达到了最佳的配置映射推荐效果 。 以topk召回率(recall@topk)为指标 , 在映射华为设备的配置模型到控制器统一模型的实验中 , recall@top10为89% , 这意味着如果允许推荐10个映射 , 则只有11%的情况下 , 运维工程师需要去翻阅配置手册 , 提升了9倍运维工程师效率 。
该研究工作中发布了一个经过校验的多厂商配置语料数据集 , 以促进后续网络配置管理领域的研究 。
NAssim系统架构:助力集中式网络配置管理最后一公里的辅助框架