自主开源|网易数帆发布自主开源计划,聚焦云原生生产落地

10月21日,一年一度的网易数字+大会在杭州拉开帷幕,网易数帆在会上发布了围绕云原生生产落地的自主开源计划,在这一主题下开源的KubeDiag、KubeCube、Hango(函谷)等云原生项目,以及未来的更多开源项目计划。网易数帆基础架构总监张晓龙表示,这是网易数帆践行“架构开放,内核开源,把控制权交给客户”独特理念的真实写照。
自主开源|网易数帆发布自主开源计划,聚焦云原生生产落地
文章插图
自主开源,聚焦云原生生产落地
在数字化席卷全国的浪潮下,开源基础软件已经渗透到各行各业,其中又以Kubernetes、Istio、Spark等表现尤为突出。以网易为例,在其覆盖零售、音乐、教育、传媒、游戏的多元化业务之下,运行着100多个Kubernetes集群,每天有超过100亿次的服务网格调用量,超过15万的Spark任务。
作为基础软件提供者的网易数帆,在长期规模化实践中也积累了大量的经验。张晓龙表示,社区云原生开源组件功能强大,只是由于其复杂性,在企业生产落地过程中,尤其是大规模应用场景下,还存在诸多亟需克服的挑战。因此,网易数帆选择以解决云原生生产落地问题作为当前自主开源主题,围绕Kubernetes、Istio和Envoy生态,解决易用性、可用率保障、性能优化和成本优化等四个方面的问题。
【 自主开源|网易数帆发布自主开源计划,聚焦云原生生产落地】在这一主题下,网易数帆开源了云原生运维诊断系统KubeDiag、多租户可视化Kubernetes管理平台KubeCube和高性能云原生API网关Hango(函谷),分别致力于解决Kubernetes可用率保障、Kubernetes易用性和API网关性能和易用性等问题。这些项目也是网易数帆支撑集团互联网业务和服务外部客户沉淀下来的成果,经过了大规模业务实践的验证,同时也注重对鲲鹏等国产硬件平台的适配,能够让国内企业和开箱即用且自主可控的云原生基础软件的距离又靠近了一步。
此外,张晓龙透露,在未来几个月中,网易数帆还将开源日志服务项目Loggie,基于Kubernetes的在/离线混部项目Zeus,以及服务网格性能加速项目MeshTurbo等,继续为夯实云原生基础软件做贡献。在网易数帆的这些自主开源项目中,贡献给CNCF的计划也已经排上日程。
网易数帆的开源计划获得了CNCF积极的反馈。Linux基金会亚太区策略规划总监、CNCF中国区总监Keith Chan对表示,网易作为CNCF会员,在云原生技术应用、标准推广及社区生态完善方面都做出了长期的努力,凭借这些积累,以及对业务痛点的把握,网易数帆此次发布的云原生开源主题和新项目,将能够对云原生技术与行业场景的深度融合产生巨大的价值。
KubeDiag,开创运维经验即代码时代
云原生运维诊断系统KubeDiag是本次发布的一个特色项目。在传统工作模式下,云原生场景下故障/问题诊断依赖经验手工处理,解决效率低下且无法较好沉淀形成诊断能力,为此设计的KubeDiag,则通过提供交互式排障工具,以及诊断恢复流程的代码化记录,很好地解决了这一问题。
自主开源|网易数帆发布自主开源计划,聚焦云原生生产落地
文章插图

张晓龙介绍了KubeDiag的三大核心优势。其一是经验即代码,诊断经验100%通过代码实现,易沉淀复用。其二是自动化,以流水线方式高效编排诊断过程,可一键点击/自动触发运行。其三是良好的可移植性,以Kubernetes Operator实现,可以在任意Kubernetes环境无差别地运行。
张晓龙透露,在网易,KubeDiag已经实现全部Kubernetes集群接入,带来的直接结果是运维诊断效率提升300%,人力成本降低80%。更重要的是,系统已形成了近100个故障/问题场景的自动化诊断处理能力沉淀。正是这些能力沉淀,可以让不同行业不同场景下Kubernetes可用率保障的提升变得简单。