容器|装在笔记本里的私有云环境:监控篇
作者:soulteary
本篇是系列中的第二篇内容,我们继续聊聊如何把一个简化过的私有云环境部署在笔记本里,以满足低成本、低功耗、低延时的实验环境。
在上篇《准备篇》中,我们聊过了基础虚拟化相关的事情,在虚拟机环境准备就绪之后,在继续折腾容器集群之前,我们还需要做一些基础技术设施建设,监控就是其中比较重要的一个组成部分。
写在前面说起监控,我相信许多时候,这是一个很容易被忽略或者被省略的部分。
尤其是在个人场景或者小公司或者团队,因为业务量小,不容易出问题,出了问题使出 “关机重启敲一敲” 的解决方案的也大有人在。在长久的工作过程中,我们都知道,没有监控最好的情况是无事发生,最糟糕的情况则是,问题发生了但是在早期没有被发现,随着时间推移,这个事情越来越严重,我们需要付出数倍的成本来解决问题。
文章插图
《Google SRE》 一书中提到的“服务可靠性金字塔”中的基石,同样也是监控。虽然我们很难达到 Google 业务的复杂度和量级,但是重视监控,以客观的数据事实来推动我们做相对正确的决策,还是值得每个人和团队去践行的。书中有一段比较形象的例子:
Without monitoring, you have no way to tell whether the service is even working; absent a thoughtfully designed monitoring infrastructure, you’re flying blind.
如果在搭建环境的早期,就规划设计了监控服务,那么在完善整体的过程中,便可以在有数据支撑的情况下,快速定位和判断哪些新增组件需要完善和调整,这样一来就避免了盲人摸象的状况发生。
监控选型如果你的业务都“跑在云上”,那么监控选型的事情其实可以变的很简单。尤其是如果你没有定制需求,那么在你的预算之内,云平台提供什么,你用什么就是了。甚至如果我们只跑一两台“虚拟机/服务器”,预设的运行程序数量也比较少的话,使用云平台提供的“探针式”的监控也是可以的。
因为本文的初衷是搭建简化的云服务环境,并且希望能满足低成本、低功耗、低延时的实验环境, 故需要从开源产品中进行选型、部署和使用。
选型细节经验在开始具体选择之前,先来分享一些之前折腾监控时的小经验:
如果你不能为所有的点都设置监控,以及设定合适的监控规则。那么至少要监控关键位置,形成你自己的监控网,而不是一个个监控散点。监控设施的监控策略、监控指标要灵活变通,而不是从“创业”初期开始到中后期还一成不变,僵硬的监控规则会遗漏非常多重要的信息。尽量不做“补作业”的事情,事后补监控的成本相比较事前做功课,只高不低(别忘记业务实际损失)尽可能提高采样率,避免不准确的、“懒惰的”监控数据掩盖了发生的事情。数据可视化和易观察有关联性,但是不一定是正相关。所以在选型上,不要追求酷炫,要时刻明确你的需要到底是什么。根据自己的经济实力,去选择基础平台和,避免选择“大而全”的“银弹”(众所周知,没有银弹),除非你对这个方案的提供团队非常信任。适当选择开源开放的平台,在有人同行的情况下,群策群力始终是有效的问题解决方式(你遇到的问题不会只有你一个人遇到)。
那么,比较通用的、适合从零到一阶段使用的监控系统,该选择谁呢?
开源监控产品:“普罗米修斯”时值 2021 年末,考虑搭建监控平台,相对主流的选择都在 Prometheus 和 Zabbix 之间摇摆。前者从 CNCF 带着光环毕业,在许多场景下泛指 “Prom Stacks”,能够模块化灵活提供快速搭建整套监控体系的方案 ,而不单单只是作为对标 InfluxDB 而存在的时序数据库。而后者则单纯的多,或者说最在某些程度上能够代表上一世代的监控思路的产品:大而全。
- 大屏|尺寸直追笔记本 曝国产厂商将推出高刷大屏旗舰平板
- 笔记本电脑|年货节,这些手机值得买!新年败家购机不完全指北
- 阿里巴巴|一块桌面版3070显卡的价格,就够买一个3070笔记本,还能剩点
- 笔记本|第一台电脑是在1998年买的,你呢?
- TCL|TCL 推出首款 Book 14 Go 笔记本?售价 2264 元性价比较高!
- 这些常见的电容器你认识几种?
- mac|程序员一旦用过一次苹果笔记本,这辈子都不会买windows电脑了
- 笔记本电脑|练口语的好助手:惠普Envy14轻薄便携笔记本电脑
- 笔记本|CES 2022 华硕新品曝光:一款最有看点的笔记本,还有大放异彩的 ROG
- 笔记本|送给自己的新年礼物,戴尔Inspiron 13-5310笔记本