V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
laiwei
V2EX  ›  推广

《说透 Kubernetes 云原生监控》系列文章,交流收藏

  •  2
     
  •   laiwei · 2022-10-04 21:11:16 +08:00 · 2890 次点击
    这是一个创建于 541 天前的主题,其中的信息可能已经有所发展或是发生改变。

    云原生监控系列文章:《说透 Kubernetes 云原生监控》

    连载:《说透运维监控系统》

    注:

    1. 以上系列文章,均以开源监控系统——夜莺监控为例,你也可以对照 Prometheus 或者 zabbix 做相关的理解。

    2. 基于夜莺监控制作的一些 dashboard ,可以参考如下:

    • K8s apiserver dashboard with nightingale K8s apiserver dashboard
    • K8s scheduler dashboard with nightingale K8s scheduler dashboard
    • K8s controller manager dashboard with nightingale K8s controller manager
    • K8s etcd dashboard with nightingale K8s etcd dashboard
    第 1 条附言  ·  2022-10-11 12:33:05 +08:00

    Append:

    1. 看到很多v友收藏,谢谢,我会继续append这个主题;
    2. 今天补充一篇文章: 《基于夜莺监控,添加ElasticSearch 数据源,快速构建你的日志告警平台》

    预览

    第 2 条附言  ·  2022-10-19 13:49:00 +08:00
    第 3 条附言  ·  2022-10-30 20:58:34 +08:00

    追加一篇文章《Zabbix 和夜莺监控选型对比》,来自Zabbix社区专家张世宏,张世宏也是Nightingale社区活跃贡献者。

    13 条回复    2022-10-30 21:00:45 +08:00
    LeoJ
        1
    LeoJ  
       2022-10-04 21:23:48 +08:00   ❤️ 1
    支持一下 open-falcon~
    laiwei
        2
    laiwei  
    OP
       2022-10-04 21:57:33 +08:00
    @LeoJ :) 云原生监控,open-falcon 稍微有点力不从心(更适合物理机时代),夜莺监控是更好的选择了
    crazychang
        3
    crazychang  
       2022-10-04 22:42:23 +08:00
    收藏即学习
    YaakovZiv
        4
    YaakovZiv  
       2022-10-04 23:01:35 +08:00
    除了微信公众号,还有其他地方可以看吗,微信公众号加载挺慢的,有你们自己的博客网站吗
    laiwei
        5
    laiwei  
    OP
       2022-10-04 23:21:49 +08:00
    @YaakovZiv 系列文章都会在公众号上发,公众号是 flashcats 。

    不过也会在 https://n9e.github.io 和 http://flashcat.cloud 上做归档。
    pavelpiero
        6
    pavelpiero  
       2022-10-05 07:00:48 +08:00 via iPhone
    原生监控只是开始 后续需要做针对性地开发
    plko345
        7
    plko345  
       2022-10-05 12:17:42 +08:00 via Android
    为什么不用云原生的 prometheus ,国际化一点
    laiwei
        8
    laiwei  
    OP
       2022-10-05 17:46:38 +08:00
    @plko345 Prometheus 是一个挺好的工具,但是也存在一些痛点:

    1. ‌功能相对单一,产品化程度低,难以开箱即用;
    > 举个例子:可视化一般必须配合 grafana 来工作,告警一般也需要配合 alert manager 来一起工作,且告警策略的改动都需要修改配置文件。夜莺监控把数据采集、可视化、告警管理这些基本能力,都做成了 all-in-one 的产品化方案。

    2. ‌数据量过大时,官方缺乏合适的扩展性方案;

    3. ‌多集群管理功能缺失;
    laiwei
        9
    laiwei  
    OP
       2022-10-05 17:49:07 +08:00
    @pavelpiero

    是的,业务层面的监控,很多需要在业务代码层面主动埋点(不过好消息是埋点的工作量,借助于 open telemetry ,已经可以降低到足够低了,且都是标准化的方案)

    但是对于各种基础设施、中间件、云资源,这些监控,不需要百花齐放百家争鸣,尽可能选择最佳实践,开箱即用是更好的。
    laiwei
        10
    laiwei  
    OP
       2022-10-11 12:37:53 +08:00
    看到很多 v 友收藏,谢谢,我会继续 append 这个主题。
    wsszh
        11
    wsszh  
       2022-10-28 18:50:43 +08:00   ❤️ 1
    支持
    wuleiisme
        12
    wuleiisme  
       2022-10-30 19:47:32 +08:00   ❤️ 1
    看起来挺不错,最近正好有需求
    laiwei
        13
    laiwei  
    OP
       2022-10-30 21:00:45 +08:00
    追加一篇文章《 Zabbix 和夜莺监控选型对比》 http://flashcat.cloud/blog/zabbx-vs-nightingale/,来自 Zabbix 社区专家张世宏,张世宏也是 Nightingale 社区活跃贡献者。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1012 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 19:30 · PVG 03:30 · LAX 12:30 · JFK 15:30
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.