V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
cloudwise
V2EX  ›  监控宝

运维生存时间呕血之作:网站运维黑锅如何甩

  •  
  •   cloudwise · 2015-09-23 11:42:24 +08:00 · 2754 次点击
    这是一个创建于 3352 天前的主题,其中的信息可能已经有所发展或是发生改变。
    常见经历

    讲几个工作中经常遇到的一些时间,或许你也遇到过,高高兴兴上班来,刚打开电脑,出现如下情况:

    领导跑过来问昨天网站访问很慢,服务器又出问题了
    客服跑来说福建地区 XX 市有用户说网站打开很慢,服务器又出问题了
    老板说昨天他在家里打不开网站,服务器又出问题了
    技术总监说昨天刚上 CDN ,你看看效果如何
    销售部问能不能看看全国各地区访问咱们网站的速度如何,以及如何改进
    还有更多关于网站运维的黑锅,欢迎大家列举...
    为什么出了问题总认为是运维的原因?

    说个题外话,在一家公司竟然遇到以前的同事,见面寒暄几句,他说了一句让我至今难忘的话:“还是你们运维轻松,每天什么是都不要干,只要盯着屏幕就好了,盯着服务器是不是有问题”。

    网站访问慢的原因

    1 、服务器故障
    2 、程序逻辑有问题,导致响应慢
    3 、网页某个元素慢,导致整个页面慢
    4 、用户网络环境慢
    5 、南电北网互通慢
    6 、运维的烦恼

    有人提议用 zabbix 试试,作为单节点的运维监控工具, zabbix 确实功能强大,但是它做不到全栈的网络性能监控,你以为 zabbix 是大神么,呵呵,过去的事情我不可能知道,某某地区的访问情况我也不会知道,我只有一台服务器。有人说用网页测试软件来试试吧,可是他只是一个普通的 get ,然并卵。

    解决方法

    最终这些影响网站访问的问题还是能得到良好解决的,云智慧的监控宝就是不错的选择,里面的页面性能管理和网站监控能让你甩掉不必要的黑锅。话不多说,上几个图:



    监测点对比



    网页性能管理

    全国几十个省份,武汉电信垫底。



    当前列出了所有监控点的页面打开时长数据,可以看到各地区的性能评分以及响应时间



    时序图



    各资源响应时间

    网页慢了,有可能是网页上某个元素拖垮的,可以监控到网页上各个元素的加载情况(用过 firebug 的都知道),我们可以知道 DNS 解析时间、建立连接、发送请求、等待、接收数据所消耗的时间,和 firebug 基本一模一样。上图可以看到,各个资源的各种时间都详细的列出来,我们能很精确的分析出问题到底出在哪个网络环节。



    网页性能管理 - 请求 /响应头

    可以看到服务器响应头,一般 head 里面包含文件过期时间、 CACHE 命中情况等等,都是一些有助于排查问题的信息。



    网站可用率

    获取某一天的可用率,上图可以看到上海科教网可用率为 75%,没听过,可用率低或许是理所当然的事情。

    怎么实现的

    监控宝提供了网页性能管理这个功能,只需要简单的配置。登陆后台,点击“监控”-》网页性能管理-》创建监控项目。



    创建监控项



    检测节点

    云智慧赠送给运维生存时间的帐号,一共有三十多个监控节点可供选择,企业版账号可以选择遍布全国以及海外主要城市 100 多个监控点,包含各个地区,各种网络。监控频率选择 15 分钟,频率越小数据越丰富。



    告警配置

    运维可根据自身业务的 SLA 定制告警触发器,比如,如果任意一个节点响应时间超过 5000ms 即发送告警,告警方式有 Email 、短信、微信和电话语音。你可以根据告警状况的严重程度选择合适的告警方式。



    检测配置完成

    最后

    如果你正在被各种网站运维问题所困扰,试试监控宝的网页性能管理吧,不但可以满足老板、领导、同事的各种坑爹需求,还能第一时间发现服务器和网络故障,把用户投诉消灭在萌芽状态,从此不再背黑锅。



    云智慧官网: www.cloudwise.com
    7 条回复    2015-09-23 15:10:08 +08:00
    hccao
        1
    hccao  
       2015-09-23 14:07:47 +08:00
    是需要购买这个产品吗?
    sunjiayao
        2
    sunjiayao  
       2015-09-23 14:19:15 +08:00
    这。。 生推啊
    Tink
        3
    Tink  
       2015-09-23 14:20:09 +08:00
    49
        4
    49  
       2015-09-23 14:35:57 +08:00 via Android
    竟然不是 oneAPM !
    好久没看到你们的软文了,快来快来 @oneapm
    nilai
        5
    nilai  
       2015-09-23 15:00:04 +08:00
    这广告。 这用户 必须  block 啊。
    bleedfly
        6
    bleedfly  
       2015-09-23 15:00:22 +08:00
    官网没看到试用的地方
    xfspace
        7
    xfspace  
       2015-09-23 15:10:08 +08:00 via Android
    卧槽,还以为是吐槽贴,尼玛来个软广。。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1153 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 18:54 · PVG 02:54 · LAX 10:54 · JFK 13:54
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.