V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
superhxnju
V2EX  ›  问与答

好奇有多少公司是支持机房/AZ 级容灾的?

  •  
  •   superhxnju · 292 天前 · 757 次点击
    这是一个创建于 292 天前的主题,其中的信息可能已经有所发展或是发生改变。
    在这个帖子里面看到有讨论多副本支持 AZ 容灾的事情 https://www.v2ex.com/t/1021131

    好奇有多少公司是支持“真”机房/AZ 级容灾的?

    个人理解如果是真正的实现容灾那么至上而下要能容灾:
    1. 首先业务和基础设置部署上需要多 AZ 部署;
    2. 然后在线业务依赖的数据库、带存储类的中间件(消息、缓存)需要有 AZ 容灾能力(如果只是切流,那不算“真“容灾,数据也需要保证完整性的);
    3. 还有离线大数据的批处理等也要跨 AZ 部署;
    4. 最后还要能监测到 AZ 故障,整体南北流量进行切流;

    感觉还是挺难的,所以大家的 AZ 级容灾是咋做的,真的可以把一个 AZ 永久性的灾难,然后业务可用性和数据也不受损么?
    3 条回复    2024-03-06 19:10:53 +08:00
    egen
        1
    egen  
       292 天前
    没那么容易做的,参考当年的支付宝机房光纤被挖断导致业务中断事件
    killva4624
        2
    killva4624  
       292 天前
    大部分逻辑组件或者边缘接入都是很好做到 AZ or 机房容灾的。
    真正难的是核心数据层,又要考虑数据一致性,又要考虑迁移成本和速度;还有日常演习的难度,不可能做到和逻辑层同样的容灾能力和 MTTR ,无非是在衡量成本、人力和可执行层面上综合评估,做一个平衡的方案。
    当然金融类平台也许真的有那么大的成本和精力投入去做,希望其他朋友能给出好的例子。
    superhxnju
        3
    superhxnju  
    OP
       292 天前
    @killva4624 是的,数据层跨 AZ 复制后延时至少再增加 1 ms ,不知道各个业务会为了 AZ 容灾付出多大的代价。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3266 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 18ms · UTC 12:06 · PVG 20:06 · LAX 04:06 · JFK 07:06
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.