关于'高可用'的问题

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

这是一个创建于 451 天前的主题，其中的信息可能已经有所发展或是发生改变。

redis cluster, mysql mgr 都号称是高可用方案, 一旦节点故障,它们的故障检测、故障转移也是要时间的,至少也是秒级. 这期间他们应该是不可用的吧? 为什么这些方案也叫高可用呢

第 1 条附言 · 2023-10-05 16:47:20 +08:00

感谢各位的解释,是我对'高可用'的理解有误

故障

可用

MySQL

Redis

18 条回复 • 2023-10-05 23:31:55 +08:00

Ericcccccccc

2023-10-05 15:08:54 +08:00

如果你纠结的是"高可用"的定义, 要不你说说你心中的高可用是怎么样的?

vcn8yjOogEL

2023-10-05 15:11:08 +08:00

高可用不是始终可用

nonopa

2023-10-05 15:11:47 +08:00

@Ericcccccccc 故障切换无感知

nonopa

2023-10-05 15:12:35 +08:00

那我理解错了, '高' 不是完全

Worldispow

2023-10-05 15:15:11 +08:00 via Android

自己去搜搜高可用的定义吧。
99%是高可用，99.99%也是高可用。
高可用只是说高，可没说是一定、完全可用。

Ericcccccccc

2023-10-05 15:28:16 +08:00

@nonopa 如果是这么讲, 就会引出更难回答的问题. 什么是故障切换, 什么是无感知.

IndexOutOfBounds

2023-10-05 15:31:46 +08:00 via Android

最近也在纠结类似的问题，异步复制下的故障转移总是有可能丢数据的，不知道实际生产咋处理

sumarker

2023-10-05 15:53:40 +08:00

所有的方案都是在某种特定场景下的
方案肯定是在多方权衡之下选择出来的
已知的 "高可用" 应该都是经过一些实际试验后得出一个比较满意的结果的...
而且“程序设计没有银弹”。。。

coyove

2023-10-05 16:01:48 +08:00

我理解 OP 期望的真正高可用只有 CRDT 这类最终一致性的数据结构能办到了。但最终一致的逻辑也会导致很多业务没法直接用的，或者说要从头大改代码。

weeei

2023-10-05 16:10:51 +08:00

你可能理解错了，高可用不是一直可用，#2 说的对。
故障切换无感知，这里是相对于「谁」？
如果是使用 App 的用户，需要 App 端配合达到用户无感知：每个 API 设置重试次数和重试间隔，比如重试 3 次，每次间隔是 5 秒，那么服务端只要在 15 秒内能提供服务，App 用户只会觉得是网络慢，不会感知到发生了故障。