高危操作强制投屏怎么样?让大家一起盯着点
1
fuzzsh 54 天前 via Android
处理故障谁还有空看群。。
|
![]() |
2
MuscleOf2016 54 天前
小范围修改验证灰度
|
![]() |
3
perfectlife 54 天前 via Android
这时候就凸显运维的经验和水平了
|
![]() |
4
darkengine 54 天前
预算足的话准备一台一模一样的备机,需要现场敲命令的现在备机上运行一遍,没问题再复制粘贴到生产服务器上执行
|
5
GopherDaily 54 天前
故障处理是很考验人的,不要寄希望有人能给你 review ,我个人觉得核心的几点:
- 胆大,其实这个是前提,遇到大问题,脑子直接宕机的人是不适合的 - 心细,在得出判断后,再想:如果是 xxx ,那么 yyy ,尽量再去找 yyy 的证据,然后采信 xxx - 日常积累 |
6
8zip 54 天前 via Android
核心是避免应急场景
紧急情况翻车才是常见的 |
![]() |
7
opengps 54 天前
既然已经是在线开发,那么要做的恐怕也就是多备份了。
联机开发错误必然直接影响线上,多个人看一遍比你单独找人测试一遍效率质量都要更低 |
![]() |
8
idblife 54 天前 via iPhone
这是真正考验个人水平的时候
|
![]() |
9
echo1937 54 天前
1 、危险操作先报告,批准后再操作;
2 、解决方案测试环境上先测过,再上生产环境执行; 3 、现场执行 2 人作业,一人作业一人监护(参考电力作业) |
![]() |
10
coolloves 54 天前
我们有紧急情况的时候,都是一人工作 n 人围观.
|
![]() |
11
killva4624 54 天前
找那么几个关键的人一起帮你 review 命令;
另外一个个人经验是,涉及到文件覆盖类的话,尽可能保持回滚能力,不能一把梭之后无法回头。 比如要手改代码或者覆盖二进制文件、配置文件,先 cp 一个备份; |