生产环境一堆 4c8g 的阿里云机器跑 k8s ,k8s 跑 java 程序,操作系统经常行杀 java 进程,导致生产及其不稳定,也是没谁了,降本增效也不能降运维成本呀。
生产环境一堆 4c8g 的阿里云机器跑 k8s ,k8s 跑 java 程序,操作系统经常行杀 java 进程,导致生产及其不稳定,也是没谁了,降本增效也不能降运维成本呀。
1
xenme Jun 29 via iPhone
总不能为了稳定性扩机器,然后把没事干的你裁了吧🐶
所以,是好事 |
2
wowawesome Jun 29
管他呢,开个 8G 的 zram 再叠一个 10G 的 swap ,不够再加。接口慢点就慢点吧,等就行了。
|
3
jonathan001 OP @xenme 我不想干了已经,没有意义,完全看不到发展。
|
4
jonathan001 OP @wowawesome 关键是出问题找你呀,解决问题的速度是你的 KPI
|
5
Neolin Jun 29
@wowawesome #2 有 k8s 的情况下,一般不开 swap 吧
|
6
wowawesome Jun 29
进程挂了找你,慢也要找你吗?
|
7
wowawesome Jun 29
@Neolin #5 一般是一般,人不是给它服务器缩水了么。
|
8
JeromeCui Jun 29 说句实话,4c8g 程序还挂,这程序写的是有多烂
|
9
lujiaosama Jun 29
这是开了多少个微服务,java 的我看普遍在 1g 多一点,开一两个还是没问题的吧。
|
10
JackMi Jun 29
凑合干干,要是没有 bug ,服务器都正常运行,要程序员、运维 干屌
|
11
shalou8023 Jun 29
我们有个运维都被砍掉了
|
12
ca2oh4 Jun 29
这貌似不是运维成本,而应该是运行成本/运营成本
|
13
leegradyllljjjj Jun 29
每当我遇到这类问题,我都会默念一句,一个月几千块玩儿什么命啊
|
14
676529483 Jun 29
4C8G ,k8s 占 1G ,还行吧,设置 requests 一台服务器调度一个应用,够用了吧。除非应用烂
|
15
ddter Jun 29
直接开个 claude code 远程 ssh 进去 7x24 自动运维。
|
16
amrom Jun 29
有问题才好啊,没问题还要你干啥
|
17
han1988 Jun 29
给你们总监提新项目,java 换 graalvm 原生编译
|
18
aarones Jun 29
等着出问题就行了,不给钱你没有任何办法
|
19
EthanV2 Jun 29
老板:我希望你能从沙子创造内存条来,发挥你的主观能动性,不要想着公司为你做什么,要多想想你为公司做了什么
石英砂(主要成分二氧化硅) -> 工业硅 -> 多晶硅 -> 单晶硅棒 -> 硅片/晶圆 -> 光刻(涂胶、曝光、显影、刻蚀) -> 离子注入与沉积(制造晶体管) -> 晶圆测试 -> 晶圆切割(切成单个内存颗粒) -> 芯片封装(加壳与引脚固定) -> 内存颗粒测试 -> SMT 表面贴装(颗粒焊接至 PCB 电路板) -> 金手指电镀 -> 内存条成品测试 -> 包装出厂 |
20
djs Jun 29
降本增效后,日志都查不到了,笑 cry
|
21
xwayway Jun 29
|
22
defunct9 Jun 29
4c8g 不行的,得 8c32g
|
23
k9982874 Jun 29
你是运维:压测报告扔给开发老大,让开发优化去
你是开发:性能测试扔给运维老大,让运维想办法 |
24
JYii Jun 29 @wowawesome #6 通常是要找运维的,即便定位到具体开发,也要回过来找运维,开发能有多少权限,一点一点跟运维要日志。最后进度要是实在太慢,才提单提权。
|
26
SethShi Jun 29
直接 Claude k8s cli 去操作,然后拉账单费用明细,让 claude 出优化方案,你来拍板执行爽的很
|
27
jonathan001 OP @wowawesome 肯定呀
|
28
jonathan001 OP @hiyongliz 开发不干的杂活都是运维干。
|
29
fredz Jun 29
5000+pods 混合云的唯一运维我都被裁了 所以优化太好人家说你工作量不饱和,话说我的工作要交接给 5 个人
|
30
robinxplorer Jun 29
现在的趋势是运维的活直接让开发来干了
|
31
fish2050 Jun 29
内存少就别搞微服务了
|
32
brom111 Jun 29
4c8g 还跑什么 k8s 呢。 降成本也不能从主机开始吧。。
|
33
Nexora Jun 29
合并节点,把两台 4C8G 改成一台 8C16G, JVM OOM 需要排查一些代码和结构是否合理。
|
34
jonathan001 OP @Nexora 排查个鸟,浪费时间,这点工资都懒得动
|
35
jonathan001 OP @fredz 出问题要运维干嘛,不出问题要运维干嘛?
|
36
cccssss Jun 29
建议换 golang 和 rust
|
37
jonathan001 OP @cccssss 我最近几天也在研究,用 rust 确实比较省内存,但是管我运维什么事情呀。
|
38
liubai256 Jun 29
我上家也是程序动不动被操作系统干掉了重启,要么就直接夯住了看着容器还在实际上死了有一会儿了,端口在监听但是完全不提供服务,每次出问题老大都是让重启,小半年了也没解决反而监控和应用健康检查越来越全了,为了挂的第一时间重启。。。
|
39
jonathan001 OP @liubai256 得多菜
|
40
w741069229 Jun 29
现在各个企业是不是卷与否最终都会是上一天班,可能第二天就被干了?我司目前有点这个倾向了
|
41
jonathan001 OP @w741069229 假如公司不能以人为本,更别想着公司做大了给你分一杯羹。
|
42
NealCCC Jun 29
不会是 vm 没设置好吧
|
43
smileawei Jun 29
java 不是配置 jvm 嘛。该多少内存不是从压测来的嘛。
|
44
yulgang Jun 29
|
45
jonathan001 OP @smileawei 别闹了,哪有压力测试
|
46
liubai256 Jun 29
@jonathan001 #39 也是因为机器降配置了,领导觉得这个应用 4c8g 就行了,但是实际跑着天天都是日常内存七八十,告警都改到 90 了,有的应用还是会满
|
47
jonathan001 OP @liubai256 都是草台班子。
|
48
zhoulouzi Jun 29
你们这公司考什么赚钱?
|
49
garyalen Jun 29
再后面就是下云 用台式机 边缘加速映射网站出去了
时不时问怎么这个月账单多了 10 块钱 |
50
jonathan001 OP @garyalen 那 10 块钱是电费吧
|
51
jaoyina Jun 29
让 AI 帮你运维
|
52
lesismal Jun 29
虽然。。。但是 java 确实。。。
|
53
beyond98 Jun 30 via iPhone
降本还能增效?
|
54
jonathan001 OP @jaoyina 真当 AI 是万能的了?
|
55
jonathan001 OP @lesismal 换成 rust 应该可以挽救下,毕竟内存占用极低。
|
56
sampeng Jun 30
4c8g 跑 java 的基本都是草台班子。。。
|
57
Daybyedream Jun 30
查问题啊。。。。给开发去
|
58
jonathan001 OP @Daybyedream 开发不要,试问阁下该如何应对。
|
59
jonathan001 OP @sampeng 可不是,我已经准备离职了。
|
60
garyalen Jun 30
@jonathan001 #50 谁知道呢 但是得让你出分析 改进报告
|
61
jonathan001 OP @garyalen 分析个猫。
|
62
jaoyina 21h 55m ago
@jonathan001
你这么说感觉你就是那种生活中比较抵制 AI 的人,我公司就有个运维,我让他把 AI 用起来到现在都没看到他动,而实际上我这个开发已经用 AI 解决了不少运维也很难排查的问题,还查出不少他们脚本里的 Bug 。 |
64
jonathan001 OP @sampeng 不至于,现在运维比研发复杂多了。
|
65
jinlong 4h 39m ago
我们是 2H2G+Docker ,挺稳定的,不过是 Python+PHP
|