1
hi2hi 232 天前
试试加一个其它的安全软件?例如火绒
|
2
Eiden 232 天前
pve ui 不能设置繁体吗
|
3
zengxs 232 天前
按你的报错信息搜了一下
看到有个案例是磁盘满了导致这个问题 https://forum.proxmox.com/threads/error-kvm-cpu0-unhandled-wrmsr-unhandled-rdmsr.5046/ |
4
wniming 232 天前
应该跟 pve 无关,我之前也遇到过类似的问题,我当时是启动 windows 虚拟机时分配的核心多会导致物理机重启,猜测是因为 window 虚拟机启动时会执行一些特殊的高功耗的指令,而我又在 bios 里把 cpu 频率固定,导致负载在瞬加增加很多,超过了电源负载瞬态支持的最大值,所以电源断电导致物理机重启。
建议在 bios 里把 cpu 的睿频关闭,用默频试试,先排除电源供电问题。 |
5
jasonyang9 232 天前 via Android
同意楼上的老铁,如果 pve 连写日志的机会都没就重启了看着像是硬件问题
|
6
yyzh 232 天前 1
这里也有讨论 TL;DR:windows 下跑 pve 如果 cpu 模型选 host 会有些奇奇怪怪的问题,选其他的 cpu 模型就行
https://forum.proxmox.com/threads/win11-vm-opening-many-tabs-at-once-crashes-proxmox-host.140670/ |
8
MiKing233 OP @jasonyang9 是的 PVE 連寫 log 的機會都沒有直接就被輸出了--Reboot--, 在這一點基本就可以排除是軟體故障了
|
9
podel 232 天前
最近我也有遇到最新的 pve 会异常重启的问题。
|
10
qW7bo2FbzbC0 232 天前
看了下感觉基本是大陆简体转繁体,不是港澳台那边的口气语法
|
11
MiKing233 OP @wniming 不過我長時間烤機都不會造成重啓應該也可以排除供電的問題了吧, 我的電源是 100w, 跑 PVE 沒有使用核顯, 此時 CPU 滿載整機功耗都不到 70w
|
13
wniming 232 天前
@MiKing233 #11 按我的经验来说不能完全排除,因为我当时固定 cpu 频率就是为了全核心编译大型项目时能更快一些,当时编译程序时所有 cpu 满载并不会导致重启。
即便你烤机用的是 aida64 的单烤 fpu ,我觉得也不能完全排除供电的问题,更何况你用的电源是 100W 的,这个更让人怀疑是电源问题了,现在主流的电源都是 500w 起步了吧,就算是 flex 电源也很少有 100 瓦的了。 |
14
crazyweeds 232 天前
根据楼上的一些回答,建议把 BIOS 恢复默认值再重试。
|
15
wniming 232 天前
@MiKing233 #11 烤机时整机功耗没达到电源额定最大输出不代表电源够用,你可以看一下 yt 上翼王的电源相关的评测,电源还有各种稳定性的问题,很多太专业的我也不好转述,你自己搜搜看吧。
|
16
MiKing233 OP @wniming 7840HS 是 LAPTOP 平臺的處理器, 而且這臺設備是個迷你主機, 100w 的電源對他來説已經完全夠了, 另外根據#6 所講的, 我嘗試將 CPU 類型設定爲 x86-64-v4 后重複操作發現是正常的沒有問題, 這個問題似乎和設定的 CPU 類型有關, 但是我不明白的是他沒有任何日志輸出, 在那篇帖子中也看到有很多人反應這個問題...
|
17
wniming 232 天前 via Android
@MiKing233 #16 “ 我嘗試將 CPU 類型設定爲 x86-64-v4 后重複操作發現是正常的沒有問題”
也有可能是 cpu 选 host 模式时 Windows 虚拟机会执行特殊指令导致瞬间功耗变得非常高 ,选其他的 cpu 模型虚拟机就没有这些特殊指令。 也有可能是虚拟化的问题,是虚拟机逃逸影响到了物理机,但这种可能性极低,我从来没见到过,更何给虚拟机分配的 cpu 比较少时就不会出现问题,如果是选择的 cpu 模型问题就不应跟分配的 cpu 数量有关。 如果想进一步确定原因,可以尝试给物理机 cpu 降频再试试,如果仅仅降频就可以让问题消失,那么基本确定是硬件问题。 |
18
gamexg 232 天前
特定操作挂,第一反应是硬盘有坏道,操作涉及的文件正好在坏道处.
不过硬盘问题一般是特定操作卡顿,直接重启的倒是少见. |
21
MiKing233 OP @gamexg 大概能清楚是哪個方向的問題了, 可以看#6 發的 PVE 論壇那篇帖子, 似乎是 7840HX 芯片組與 Linux 内核或是 qemu 方面的問題, 有很多人提到了 7840HX 在使用虛擬機時導致宿主機重啓并且沒有任何 log 輸出
|
22
liubaicai 232 天前
@qW7bo2FbzbC0 有点有趣
|
23
smartruid 232 天前
我的 4800H 没有出现这个情况。
|
24
tywtyw2002 232 天前
syslog 又没有内核调试信息
开 kernel log ,然后 dmesg 去查。 感觉应该是 kernel panic 了,然后自动重启。 |
25
feirisu 232 天前
有没有可能是 CPU 问题,比如之前 N5105 就出现过虚拟化后随机重启的问题。
|
26
lhsakudsgdsik 232 天前
很可能是 cpu 模型的问题,千万不要用 host 模式,我就碰到过,我两台宿主机一台 amd 的用 host 模式一点问题没有,一台 intel 11400 的创建虚拟机就非常卡,aida64 测试内存速度也慢的离谱,就很奇怪不是说 intel 兼容性最好吗,11400 也不是老的 cpu 啊,后来统一用 kvm 创建 cpu
|
27
flyqie 232 天前 via Android
没遇到过,没记错的话 kernel panic 写不了 syslog 吧。
还有楼主是江苏的为什么会用繁体并且写的用词这么奇怪? 历史帖子里也充满了奇奇怪怪的简繁,港台大陆混用。。 |
28
ltkun 232 天前 via Android
是 amd 不适合虚拟化? op 是小主机吗?小主机一般限制多供电都可能不足
|
29
flynaj 232 天前 via Android
裸机进 PE 用 aida64 压测一下 CPU ,i7 10700 整机待机功耗 40 瓦,aida64 压测 CPU 功耗高达 400 瓦,电源,或者主板不行可能就出问题了
|
30
MiKing233 OP @wniming
@flynaj @ltkun 基本可以排除是電源的問題, 我嘗試設定 CPU 主頻為 1.5GHz, 電源 20v5a100w, 此時透過排插檢查最大功率不超過 20w, 這種情況下不論瞬時功率能有多高電源都應該是能撐住的, 在這種情況下仍然復現了問題, 不過因爲性能變弱這個過程被往後推遲了很多, 在 Windows Defender 掃描了一會才出現而不是一開始掃描瞬間就挂掉 今天宿主機又發生了一次自動重啓, 只是因爲我點擊啓動了一臺 linux 虛擬機, 點下去的一瞬間機器就挂掉了, 但是這種方式并不能穩定復現, 到目前爲止我仍然把這個問題認定爲是 Linux 内核故障, Linux6.5 對 7x4x 的支援不充分所導致, 我在 proxmox 論壇上看到了很多 7840HS 隨機崩潰的問題, 一些回復指出可能需要 6.7+内核才能修復這個問題 @flyqie @tywtyw2002 我使用 dmesg -wH 還是看不到崩潰發生時的内核日志, 問下大佬們對於 kernel panic 這種問題具體是用什麽方式來檢查呢 @feirisu N5105 確實在虛擬化時會出現隨機重啓的問題, 那個更新 CPU microcode 可以修復, 但是對於我這個 CPU 我還沒有看到類似問題的討論 @lhsakudsgdsik 雖然出現了這些問題但還是得繼續改用 host 模型, 因爲我後面又測試了一下 CPU 性能, x86-64-vX 這一類相比於 host 下降了將近一半的性能, 性能損失有點無法接受 以上 |
31
tywtyw2002 229 天前 via iPhone
@MiKing233 google 查。
内核 debug 是通过 sysctl 或者 boot flag 开的,没开自然没有 debug 信息 pve kernel debug 大概是个一周到两周的工作,需要搞 kexec 和 kdump 。 这个帖子没给具体的步骤,但是说了什么是 kernel debug https://forum.proxmox.com/threads/debugging-a-random-server-cold-restart-of-a-pve-node.114579/ |
32
MiKing233 OP @tywtyw2002 看了很多同症狀的, 全都是是 AMD 平臺(7840HS/7940HS/7950X), PVE 自己莫名其妙重啓, 完全沒有 log, 一個能貼出 kernel log 的都沒有, 解決方案全部都是不再使用 host 模型, 我自己一個人接著 Debug 下去大概率也沒結果, 沒精力再繼續折騰了...
最當初買 AMD 的 7840HS 就是看它便宜性能不錯還帶 780M, 沒想到跑 Linux 會這樣... 現在要麽維持現狀等 PVE 更新 kernel6.7+, 不然只能換成 intel 平臺了; 最後感謝參與這個帖子爲我提供幫助的各位大佬們🫡 |