Привет! У меня запущено proxmox-ve: 8.4.0 (ядро 6.8.12-9-pve). Оборудование:
- Asrock N100DC-ITX (последняя версия BIOS v2)
- RAM Patriot Viper Blackout, 3200MHz, 16GB
- SSD ADATA SSD 1TB LEGEND 710
После нескольких дней система начала зависать: сначала раз в 4 дня, последний раз — в течение 12 дней. Становится недоступной по сети. К тому же у меня запущена VM HomeAssistant. Во время сбоев в логах HA я вижу, что сеть не работает, но Zigbee сеть через USB-Zigbee адаптер работала нормально. У меня ещё несколько LXC контейнеров и одна VM (NextCloud). В логах (прилагаю) видно, что всё начинается с pve-firewall, затем ebtables-save и далее CPU soft lookup. Система зависла на 2 часа, а потом сама перезагрузилась. 14:35 — 16:31 После перезагрузки всё снова в порядке. В HA в сети Zigbee я вижу только небольшую задержку вокруг времени перезагрузки в 16:31, значит, VM работала нормально без доступа к сети. Я поменял модель памяти, заменил блок питания, и ещё поставил дополнительный вентилятор, чтобы температура CPU была около 40-50C. Я обновил систему до последней версии и перезагрузил её.
Какие есть рекомендации? Может быть, есть какие-то сторожевые таймеры, которые перезагружают систему быстрее, чтобы не ждать 2 часа?
- Asrock N100DC-ITX (последняя версия BIOS v2)
- RAM Patriot Viper Blackout, 3200MHz, 16GB
- SSD ADATA SSD 1TB LEGEND 710
После нескольких дней система начала зависать: сначала раз в 4 дня, последний раз — в течение 12 дней. Становится недоступной по сети. К тому же у меня запущена VM HomeAssistant. Во время сбоев в логах HA я вижу, что сеть не работает, но Zigbee сеть через USB-Zigbee адаптер работала нормально. У меня ещё несколько LXC контейнеров и одна VM (NextCloud). В логах (прилагаю) видно, что всё начинается с pve-firewall, затем ebtables-save и далее CPU soft lookup. Система зависла на 2 часа, а потом сама перезагрузилась. 14:35 — 16:31 После перезагрузки всё снова в порядке. В HA в сети Zigbee я вижу только небольшую задержку вокруг времени перезагрузки в 16:31, значит, VM работала нормально без доступа к сети. Я поменял модель памяти, заменил блок питания, и ещё поставил дополнительный вентилятор, чтобы температура CPU была около 40-50C. Я обновил систему до последней версии и перезагрузил её.
Какие есть рекомендации? Может быть, есть какие-то сторожевые таймеры, которые перезагружают систему быстрее, чтобы не ждать 2 часа?
