Это, наверное, долгий путь, но я решил выложить это, чтобы узнать, сталкиваются ли другие с подобными проблемами. У меня есть кластер из 6 узлов, он работает уже около 6 месяцев без проблем на Proxmox VE 8. На всех узлах используются AMD EPYC 7713, 512 ГБ / 1 ТБ ОЗУ и материнские платы Gigabyte MZ32-AR0. Примерно 2 недели назад я выполнил `apt upgrade` на всех узлах и перезагрузил их, чтобы загрузить обновленное ядро. Я часто обновляю узлы через `apt`, но это был первый раз за долгое время, когда я перезагрузил их, поэтому было загружено новое ядро (6.5.13-3). С тех пор, как я обновил их, я столкнулся с той же проблемой на 5 из 6 моих узлов. Проблема очень странная и случайная, но по сути узел просто полностью "зависает" до тех пор, пока IPMI watchdog не перезагрузит его из-за таймаута (или я его принудительно перезагружаю). `dmesg` не показывает никаких логов в любое время до перезагрузки, и я не могу найти никаких других логов нигде. Кажется, это не связано с нагрузкой вообще – это происходило на узлах с использованием 10% ЦП / ОЗУ и на тех, что почти полностью загружены. В любом случае, я уверен, что это какая-то более глубокая аппаратная ошибка, но просто интересно, сталкивался ли кто-нибудь еще с проблемами с этой конкретной версией ядра. До загрузки этого ядра я ничего подобного не испытывал. Я обновил их до 6.5.13-5 сегодня, но думаю обновить до ветки 6.8.
Заметил кто-нибудь проблемы со стабильностью на ядре 6.5.13-3?, Proxmox Виртуальная Среда
|
09.04.2024 17:54:00
|
|
|
|
|
|
01.05.2024 06:45:00
6.5.13-5 проблему не решил. И у меня ещё зависания с 6.8.4-2.
|
|
|
|
|
|
01.05.2024 15:55:00
Использую VirtIO SCSI single с iothread=1 на всех VM (Windows, FreeBSD и Linux).
Баг влияет на хост или только на VM? У меня проблема в том, что весь хост вылетает / не отвечает. |
|
|
|
|
|
01.05.2024 16:23:00
Возможно даже: Можно, вероятно, отключить кэш записи тоже. ==> Скорее всего, стоит отключить кэш записи тоже.
|
|
|
|
|
Читают тему

Баг влияет на хост или только на VM? У меня проблема в том, что весь хост вылетает / не отвечает.