Я разбираюсь со случайными перезагрузками серверов, которые вызывают у меня огромную головную боль. Они видны в логах, и предшествующих событий, похоже, нет.
Код: 17 марта 17:06:28 sr66-prox-03 pveproxy[348253]: Очистка устаревших записей из кэша сертификатов
17 марта 17:07:10 sr66-prox-03 snmpd[4026]: systemstats_linux: неожиданная длина заголовка в /proc/net/snmp. 237 != 224
17 марта 17:07:37 sr66-prox-03 pveproxy[340366]: выход воркера
17 марта 17:07:37 sr66-prox-03 pveproxy[4548]: воркер 340366 завершен
17 марта 17:07:37 sr66-prox-03 pveproxy[4548]: запуск 1 воркера(ов)
17 марта 17:07:37 sr66-prox-03 pveproxy[4548]: воркер 348605 запущен
17 марта 17:07:45 sr66-prox-03 pveproxy[348605]: Очистка устаревших записей из кэша сертификатов
17 марта 17:08:10 sr66-prox-03 snmpd[4026]: systemstats_linux: неожиданная длина заголовка в /proc/net/snmp. 237 != 224
17 марта 17:09:09 sr66-prox-03 pmxcfs[4186]: [status] notice: получен лог
17 марта 17:09:10 sr66-prox-03 snmpd[4026]: systemstats_linux: неожиданная длина заголовка в /proc/net/snmp. 237 != 224
17 марта 17:10:10 sr66-prox-03 snmpd[4026]: systemstats_linux: неожиданная длина заголовка в /proc/net/snmp. 237 != 224
17 марта 17:11:10 sr66-prox-03 snmpd[4026]: systemstats_linux: неожиданная длина заголовка в /proc/net/snmp. 237 != 224
17 марта 17:12:10 sr66-prox-03 snmpd[4026]: systemstats_linux: неожиданная длина заголовка в /proc/net/snmp. 237 != 224
-- Перезагрузка --
17 марта 17:16:52 sr66-prox-03 kernel: Версия Linux 6.8.12-8-pve (build@proxmox) (gcc (Debian 12.2.0-14) 12.2.0, GNU ld (GNU Binutils для Debian) 2.40) #1 SMP PREEMPT_DYNAMIC PMX 6.8.12-8 (2025-01-24T12:32Z) ()
17 марта 17:16:52 sr66-prox-03 kernel: Командная строка: BOOT_IMAGE=/boot/vmlinuz-6.8.12-8-pve root=UUID=4fbd2c0b-dcd7-44d9-9139-495d8f107f19 ro quiet
17 марта 17:16:52 sr66-prox-03 kernel: Поддерживаемые процессоры KERNEL:
17 марта 17:16:52 sr66-prox-03 kernel: Intel GenuineIntel
17 марта 17:16:52 sr66-prox-03 kernel: AMD AuthenticAMD
Я сопоставил это с логами оборудования iDRAC, и хотя я вижу сброс бэкплейна, мои исследования показывают, что это НЕ должно быть проблемой и является нормальной операцией, и если что, ОС должна видеть диск в слоте 8 исчезнувшим и вновь появившимся (чего я не наблюдал, и я видел этот лог в моменты, когда сброс НЕ запускался, как в начале этого скриншота):
Итак, возвращаясь к логам PVE, я вижу строку "-- Перезагрузка --", и я думаю, эта строка регистрируется в КОНЦЕ сессии или в НАЧАЛЕ сессии? Это разница между тем, знает ли ОС о перезагрузке или выясняет, что она произошла позже. Лог iDRAC показывает, что сброс ЦП вызван циклом питания, но не указывает источник — спровоцировала ли его ОС или это какой-то хард-сброс.
Код: 17 марта 17:06:28 sr66-prox-03 pveproxy[348253]: Очистка устаревших записей из кэша сертификатов
17 марта 17:07:10 sr66-prox-03 snmpd[4026]: systemstats_linux: неожиданная длина заголовка в /proc/net/snmp. 237 != 224
17 марта 17:07:37 sr66-prox-03 pveproxy[340366]: выход воркера
17 марта 17:07:37 sr66-prox-03 pveproxy[4548]: воркер 340366 завершен
17 марта 17:07:37 sr66-prox-03 pveproxy[4548]: запуск 1 воркера(ов)
17 марта 17:07:37 sr66-prox-03 pveproxy[4548]: воркер 348605 запущен
17 марта 17:07:45 sr66-prox-03 pveproxy[348605]: Очистка устаревших записей из кэша сертификатов
17 марта 17:08:10 sr66-prox-03 snmpd[4026]: systemstats_linux: неожиданная длина заголовка в /proc/net/snmp. 237 != 224
17 марта 17:09:09 sr66-prox-03 pmxcfs[4186]: [status] notice: получен лог
17 марта 17:09:10 sr66-prox-03 snmpd[4026]: systemstats_linux: неожиданная длина заголовка в /proc/net/snmp. 237 != 224
17 марта 17:10:10 sr66-prox-03 snmpd[4026]: systemstats_linux: неожиданная длина заголовка в /proc/net/snmp. 237 != 224
17 марта 17:11:10 sr66-prox-03 snmpd[4026]: systemstats_linux: неожиданная длина заголовка в /proc/net/snmp. 237 != 224
17 марта 17:12:10 sr66-prox-03 snmpd[4026]: systemstats_linux: неожиданная длина заголовка в /proc/net/snmp. 237 != 224
-- Перезагрузка --
17 марта 17:16:52 sr66-prox-03 kernel: Версия Linux 6.8.12-8-pve (build@proxmox) (gcc (Debian 12.2.0-14) 12.2.0, GNU ld (GNU Binutils для Debian) 2.40) #1 SMP PREEMPT_DYNAMIC PMX 6.8.12-8 (2025-01-24T12:32Z) ()
17 марта 17:16:52 sr66-prox-03 kernel: Командная строка: BOOT_IMAGE=/boot/vmlinuz-6.8.12-8-pve root=UUID=4fbd2c0b-dcd7-44d9-9139-495d8f107f19 ro quiet
17 марта 17:16:52 sr66-prox-03 kernel: Поддерживаемые процессоры KERNEL:
17 марта 17:16:52 sr66-prox-03 kernel: Intel GenuineIntel
17 марта 17:16:52 sr66-prox-03 kernel: AMD AuthenticAMD
Я сопоставил это с логами оборудования iDRAC, и хотя я вижу сброс бэкплейна, мои исследования показывают, что это НЕ должно быть проблемой и является нормальной операцией, и если что, ОС должна видеть диск в слоте 8 исчезнувшим и вновь появившимся (чего я не наблюдал, и я видел этот лог в моменты, когда сброс НЕ запускался, как в начале этого скриншота):
Итак, возвращаясь к логам PVE, я вижу строку "-- Перезагрузка --", и я думаю, эта строка регистрируется в КОНЦЕ сессии или в НАЧАЛЕ сессии? Это разница между тем, знает ли ОС о перезагрузке или выясняет, что она произошла позже. Лог iDRAC показывает, что сброс ЦП вызван циклом питания, но не указывает источник — спровоцировала ли его ОС или это какой-то хард-сброс.