Вот перевод сообщения на русский язык:
Некоторые подробности. Каждые несколько дней (минимум раз в неделю) служба pvestatd аварийно завершает работу. Я по-прежнему могу зайти через GUI Proxmox (и через ssh), но все контейнеры отображаются с "?". Как только я перезапускаю службу pvestatd (что тоже можно сделать из GUI), я снова вижу статус всех CT/VM. Большинство CT/VM работают нормально, но не все. Нет никакой закономерности, иногда VM X все еще работает, но службы на нем остановлены.
Технические подробности:
* Оборудование: Minisforum MS-01
* CPU: 13th Gen Intel® Core i9-13900K
* RAM: 64GB
* Диск: 2 x 2TB NVMe SSD RAID1
* Прошивка: 8.2.0
Операционная система: Debian 12.1
Софт: Proxmox 8.2.0
Журналы:
`cat /var/log/syslog`
`2025-04-22T05:37:40.222420+02:00 c513 kernel: [32210.491667] pvestatd[3825]: segfault at 32 ip 00005e499fa82232 sp 00007fff63bc9b00 error 4 in perl[ff232,5e499f9cc000+195000] likely on CPU 6 (core 12, socket 0)
2025-04-22T05:37:40.226321+02:00 c513 systemd[1]: pvestatd.service: Main process exited, code=killed, status=11/SEGV`
`2025-04-26T06:34:27 c513 kernel: pvestatd[2555394]: segfault at ffffffffffffffff ip 0000653ef51344dc sp 00007ffeae4bab10 error 7 in perl[1344dc,653ef5049000+195000] likely on CPU 6 (core 12, socket 0)`
`2025-04-26T06:34:27 c513 systemd[1]: pvestatd.service: Main process exited, code=killed, status=11/SEGV`
`2025-04-26T06:34:27 c513 systemd[1]: pvestatd.service: Failed with result 'signal'.`
`2025-04-26T06:34:27 c513 systemd[1]: pvestatd.service: Consumed 9h 24min 56.262s CPU time.`
`cat /var/log/syslog`
`2025-04-28T07:06:48 c513 pvestatd[1083338]: starting server`
`2025-04-28T07:06:48 c513 systemd[1]: Started pvestatd.service - PVE Status Daemon.`
`2025-04-26T06:34:27 c513 kernel: pvestatd[2555394]: segfault at ffffffffffffffff ip 0000653ef51344dc sp 00007ffeae4bab10 error 7 in perl[1344dc,653ef5049000+195000] likely on CPU 6 (core 12, socket 0)`
`2025-04-26T06:34:27 c513 kernel: Code: 8b 43 0c e9 6a ff ff ff 66 0f 1f 44 00 00 3c 02 0f 86 a0 00 00 00 0d 00 00 00 10 48 8b 55 10 89 45 0c 48 8b 45 00 48 8b 40 18 <c6> 44 02 ff 00 48 8b 45 00 48 8b 75 10 48 8b 40 18 e9 73 ff ff ff`
`2025-04-26T06:34:27 c513 systemd[1]: pvestatd.service: Main process exited, code=killed, status=11/SEGV`
`2025-04-26T06:34:27 c513 systemd[1]: pvestatd.service: Failed with result 'signal'.`
`2025-04-26T06:34:27 c513 systemd[1]: pvestatd.service: Consumed 9h 24min 56.262s CPU time.`
Журналы `journalctl -u pvestatd`
`2025-04-22 05:37:40 c513 systemd[1]: pvestatd.service: Main process exited, code=killed, status=11/SEGV`
`2025-04-26 06:34:27 c513 systemd[1]: pvestatd.service: Main process exited, code=killed, status=11/SEGV`
`2025-04-28 07:06:48 c513 systemd[1]: Started pvestatd.service - PVE Status Daemon.`
Журналы `journalctl -u pvestatd`
`2025-04-26 05:32:27 c513 pvestatd[2555394]: modified cpu set for lxc/109: 8,18`
`2025-04-26 05:33:07 c513 pvestatd[2555394]: modified cpu set for lxc/100: 15-16`
`2025-04-26 05:54:18 c513 pvestatd[2555394]: auth key pair too old, rotating..`
`2025-04-26 06:24:47 c513 pvestatd[2555394]: Argument "2555394:1658635" isn't numeric in int at /usr/share/perl5/PVE/QMPClient.pm line 273.`
Идеи:
Сначала я думал, что это как-то связано с RAM, так как она была минимально перераспределена, и я использую ZFS, но затем я установил размер ZFS-MAX-ARC равным 6 ГБ и изменил все назначения RAM, поэтому сейчас у меня около 76 ГБ RAM, выделенной только для VM. Также я уже отключил kmstuned. Может ли это быть связано с планированием набора CPU и его комбинацией с архитектурой CPU "маленький-большой"?
Некоторые подробности. Каждые несколько дней (минимум раз в неделю) служба pvestatd аварийно завершает работу. Я по-прежнему могу зайти через GUI Proxmox (и через ssh), но все контейнеры отображаются с "?". Как только я перезапускаю службу pvestatd (что тоже можно сделать из GUI), я снова вижу статус всех CT/VM. Большинство CT/VM работают нормально, но не все. Нет никакой закономерности, иногда VM X все еще работает, но службы на нем остановлены.
Технические подробности:
* Оборудование: Minisforum MS-01
* CPU: 13th Gen Intel® Core i9-13900K
* RAM: 64GB
* Диск: 2 x 2TB NVMe SSD RAID1
* Прошивка: 8.2.0
Операционная система: Debian 12.1
Софт: Proxmox 8.2.0
Журналы:
`cat /var/log/syslog`
`2025-04-22T05:37:40.222420+02:00 c513 kernel: [32210.491667] pvestatd[3825]: segfault at 32 ip 00005e499fa82232 sp 00007fff63bc9b00 error 4 in perl[ff232,5e499f9cc000+195000] likely on CPU 6 (core 12, socket 0)
2025-04-22T05:37:40.226321+02:00 c513 systemd[1]: pvestatd.service: Main process exited, code=killed, status=11/SEGV`
`2025-04-26T06:34:27 c513 kernel: pvestatd[2555394]: segfault at ffffffffffffffff ip 0000653ef51344dc sp 00007ffeae4bab10 error 7 in perl[1344dc,653ef5049000+195000] likely on CPU 6 (core 12, socket 0)`
`2025-04-26T06:34:27 c513 systemd[1]: pvestatd.service: Main process exited, code=killed, status=11/SEGV`
`2025-04-26T06:34:27 c513 systemd[1]: pvestatd.service: Failed with result 'signal'.`
`2025-04-26T06:34:27 c513 systemd[1]: pvestatd.service: Consumed 9h 24min 56.262s CPU time.`
`cat /var/log/syslog`
`2025-04-28T07:06:48 c513 pvestatd[1083338]: starting server`
`2025-04-28T07:06:48 c513 systemd[1]: Started pvestatd.service - PVE Status Daemon.`
`2025-04-26T06:34:27 c513 kernel: pvestatd[2555394]: segfault at ffffffffffffffff ip 0000653ef51344dc sp 00007ffeae4bab10 error 7 in perl[1344dc,653ef5049000+195000] likely on CPU 6 (core 12, socket 0)`
`2025-04-26T06:34:27 c513 kernel: Code: 8b 43 0c e9 6a ff ff ff 66 0f 1f 44 00 00 3c 02 0f 86 a0 00 00 00 0d 00 00 00 10 48 8b 55 10 89 45 0c 48 8b 45 00 48 8b 40 18 <c6> 44 02 ff 00 48 8b 45 00 48 8b 75 10 48 8b 40 18 e9 73 ff ff ff`
`2025-04-26T06:34:27 c513 systemd[1]: pvestatd.service: Main process exited, code=killed, status=11/SEGV`
`2025-04-26T06:34:27 c513 systemd[1]: pvestatd.service: Failed with result 'signal'.`
`2025-04-26T06:34:27 c513 systemd[1]: pvestatd.service: Consumed 9h 24min 56.262s CPU time.`
Журналы `journalctl -u pvestatd`
`2025-04-22 05:37:40 c513 systemd[1]: pvestatd.service: Main process exited, code=killed, status=11/SEGV`
`2025-04-26 06:34:27 c513 systemd[1]: pvestatd.service: Main process exited, code=killed, status=11/SEGV`
`2025-04-28 07:06:48 c513 systemd[1]: Started pvestatd.service - PVE Status Daemon.`
Журналы `journalctl -u pvestatd`
`2025-04-26 05:32:27 c513 pvestatd[2555394]: modified cpu set for lxc/109: 8,18`
`2025-04-26 05:33:07 c513 pvestatd[2555394]: modified cpu set for lxc/100: 15-16`
`2025-04-26 05:54:18 c513 pvestatd[2555394]: auth key pair too old, rotating..`
`2025-04-26 06:24:47 c513 pvestatd[2555394]: Argument "2555394:1658635" isn't numeric in int at /usr/share/perl5/PVE/QMPClient.pm line 273.`
Идеи:
Сначала я думал, что это как-то связано с RAM, так как она была минимально перераспределена, и я использую ZFS, но затем я установил размер ZFS-MAX-ARC равным 6 ГБ и изменил все назначения RAM, поэтому сейчас у меня около 76 ГБ RAM, выделенной только для VM. Также я уже отключил kmstuned. Может ли это быть связано с планированием набора CPU и его комбинацией с архитектурой CPU "маленький-большой"?
