Привет всем! У меня возникла очень странная проблема, и я не могу найти причину. 1 апреля я перенес свой старый кластер (Proxmox 7) на новое оборудование (два DELL R250, один T430, все с 32 ГБ ОЗУ) с Proxmox 8, все отлично, все мои ВМ работают плавно. У двух R250 ОС на SSD, и ZFS для хранения, один узел с двумя SSD в RAID O, другой с двумя HDD в RAID 0, некоторые ВМ реплицируются (без HA) между этими узлами. У T430 ОС на SSD и хранилище на аппаратном RAID5. В воскресенье 14 апреля у меня начались проблемы с одной ВМ (Zimbra) на R250, она внезапно начала использовать 200% гостевого CPU (процесс Java пожирает весь CPU) и стала очень медленной. Я подозреваю ошибку в Zimbra, но после долгих поисков ничего не нашел. Чтобы провести тест, предложенный на форуме Zimbra в отношении ZFS, я наконец-то сделал резервную копию этой ВМ для переноса на другой узел без ZFS. Первое странное: резервная копия очень медленная, заняла 3 часа на завершение, предыдущая резервная копия (за день до этого) заняла менее 15 минут. После восстановления на T430 все проблемы Zimbra исчезли! Потом я проверил свои узлы, и обнаружил, что с воскресенья 17 часов все ВМ на двух узлах с ZFS имеют растущее использование CPU (но недостаточно, чтобы вызвать проблемы, в отличие от сервера Zimbra). См. прикрепленные скриншоты. Например, ВМ, которая ранее использовала 5% CPU, теперь использует 15%.
Код: root@pve1-r250:~# zpool status
pool: zfs
state: ONLINE
scan: scrub repaired 0B in 00:47:10 with 0 errors on Sun Apr 14 01:11:11 2024
config:
NAME STATE READ WRITE CKSUM
zfs ONLINE 0 0 0
sdb ONLINE 0 0 0
sdc ONLINE 0 0 0
errors: No known data errors - то же самое на втором узле. И нет ошибок репликации, но я впервые использую ZFS, поэтому я немного не в своей тарелке.
Помогите?
Код: root@pve2-r250:~# pveversion
pve-manager/8.1.4/ec5affc9e41f1d79 (running kernel: 6.5.13-1-pve)
Код: root@pve1-r250:~# zpool status
pool: zfs
state: ONLINE
scan: scrub repaired 0B in 00:47:10 with 0 errors on Sun Apr 14 01:11:11 2024
config:
NAME STATE READ WRITE CKSUM
zfs ONLINE 0 0 0
sdb ONLINE 0 0 0
sdc ONLINE 0 0 0
errors: No known data errors - то же самое на втором узле. И нет ошибок репликации, но я впервые использую ZFS, поэтому я немного не в своей тарелке.
Помогите?
Код: root@pve2-r250:~# pveversion
pve-manager/8.1.4/ec5affc9e41f1d79 (running kernel: 6.5.13-1-pve)
