Дорогое сообщество Proxmox, я относительно новичок в Proxmox и раньше в основном работал с VMware. У меня есть новый сервер со следующими характеристиками: HPE ProLiant DL360 Gen11 SFF 2x Intel Xeon-Gold 5515+ (3.2 ГГц/8 ядер/165 Вт), 8x HPE 32GB Dual Rank DDR5-4800 Registered Memory, 1x HPE MR408i-o Gen11 SPDM Storage Controller, 1x HPE 96W Smart Storage Battery с кабелем 145 мм, 4x HPE 1.92TB SAS 12G Read Intensive SFF (2.5 дюйма) SSD, 1x HPE NS204i-u Gen11 Hot Plug Boot Device, 1x Broadcom BCM5719 1Gb 4-портовый BASE-T адаптер, 1x HPE Ethernet 10Gb 2-портовый BASE-T BCM57416 адаптер.
Proxmox установлен на загрузочном устройстве NS204i. SSD настроены в RAID 5 с помощью контроллера MR408i и LVM-Thin, который служит хранилищем данных. Виртуальные машины мигрировали/импортировались из VMware без проблем. Моя проблема в том, что 1-2 раза в день контроллер RAID будто бы зависает. В это время все виртуальные машины и сам хост перестают отвечать, а через несколько минут работа нормализуется. Прошивки всех устройств и сама установка Proxmox обновлены до последней версии.
Я подозреваю, что это происходит при всплесках I/O операций. Прикрепил скриншот информации Proxmox и график использования CPU во время такого сбоя. Видна пауза на графике — в этот момент хост зависает. Также приложил фрагмент лога с момента сбоя. iLO тоже фиксирует ошибку с таким событием: EVENT (31 июля 2025, 08:00): ControllerPreviousError (Slot=14, 0x7f833119) Redfish event from /redfish/v1/Systems/1/Storage/DE00B000/Controllers/0.
Кроме этих сбоев, всё работает быстро и стабильно. Есть идеи, что может вызывать проблему? Буду благодарен за любые советы, потому что сам обдумал уже всё, что мог. Если нужна дополнительная информация — дайте знать.
P.S. Отказаться от контроллера RAID или настроить его в passthrough для ZFS RAID, к сожалению, пока не вариант.
С уважением, Алекс
Proxmox установлен на загрузочном устройстве NS204i. SSD настроены в RAID 5 с помощью контроллера MR408i и LVM-Thin, который служит хранилищем данных. Виртуальные машины мигрировали/импортировались из VMware без проблем. Моя проблема в том, что 1-2 раза в день контроллер RAID будто бы зависает. В это время все виртуальные машины и сам хост перестают отвечать, а через несколько минут работа нормализуется. Прошивки всех устройств и сама установка Proxmox обновлены до последней версии.
Я подозреваю, что это происходит при всплесках I/O операций. Прикрепил скриншот информации Proxmox и график использования CPU во время такого сбоя. Видна пауза на графике — в этот момент хост зависает. Также приложил фрагмент лога с момента сбоя. iLO тоже фиксирует ошибку с таким событием: EVENT (31 июля 2025, 08:00): ControllerPreviousError (Slot=14, 0x7f833119) Redfish event from /redfish/v1/Systems/1/Storage/DE00B000/Controllers/0.
Кроме этих сбоев, всё работает быстро и стабильно. Есть идеи, что может вызывать проблему? Буду благодарен за любые советы, потому что сам обдумал уже всё, что мог. Если нужна дополнительная информация — дайте знать.
P.S. Отказаться от контроллера RAID или настроить его в passthrough для ZFS RAID, к сожалению, пока не вариант.
С уважением, Алекс
