На новом Dell T160 поставил последнюю версию Proxmox (обновился вчера). Вчера также перенёс первую VM (Windows Server 2019) и заметил, что во время некоторых операций, когда нужно активно работать с дисками, система зависала. В двух случаях VM даже вылетала. Причину нашёл в логах хоста — сброс контроллера/дисков. Вот примеры:
kernel: sd 0:0:2:0: [sdb] tag#388 BRCM Debug mfi stat 0x2d, data len requested/completed 0x800/0x0
kernel: sd 0:0:3:0: [sdc] tag#327 BRCM Debug mfi stat 0x2d, data len requested/completed 0x30000/0x0
kernel: sd 0:0:3:0: Power-on or device reset occurred
Аналогичную проблему я уже встречал на других серверах с другим MegaRaid контроллером и ядром 6.8. Решил это добавлением параметров "intel_iommu=on iommu=pt" или использованием ядра 6.5. Сначала попробовал добавить параметры и отключить управление питанием PCIe "pcie_aspm=off" (нашёл в другом месте). Но это не помогло. Также пробовал установить и загрузиться с ядра 6.5 (точнее 6.5.13-6-pve), но проблема осталась, и я не нашёл, что ещё можно попробовать.
Прошивка контроллера уже обновлена, диски вроде бы в порядке, это Samsung SSD 870 EVO 1TB, настроены как JBOD на контроллере и с программным RAID1. У кого-нибудь был подобный опыт и может подсказать, как это исправить или что попробовать?
kernel: sd 0:0:2:0: [sdb] tag#388 BRCM Debug mfi stat 0x2d, data len requested/completed 0x800/0x0
kernel: sd 0:0:3:0: [sdc] tag#327 BRCM Debug mfi stat 0x2d, data len requested/completed 0x30000/0x0
kernel: sd 0:0:3:0: Power-on or device reset occurred
Аналогичную проблему я уже встречал на других серверах с другим MegaRaid контроллером и ядром 6.8. Решил это добавлением параметров "intel_iommu=on iommu=pt" или использованием ядра 6.5. Сначала попробовал добавить параметры и отключить управление питанием PCIe "pcie_aspm=off" (нашёл в другом месте). Но это не помогло. Также пробовал установить и загрузиться с ядра 6.5 (точнее 6.5.13-6-pve), но проблема осталась, и я не нашёл, что ещё можно попробовать.
Прошивка контроллера уже обновлена, диски вроде бы в порядке, это Samsung SSD 870 EVO 1TB, настроены как JBOD на контроллере и с программным RAID1. У кого-нибудь был подобный опыт и может подсказать, как это исправить или что попробовать?
