Просто хотел это зафиксировать для справки, возможно, кому-то из вас это тоже поможет. Добавление NVME-дисков в ВМ с помощью опции 'Add PCI Device' может привести к краху Proxmox. Например, у меня возникла эта проблема с диском Samsung 960 Pro, другие диски работали нормально. С помощью ChatGPT мне показалось, что проблема в том, что диск не поддерживает FLR (Function Level Reset). Иногда в логах появлялось "Unable to read tail got zero bytes" при попытке запуска ВМ. Вот шаги, которые помогли мне использовать Samsung 960 Pro с опцией 'Add PCI Device':
VFIO override quirk, чтобы указать VFIO не сбрасывать устройство:
Code: nano /etc/modprobe.d/vfio.conf
# Add
options vfio-pci disable_vga=1 disable_idle_d3=1
Зачеркнуть нормальный драйвер NVMe, чтобы VFIO захватывал устройство раньше:
Code: nano /etc/modprobe.d/blacklist.conf
# Add
blacklist nvme
Связать устройство с VFIO:
Code: lspci -nn | grep -i nvme
# 01:00.0 Non-Volatile memory controller [0108]: Samsung Electronics Co Ltd NVMe SSD Controller SM961/PM961/SM963
# [144d:a804]
nano /etc/modprobe.d/vfio-pci.conf
# Add YOUR OWN VID:PID
options vfio-pci ids=144d:a804
Code: update-initramfs -u
reboot
VFIO override quirk, чтобы указать VFIO не сбрасывать устройство:
Code: nano /etc/modprobe.d/vfio.conf
# Add
options vfio-pci disable_vga=1 disable_idle_d3=1
Зачеркнуть нормальный драйвер NVMe, чтобы VFIO захватывал устройство раньше:
Code: nano /etc/modprobe.d/blacklist.conf
# Add
blacklist nvme
Связать устройство с VFIO:
Code: lspci -nn | grep -i nvme
# 01:00.0 Non-Volatile memory controller [0108]: Samsung Electronics Co Ltd NVMe SSD Controller SM961/PM961/SM963
# [144d:a804]
nano /etc/modprobe.d/vfio-pci.conf
# Add YOUR OWN VID:PID
options vfio-pci ids=144d:a804
Code: update-initramfs -u
reboot

