Я пытаюсь настроить Nvidia vGPU для AI-задач и следую этой инструкции: Моя карта — RTX A5000. Я получил драйвер Nvidia Grid Host (535.129) и установил его на хост PVE. Я активировал SR-IOV и теперь у меня есть несколько виртуальных устройств, которые я могу передать в VM. Я создал VM на Debian 12 и установил драйвер Nvidia Grid Guest (535.129) в VM. nvidia-smi показывает мне виртуальную карту (с Cuda 12.2). Мои проблемы начались, когда я попытался настроить Cuda. Я скачал официальный пакет Cuda (12.2; потому что где-то написано, что 12.3 не совместим) с Nvidia. Он хочет установить "драйвер" в дополнение к Cuda Toolkit. Если я позволю ему установить драйвер (535.54), он деинсталлирует мой vGPU guest driver и затем говорит, что сам не совместим с найденной картой. Так что я подумал, ну, это, должно быть, нормальный драйвер, который я могу обойтись без (потому что у меня уже есть grid guest driver). Но если я не позволю ему установить, он жалуется, что "драйвер Cuda" не был установлен. Так что, видимо, это все-таки драйвер Cuda. Но почему он деинсталлирует мой grid guest driver тогда??? Если я устанавливаю официальные Debian non-free Nvidia драйверы, nvidia-smi больше не может связаться с драйвером. Что, впрочем, не удивительно. Но использование этого драйвера стало последней каплей. Может кто-нибудь подсказать, ПОЖАЛУЙСТА!!!, как настроить Cuda в VM с vGPU? Я вот-вот сплюну на всё это дело… Спасибо!
Настройка NVidia vGPU довела меня до бешенства., Proxmox Виртуальная Среда
|
28.01.2024 22:59:00
|
|
|
|
|
|
29.01.2024 10:30:00
Пожалуйста, проверь документацию Nvidia, например, для драйвера GRID v16 здесь:
|
|
|
|
|
Читают тему
