Информация
Услуги
  • Внедрение
  • Настройка
  • Поддержка
  • Ремонт
Контакты
Оплата
Новости
Доставка
Загрузки
Форум
Настройка
    info@proxmox.su
    +7 (495) 320-70-49
    Заказать звонок
    Аспро: ЛайтШоп
    Войти
    0 Сравнение
    0 Избранное
    0 Корзина
    Аспро: ЛайтШоп
    Войти
    0 Сравнение
    0 Избранное
    0 Корзина
    Аспро: ЛайтШоп
    Телефоны
    +7 (495) 320-70-49
    Заказать звонок
    0
    0
    0
    Аспро: ЛайтШоп
    • +7 (495) 320-70-49
      • Назад
      • Телефоны
      • +7 (495) 320-70-49
      • Заказать звонок
    • info@proxmox.su
    • Москва, Бакунинская улица, 69с1
    • Пн-Пт: 09-00 до 18-00
      Сб-Вс: выходной
    • 0 Сравнение
    • 0 Избранное
    • 0 Корзина
    Главная
    Форум
    Proxmox Виртуальная Среда
    Настройка NVidia vGPU довела меня до бешенства.

    Форумы: Proxmox Виртуальная Среда, Proxmox Backup Server, Proxmox Mail Gateway, Proxmox Datacenter Manager
    Поиск  Пользователи  Правила  Войти
    Страницы: 1
    RSS
    Настройка NVidia vGPU довела меня до бешенства., Proxmox Виртуальная Среда
     
    proxwolfe
    Guest
    #1
    0
    28.01.2024 22:59:00
    Я пытаюсь настроить Nvidia vGPU для AI-задач и следую этой инструкции: https://pve.proxmox.com/wiki/NVIDIA_vGPU_on_Proxmox_VE_7.x# Моя карта — RTX A5000. Я получил драйвер Nvidia Grid Host (535.129) и установил его на хост PVE. Я активировал SR-IOV и теперь у меня есть несколько виртуальных устройств, которые я могу передать в VM. Я создал VM на Debian 12 и установил драйвер Nvidia Grid Guest (535.129) в VM. nvidia-smi показывает мне виртуальную карту (с Cuda 12.2). Мои проблемы начались, когда я попытался настроить Cuda. Я скачал официальный пакет Cuda (12.2; потому что где-то написано, что 12.3 не совместим) с Nvidia. Он хочет установить "драйвер" в дополнение к Cuda Toolkit. Если я позволю ему установить драйвер (535.54), он деинсталлирует мой vGPU guest driver и затем говорит, что сам не совместим с найденной картой. Так что я подумал, ну, это, должно быть, нормальный драйвер, который я могу обойтись без (потому что у меня уже есть grid guest driver). Но если я не позволю ему установить, он жалуется, что "драйвер Cuda" не был установлен. Так что, видимо, это все-таки драйвер Cuda. Но почему он деинсталлирует мой grid guest driver тогда??? Если я устанавливаю официальные Debian non-free Nvidia драйверы, nvidia-smi больше не может связаться с драйвером. Что, впрочем, не удивительно. Но использование этого драйвера стало последней каплей. Может кто-нибудь подсказать, ПОЖАЛУЙСТА!!!, как настроить Cuda в VM с vGPU? Я вот-вот сплюну на всё это дело… Спасибо!
     
     
     
    leesteken
    Guest
    #2
    0
    28.01.2024 23:25:00
    Только NVidia знает свои драйвера, прошивку и аппаратное обеспечение. Ядро Linux с открытым исходным кодом не скрывает секретов, но люди вне NVidia просто будут гадать. Вы спрашивали службу поддержки NVidia?

    P.S. Прошу прощения за бесполезность. Может, кто-нибудь здесь сталкивался с такой проблемой и нашел решение.
     
     
     
    dcsapak
    Guest
    #3
    0
    29.01.2024 10:30:00
    Пожалуйста, проверь документацию Nvidia, например, для драйвера GRID v16 здесь: https://docs.nvidia.com/grid/16.0/grid-vgpu-user-guide/index.html#cuda-open-cl-support-vgpu
     
     
     
    proxwolfe
    Guest
    #4
    0
    29.01.2024 17:02:00
    Да, эта штука остаётся для меня загадкой. Я потратил на неё больше времени, чем на что-либо другое в своей домашней лаборатории. В NVIDIA support я обращусь следующим. Но я решил попробовать здесь сначала, учитывая, что ребята из Proxmox экспериментировали с vGPU (хоть и не обязательно Cuda) с картой того же типа, что и у меня, что я уже зарегистрирован здесь, и что это форум с самыми компетентными людьми, которых я знаю. Надеюсь на это.
     
     
     
    proxwolfe
    Guest
    #5
    0
    17.04.2024 20:06:00
    Ну вот, наконец-то удалось заставить это работать после (долгих) мучений. Но вчера опять перестало работать. Я не знаю почему, но мой лучший вариант — в том, что когда я устанавливал драйвера Grid (и на хосте, и в ВМ), мне пришлось также установить соответствующие заголовки ядра и утилиты make. Так что, хотя я и не до конца понимаю механизм, мне кажется, что драйверу нужна была адаптация под мое ядро. Это работало какое-то время. Но потом я обновил и PVE, и ОС ВМ. После перезагрузки ВМ я заметил, что NVidia-SMI жалуется, что драйвер не загружен. (В тот момент я совершенно не представлял, в чем может быть причина.) Затем я перезагрузил хост, и то же самое произошло и там. Так что, может быть, дело в том, что драйвера больше не работают, потому что ядра (хоста и ВМ) изменились? Если да, то я бы ожидал, что процесс обновления об этом позаботится и спровоцирует перестройку драйверов для новых ядер. Но, возможно, мои ожидания наивны? Если так, то как я могу вручную запустить перестройку драйверов для новых ядер сейчас? И возможно ли, чтобы это происходило автоматически в будущем? Или я бьюсь головой о стену и причина во всем этом другая? Спасибо!
     
     
     
    BobhWasatch
    Guest
    #6
    0
    17.04.2024 23:05:00
    Да, очень даже. Разработчики ядра Linux не особо заботятся о сохранении стабильных внутренних интерфейсов для проприетарных драйверов (в отличие от обычных программ, где они очень стараются поддерживать совместимость). Они предпочитают, чтобы производители работали с ними над включением драйверов в пакет ядра, где сообщество сможет поддерживать их в актуальном состоянии после того, как производителям это надоест. Только если проприетарные драйверы упакованы с DKMS и только если они остаются совместимы с новым ядром и вы обновили заголовки ядра соответствующим образом. В противном случае это ручной процесс. Сроки: NVIDIA хорошо известна в сообществе с открытым исходным кодом как один из худших производителей, с которыми приходится работать. Ну, может быть, Broadcom хуже, но это очень близко.
     
     
     
    Accordéoniste
    Guest
    #7
    0
    28.03.2025 07:57:00
    Обновление спустя год, надеюсь не поздно, лол. Недавно я приобрел Tesla P4, и установил 535.230.02 (версия 16.9) как на хост, так и на гостевой Debian 12.10. С CUDA 12.4 Update 1 можно устанавливать CUDA и драйвер отдельно. Думаю, это решает твою проблему. Тебе просто нужно сначала установить grid driver, затем установить cuda-toolkit-12-4, и все готово. Я протестировал свою установку на этом примере. Все прошло отлично. Если тебе нужны драйверы, ты можешь найти их здесь . У них загружены все версии.
     
     
     
    Страницы: 1
    Читают тему
    +7 (495) 320-70-49
    info@proxmox.su

    Конфиденциальность Оферта
    © 2026 Proxmox.su
    Главная Каталог 0 Корзина 0 Избранные Кабинет 0 Сравнение Акции Контакты Услуги Бренды Отзывы Компания Лицензии Документы Реквизиты Поиск Блог Обзоры