LXC: Похоже, модуль ядра NVIDIA 'nvidia-drm' уже загружен в ядре., Proxmox Виртуальная Среда
TheDarthFather
Guest
0
07.03.2022 10:13:00
Привет! После обновления ядра proxmox, похоже, мои Nvidia драйвера перестали работать в моём LXC с Plex. Я удалил драйвер как с гипервизора, так и из LXC. Установил последнюю версию драйвера (NVIDIA-Linux-x86_64-510.54.run) на гипервизор. Однако, когда я пытаюсь установить тот же драйвер в LXC, получаю эту ошибку: "An NVIDIA kernel module 'nvidia-drm' appears to already be loaded in your kernel". Я пробовал modprobe -r nvidia-drm, но это не помогло. Какие есть подсказки, как это исправить?
P.S. Есть ли способ избежать этого в каждом обновлении ядра?
Спасибо!
sticilface
Guest
0
31.12.2024 08:11:00
Похоже, что что-то изменилось между драйверами nvidia 550 и 560. У меня была рабочая версия 550, я обновил ядро proxmox и по ошибке установил 560. Теперь, когда я пытаюсь установить драйверы только в контейнере LXC, я получаю это сообщение..
Код: root@frigate:/media/frigate# cat /var/log/cuda-installer.log [INFO]: Драйвер не установлен. [INFO]: Проверка версии компилятора... [INFO]: Расположение gcc: /usr/bin/gcc
[INFO]: Версия gcc: gcc version 10.2.1 20210110 (Debian 10.2.1-6)
[INFO]: Инициализация меню [INFO]: nvidia-fs.setKOVersion(2.22.3) [INFO]: Настройка завершена [INFO]: Установка: Драйвер [INFO]: Установка: 560.35.05 [INFO]: Выполнение NVIDIA-Linux-x86_64-560.35.05.run --ui=none --no-questions --accept-license --disable-nouveau --no-cc-version-check --install-libglvnd 2>&1 [INFO]: Завершено с кодом: 256 [ERROR]: Установка компонента драйвера не удалась. Пожалуйста, обратитесь к журналу драйвера по адресу /var/log/nvidia-installer.log для получения более подробной информации. [ERROR]: Установка 560.35.05 не удалась, выход root@frigate:/media/frigate# ls clips cuda_12.6.3_560.35.05_linux.run exports person-bicycle-car-detection.mp4 recordings storage root@frigate:/media/frigate# cat /var/log/nvidia-installer.log Журнал установки nvidia '/var/log/nvidia-installer.log' время создания: Вт Дек 31 06:56:33 2024 версия установщика: 560.35.05
Использование встроенного пользовательского интерфейса потока -> Не удалось найти инструментов для перечисления содержимого initramfs. -> Не удалось просканировать initramfs: инструмент не найден -> Обнаружено 2 онлайн процессора; установка уровня параллелизма на 2. ПРЕДУПРЕЖДЕНИЕ: Ядро NVIDIA «nvidia-uvm» похоже, уже загружено в вашем ядре. Это может быть связано с тем, что оно используется (например, сервером X, программой CUDA или демоном постоянного действия NVIDIA), но это также может произойти, если ваше ядро было настроено без поддержки выгрузки модулей. Некоторые проверки надежности, которые выполняет установщик nvidia, невозможны при работе модуля ядра NVIDIA. -> Хотите продолжить установку и пропустить проверки надежности? Если нет, пожалуйста, прервите установку, затем закройте любые программы, которые могут использовать графические процессоры NVIDIA, и попробуйте установить драйвер еще раз. (Ответ: Прервать установку) ERROR: Установка не удалась. Пожалуйста, обратитесь к файлу '/var/log/nvidia-installer.log' для получения более подробной информации. Вы можете найти предложения по устранению проблем с установкой в файле README, доступном на странице загрузки драйвера Linux по адресу . root@frigate:/media/frigate# Установщик больше не распознает флаг `--no-kernel-module`. Я не могу найти в установщике способа переопределить этот ответ по умолчанию для проверок надежности.. и похоже, что папка установки очищается при сбое установки.. поэтому я не могу запустить команду вручную. Кто-нибудь еще находил обходные пути?
BobhWasatch
Guest
0
31.12.2024 16:36:00
Эм, устанавливать модули изнутри контейнера нельзя. Кстати, причина в том, что контейнеры используют ядро хоста. Разрешить контейнерам модифицировать ядро хоста было бы большой проблемой с точки зрения безопасности. Любые драйверы/модули нужно устанавливать со стороны хоста. Или использовать VM, у которой свое ядро.
sticilface
Guest
0
31.12.2024 19:57:00
Я прекрасно понимаю, что установить модули в контейнер нельзя. С CUDA 550 можно было установить необходимые драйверы, используя опцию '-no-kernal-modules', и это работало. В 560 даже если снять флажок "модули ядра" при установке и выбрать только драйвер, всё равно выдаёт вышеописанную ошибку. Опции командной строки для указания no-kernal-modules больше нет. Я понимаю, что это проблема NVIDIA... но надеюсь, что кто-нибудь найдёт решение для контейнеров proxmox LXC.
sticilface
Guest
0
01.01.2025 11:06:00
Кстати, я переустановил 550 на хосте, и теперь всё работает отлично. Похоже, упаковка NVIDIAs изменилась с версии 550 на 560, и появился дополнительный слой приложения, из-за которого нельзя принудительно установить драйвер.
chicagonyc
Guest
0
18.02.2025 16:09:00
Есть какие-нибудь новости по этому вопросу? Я постоянно устанавливаю драйвера Nvidia на хост и в контейнер, сейчас у меня 550.x, думаю перейти на более поздние версии.