Информация
Услуги
  • Внедрение
  • Настройка
  • Поддержка
  • Ремонт
Контакты
Оплата
Новости
Доставка
Загрузки
Форум
Настройка
    info@proxmox.su
    +7 (495) 320-70-49
    Заказать звонок
    Аспро: ЛайтШоп
    Войти
    0 Сравнение
    0 Избранное
    0 Корзина
    Аспро: ЛайтШоп
    Войти
    0 Сравнение
    0 Избранное
    0 Корзина
    Аспро: ЛайтШоп
    Телефоны
    +7 (495) 320-70-49
    Заказать звонок
    0
    0
    0
    Аспро: ЛайтШоп
    • +7 (495) 320-70-49
      • Назад
      • Телефоны
      • +7 (495) 320-70-49
      • Заказать звонок
    • info@proxmox.su
    • Москва, Бакунинская улица, 69с1
    • Пн-Пт: 09-00 до 18-00
      Сб-Вс: выходной
    • 0 Сравнение
    • 0 Избранное
    • 0 Корзина
    Главная
    Форум
    Proxmox Виртуальная Среда
    Виртуальные машины зависают и их невозможно убить при передаче GPU.

    Форумы: Proxmox Виртуальная Среда, Proxmox Backup Server, Proxmox Mail Gateway, Proxmox Datacenter Manager
    Поиск  Пользователи  Правила  Войти
    Страницы: 1
    RSS
    Виртуальные машины зависают и их невозможно убить при передаче GPU., Proxmox Виртуальная Среда
     
    Redmumba
    Guest
    #1
    0
    09.05.2025 20:55:00
    Сегодня утром я перезагрузил свой сервер (2 LXC, одна VM), и VM не запускается с проброшенной GPU для PCIe. ID этой VM - 104. Я отключил "запуск при загрузке", чтобы хоть как-то получить стабильное состояние. Обновил пакеты (`apt update` / `apt upgrade`), перестроил драйвера nVidia и на хосте, и в самой VM, отключив проброс. Ничего не помогает, и, насколько я знаю, конфигурация не менялась (последняя перезагрузка была около недели назад). Что, черт возьми, происходит?! Я могу видеть карту через `nvidia-smi` на хосте, так что она "работает":

    ```
    root@proxmox:~# nvidia-smi
    Fri May  9 11:49:13 2025
    +-----------------------------------------------------------------------------------------+
    | NVIDIA-SMI 570.144                Driver Version: 570.144        CUDA Version: 12.8     |
    |-----------------------------------------+------------------------+----------------------+
    | GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
    | Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
    |                                         |                        |               MIG M. |
    |=========================================+==================­======+======================|
    |   0  NVIDIA GeForce GTX 1660 ...    Off |   00000000:27:00.0 Off |                  N/A |
    |  0%   44C    P8             12W /  125W |       0MiB /   6144MiB |      0%      Default |
    |                                         |                        |                  N/A |
    +-----------------------------------------+------------------------+----------------------+

    +-----------------------------------------------------------------------------------------+
    | Processes:                                                                              |
    |  GPU   GI   CI              PID   Type   Process name                        GPU Memory |
    |        ID   ID                                                               Usage      |
    |============================================================­=============================|
    |  No running processes found                                                             |
    +-----------------------------------------------------------------------------------------+
    ```

    Любые команды из командной строки приводят к зависанию, например, если я запускаю `qm start 104`, ее нельзя прервать/заставить спать/и т.д. Попытка убить запущенный процесс тоже не срабатывает:

    ```
    root@proxmox:~# lsof /var/lock/qemu-server/lock-104.conf
    COMMAND    PID USER   FD   TYPE DEVICE SIZE/OFF NODE NAME
    task\x20U 4055 root    5wW  REG   0,28        0   77 /run/lock/qemu-server/lock-104.conf
    root@proxmox:~# ps aux | grep 4055
    root        4055 27.3  0.3 229756 118796 pts/0   R+   11:39   3:06 task UPID:proxmox:00000FD7:00001001:681E4BD0:qmstart:104:root@pam:
    root        7950  0.0  0.0   6336  2048 pts/1    S+   11:50   0:00 grep 4055
    root@proxmox:~# pstree 4055
    task UPID:proxm
    root@proxmox:~#
    ```

    ```
    root@proxmox:~# cat /etc/pve/qemu-server/104.conf
    [...]
    agent: enabled=1
    args: -object memory-backend-memfd,id=mem,size=8192M,share=on
    bios: ovmf
    boot: order=scsi0
    cores: 6
    cpu: EPYC-IBPB
    efidisk0: local-lvm:vm-104-disk-0,efitype=4m,size=4M
    hostpci0: 0000:27:00.0
    localtime: 1
    memory: 16384
    meta: creation-qemu=9.2.0,ctime=1745094291
    name: docker
    net0: virtio=02:FF:E6:52:C1:29,bridge=vmbr0
    numa: 1
    onboot: 0
    ostype: l26
    scsi0: local-lvm:vm-104-disk-1,discard=on,size=200G,ssd=1
    scsi1: local-lvm:vm-104-disk-2,backup=0,cache=writethrough,size=256G
    scsihw: virtio-scsi-pci
    serial0: socket
    smbios1: uuid=5bbe3e4d-cebe-4269-a2aa-e4fb2a2acb64
    sockets: 2
    tablet: 0
    tags: community-script,debian12,docker
    usb0: host=8-3
    vga: none
    vmgenid: ecf2b3c6-4c7a-4c48-9f15-97da478ac861
    ```

    Журналы: * `dmesg -T`: [https://paste.debian.net/hidden/629d3d58/](<#0 >)
     
     
     
    Redmumba
    Guest
    #2
    0
    09.05.2025 21:17:00
    Для тех, кто столкнулся с подобной проблемой: я в итоге нашел причину; конкретно, это была вот эта строка: Код: [Fri May 9 11:39:14 2025] NVRM: Attempting to remove device 0000:27:00.0 with non-zero usage count! Оказывается, NetData и Beszel оба используют команду nvidia-smi в режиме постоянного мониторинга температуры, что мешало ядру выгрузить устройство. Я удалил драйвера NVIDIA с хоста (я не думаю, что они нужны), но вдруг кому-то пригодится, если столкнется с подобной ситуацией.
     
     
     
    Страницы: 1
    Читают тему
    +7 (495) 320-70-49
    info@proxmox.su

    Конфиденциальность Оферта
    © 2026 Proxmox.su
    Главная Каталог 0 Корзина 0 Избранные Кабинет 0 Сравнение Акции Контакты Услуги Бренды Отзывы Компания Лицензии Документы Реквизиты Поиск Блог Обзоры