<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0">
	<channel>
		<title>Аспро: ЛайтШоп [тема: Виртуальные машины зависают и их невозможно убить при передаче GPU.]</title>
		<link>http://proxmox.su</link>
		<description>Новое в теме Виртуальные машины зависают и их невозможно убить при передаче GPU. форума Proxmox Виртуальная Среда на сайте Аспро: ЛайтШоп [proxmox.su]</description>
		<language>ru</language>
		<docs>http://backend.userland.com/rss2</docs>
		<pubDate>Sat, 13 Jun 2026 06:10:28 +0300</pubDate>
		<item>
			<title>Виртуальные машины зависают и их невозможно убить при передаче GPU.</title>
			<description><![CDATA[<b><a href="http://proxmox.su/forum/messages/forum63/message321612/77307-virtualnye-mashiny-zavisayut-i-ikh-nevozmozhno-ubit-pri-peredache-gpu.">Виртуальные машины зависают и их невозможно убить при передаче GPU.</a></b> <i>Proxmox Виртуальная Среда</i> в форуме <a href="http://proxmox.su/forum/forum63/">Proxmox Виртуальная Среда</a>. <br />
			Для тех, кто столкнулся с подобной проблемой: я в итоге нашел причину; конкретно, это была вот эта строка: Код: [Fri May 9 11:39:14 2025] NVRM: Attempting to remove device 0000:27:00.0 with non-zero usage count! Оказывается, NetData и Beszel оба используют команду nvidia-smi в режиме постоянного мониторинга температуры, что мешало ядру выгрузить устройство. Я удалил драйвера NVIDIA с хоста (я не думаю, что они нужны), но вдруг кому-то пригодится, если столкнется с подобной ситуацией. <br />
			<i>09.05.2025 21:17:00, Redmumba.</i>]]></description>
			<link>http://proxmox.su/forum/messages/forum63/message321612/77307-virtualnye-mashiny-zavisayut-i-ikh-nevozmozhno-ubit-pri-peredache-gpu.</link>
			<guid>http://proxmox.su/forum/messages/forum63/message321612/77307-virtualnye-mashiny-zavisayut-i-ikh-nevozmozhno-ubit-pri-peredache-gpu.</guid>
			<pubDate>Fri, 09 May 2025 21:17:00 +0300</pubDate>
			<category>Proxmox Виртуальная Среда</category>
		</item>
		<item>
			<title>Виртуальные машины зависают и их невозможно убить при передаче GPU.</title>
			<description><![CDATA[<b><a href="http://proxmox.su/forum/messages/forum63/message321611/77307-virtualnye-mashiny-zavisayut-i-ikh-nevozmozhno-ubit-pri-peredache-gpu.">Виртуальные машины зависают и их невозможно убить при передаче GPU.</a></b> <i>Proxmox Виртуальная Среда</i> в форуме <a href="http://proxmox.su/forum/forum63/">Proxmox Виртуальная Среда</a>. <br />
			Сегодня утром я перезагрузил свой сервер (2 LXC, одна VM), и VM не запускается с проброшенной GPU для PCIe. ID этой VM - 104. Я отключил "запуск при загрузке", чтобы хоть как-то получить стабильное состояние. Обновил пакеты (`apt update` / `apt upgrade`), перестроил драйвера nVidia и на хосте, и в самой VM, отключив проброс. Ничего не помогает, и, насколько я знаю, конфигурация не менялась (последняя перезагрузка была около недели назад). Что, черт возьми, происходит?! Я могу видеть карту через `nvidia-smi` на хосте, так что она "работает":<br /><br />```<br />root@proxmox:~# nvidia-smi<br />Fri May &nbsp;9 11:49:13 2025<br />+-----------------------------------------------------------------------------------------+<br />| NVIDIA-SMI 570.144 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;Driver Version: 570.144 &nbsp; &nbsp; &nbsp; &nbsp;CUDA Version: 12.8 &nbsp; &nbsp; |<br />|-----------------------------------------+------------------------+----------------------+<br />| GPU &nbsp;Name &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; Persistence-M | Bus-Id &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;Disp.A | Volatile Uncorr. ECC |<br />| Fan &nbsp;Temp &nbsp; Perf &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;Pwr:Usage/Cap | &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; Memory-Usage | GPU-Util &nbsp;Compute M. |<br />| &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; | &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;| &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; MIG M. |<br />|=========================================+==================<WBR/>&shy;======+======================|<br />| &nbsp; 0 &nbsp;NVIDIA GeForce GTX 1660 ... &nbsp; &nbsp;Off | &nbsp; 00000000:27:00.0 Off | &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;N/A |<br />| &nbsp;0% &nbsp; 44C &nbsp; &nbsp;P8 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; 12W / &nbsp;125W | &nbsp; &nbsp; &nbsp; 0MiB / &nbsp; 6144MiB | &nbsp; &nbsp; &nbsp;0% &nbsp; &nbsp; &nbsp;Default |<br />| &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; | &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;| &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;N/A |<br />+-----------------------------------------+------------------------+----------------------+<br /><br />+-----------------------------------------------------------------------------------------+<br />| Processes: &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;|<br />| &nbsp;GPU &nbsp; GI &nbsp; CI &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;PID &nbsp; Type &nbsp; Process name &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;GPU Memory |<br />| &nbsp; &nbsp; &nbsp; &nbsp;ID &nbsp; ID &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; Usage &nbsp; &nbsp; &nbsp;|<br />|============================================================<WBR/>&shy;=============================|<br />| &nbsp;No running processes found &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; |<br />+-----------------------------------------------------------------------------------------+<br />```<br /><br />Любые команды из командной строки приводят к зависанию, например, если я запускаю `qm start 104`, ее нельзя прервать/заставить спать/и т.д. Попытка убить запущенный процесс тоже не срабатывает:<br /><br />```<br />root@proxmox:~# lsof /var/lock/qemu-server/lock-104.conf<br />COMMAND &nbsp; &nbsp;PID USER &nbsp; FD &nbsp; TYPE DEVICE SIZE/OFF NODE NAME<br />task\x20U 4055 root &nbsp; &nbsp;5wW &nbsp;REG &nbsp; 0,28 &nbsp; &nbsp; &nbsp; &nbsp;0 &nbsp; 77 /run/lock/qemu-server/lock-104.conf<br />root@proxmox:~# ps aux | grep 4055<br />root &nbsp; &nbsp; &nbsp; &nbsp;4055 27.3 &nbsp;0.3 229756 118796 pts/0 &nbsp; R+ &nbsp; 11:39 &nbsp; 3:06 task UPID:proxmox:00000FD7:00001001:681E4BD0:qmstart:104:root@pam:<br />root &nbsp; &nbsp; &nbsp; &nbsp;7950 &nbsp;0.0 &nbsp;0.0 &nbsp; 6336 &nbsp;2048 pts/1 &nbsp; &nbsp;S+ &nbsp; 11:50 &nbsp; 0:00 grep 4055<br />root@proxmox:~# pstree 4055<br />task UPID:proxm<br />root@proxmox:~#<br />```<br /><br />```<br />root@proxmox:~# cat /etc/pve/qemu-server/104.conf<br />[...]<br />agent: enabled=1<br />args: -object memory-backend-memfd,id=mem,size=8192M,share=on<br />bios: ovmf<br />boot: order=scsi0<br />cores: 6<br />cpu: EPYC-IBPB<br />efidisk0: local-lvm:vm-104-disk-0,efitype=4m,size=4M<br />hostpci0: 0000:27:00.0<br />localtime: 1<br />memory: 16384<br />meta: creation-qemu=9.2.0,ctime=1745094291<br />name: docker<br />net0: virtio=02:FF:E6:52:C1:29,bridge=vmbr0<br />numa: 1<br />onboot: 0<br />ostype: l26<br />scsi0: local-lvm:vm-104-disk-1,discard=on,size=200G,ssd=1<br />scsi1: local-lvm:vm-104-disk-2,backup=0,cache=writethrough,size=256G<br />scsihw: virtio-scsi-pci<br />serial0: socket<br />smbios1: uuid=5bbe3e4d-cebe-4269-a2aa-e4fb2a2acb64<br />sockets: 2<br />tablet: 0<br />tags: community-script,debian12,docker<br />usb0: host=8-3<br />vga: none<br />vmgenid: ecf2b3c6-4c7a-4c48-9f15-97da478ac861<br />```<br /><br />Журналы: * `dmesg -T`: [<noindex><a href="https://paste.debian.net/hidden/629d3d58/%5D(&lt;#0" target="_blank" rel="nofollow" >https://paste.debian.net/hidden/629d3d58/](&lt;#0</a></noindex>  >) <br />
			<i>09.05.2025 20:55:00, Redmumba.</i>]]></description>
			<link>http://proxmox.su/forum/messages/forum63/message321611/77307-virtualnye-mashiny-zavisayut-i-ikh-nevozmozhno-ubit-pri-peredache-gpu.</link>
			<guid>http://proxmox.su/forum/messages/forum63/message321611/77307-virtualnye-mashiny-zavisayut-i-ikh-nevozmozhno-ubit-pri-peredache-gpu.</guid>
			<pubDate>Fri, 09 May 2025 20:55:00 +0300</pubDate>
			<category>Proxmox Виртуальная Среда</category>
		</item>
	</channel>
</rss>
