Что-то меня немного выводит из себя касательно Nvidia Tesla карт и виртуального GPU passthrough, который я использую на моих Proxmox нодах. Одна из серверов показывает типы mdev как для P40 карты (GRID P40), а не для P4. Остальные 4 ноды показывают правильные типы для P4. 'nvidia-smi' на обеих серверах показывает 'Tesla P4'. Я пытался убедиться, что прошивка на картах совпадает с определенным файлом прошивки, используя nvflash. Я также менял местами Tesla P4 карты, и проблема все равно остается на проблемном сервере. Этот сервер был первым, на котором я использовал Tesla P4 карту, и он заработал с виртуальными GPU драйверами и т.д. Я удалил и переустановил драйвер, используя тот же самый файл, что и на остальных 4 серверах. Я даже rsync'нул /usr и /boot с сервера, который видит карту правильно, на сервер с проблемами. Тем не менее, проблема не исчезает. Была ли у кого-нибудь такое? Если да, то как вы это исправили? Я бы не хотел просто зачистить проблемный сервер и переделывать все заново, но, честно говоря, думаю, нужно ли это делать. Я бы не сильно беспокоился об этом, но это путает, какую запись выбрать, потому что у P40 больше памяти, поэтому неправильные комбинации mdev записей приведут к тому, что ничего не будет работать должным образом.
Редактирую: В предыдущем поиске я не нашел, но сейчас читаю эту тему:
Очень странно, что это похоже на 'чистую установку' без каких-либо драйверов Nvidia на системе – когда-то она выдавала правильные записи P4 (т.е. на остальных 4 серверах, на которые я недавно установил P4 карты), только оригинальный сервер, который я использовал для патчинга драйверов (чтобы они работали с ядром 6.8) и для создания пользовательского установщика, продолжает выдавать неправильные данные. Странно.
Редактирую: В предыдущем поиске я не нашел, но сейчас читаю эту тему:
Очень странно, что это похоже на 'чистую установку' без каких-либо драйверов Nvidia на системе – когда-то она выдавала правильные записи P4 (т.е. на остальных 4 серверах, на которые я недавно установил P4 карты), только оригинальный сервер, который я использовал для патчинга драйверов (чтобы они работали с ядром 6.8) и для создания пользовательского установщика, продолжает выдавать неправильные данные. Странно.
