Всем привет. Извините, но это будет немного сумбурно, надеюсь, кто-нибудь подскажет, где посмотреть нужные логи для получения дополнительной информации. Я усвоил урок и теперь не буду пытаться "фиксить" что-то самостоятельно, не обратившись за помощью, чтобы не усугубить ситуацию. К сожалению, я так и не усвоил урок о том, что не стоит обновлять PVE, потому что у меня возникают проблемы каждый раз. Хотел бы, чтобы в графическом интерфейсе была возможность выбирать несколько обновлений за раз или каким-то образом устанавливать не всё сразу, тогда бы я не знал, какое именно обновление стало причиной проблем. Идеально было бы, если бы я сначала обновил все пакеты отдельно, а потом уже обновление, связанное с 8.4, но всё устроено не так, кроме двух групп: upstream/Debian и Proxmox. В общем, это непроизводственная трехузловая кластеризация, без HA или ceph. Она включается и работает нормально, но в течение следующих нескольких часов этот узел снова выйдет из строя в третий раз с момента обновления прошлой ночью. На самом деле, он проработал около 10 минут, пока я это писал. [ 592.660802] igb 0000:04:0: AMD-Vi: Event logged [IO_PAGE_FAULT domain=0x0010 address=0xbe16a0c0 flags=0x0020] [ 592.660802] igb 0000:04:0: AMD-Vi: Event logged [IO_PAGE_FAULT domain=0x0010 address=0xbe16a1c0 flags=0x0020] [ 592.660802] igb 0000:04:0: AMD-Vi: Event logged [IO_PAGE_FAULT domain=0x0010 address=0xbe16a8c0 flags=0x0020] Много строк таких, единственная разница - три разных адреса. Это конкретное устройство на 04: - сетевая карта i211, и оно находится в группе IOMMU 15, как и другие две сетевые карты (PCIe гигабит, PCIex4 10gbe ethernet ACQ107 и встроенная интел). Предполагаю, что вся группа является основным контроллером в процессоре или, возможно, мост севера. Любая помощь или советы приветствуются. Две сетевые карты объединены в bridge и работали безупречно до обновления прошлой ночью, поэтому, возможно, проблема с драйвером? Ни одна из них не использует проброс IOMMU, они все напрямую для этого хоста/узла. И вот, гостевой TrueNAS только что упал, подключение к консоли показывает сбой драйвера GPU. В машине установлена старая GTX750, к которой контейнер Plex имеет не привилегированный доступ, также работала безупречно в течение нескольких недель до обновления. Я отключаю большинство гостей и перезагружаю узел и посмотрю, будет ли он онлайн, когда вернусь с работы. Это может указывать на то, что контейнер сломал ядро или что-то подобное, но я все еще довольно нов в устранении неполадок Linux.
igb AMD-Vi IO_PAGE_FAULT после обновления PVE 8.4, Proxmox Виртуальная Среда
|
15.04.2025 13:15:00
|
|
|
|
|
Читают тему
