Здравствуйте, я пытаюсь выяснить, почему моя 10G-сетевая карта постоянно "падает". Через какое-то время журнал заполняется следующими сообщениями: Код: Sep 11 16:41:25 pve05 kernel: bnx2x 0000:10:00.0 enp16s0f0: истекло время доступа MDC/MDIO Sep 11 16:41:25 pve05 kernel: bnx2x 0000:10:00.0 enp16s0f0: истекло время доступа MDC/MDIO Sep 11 16:41:26 pve05 kernel: bnx2x: [bnx2x_acquire_hw_lock:2023(enp16s0f0)]lock_status 0xffffffff resource_bit 0x1 Sep 11 16:41:26 pve05 kernel: bnx2x 0000:10:00.0 enp16s0f0: истекло время доступа MDC/MDIO Sep 11 16:41:26 pve05 kernel: bnx2x 0000:10:00.0 enp16s0f0: истекло время доступа MDC/MDIO Sep 11 16:41:27 pve05 kernel: bnx2x: [bnx2x_acquire_hw_lock:2023(enp16s0f0)]lock_status 0xffffffff resource_bit 0x1 Sep 11 16:41:27 pve05 kernel: bnx2x 0000:10:00.0 enp16s0f0: истекло время доступа MDC/MDIO Sep 11 16:41:27 pve05 kernel: bnx2x 0000:10:00.0 enp16s0f0: истекло время доступа MDC/MDIO Sep 11 16:41:27 pve05 kernel: bnx2x: [bnx2x_state_wait:312(enp16s0f0)]исключение ожидания состояния 2 Sep 11 16:41:27 pve05 kernel: bnx2x: [bnx2x_func_stop:9129(enp16s0f0)]FUNC_STOP ramrod не удался. Выполнение транзакции без изменений Sep 11 16:41:27 pve05 kernel: bnx2x: [bnx2x_igu_int_disable:902(enp16s0f0)]ОШИБКА! Правильное значение не прочитано из IGU! Sep 11 16:41:27 pve05 kernel: bnx2x: [bnx2x_func_hw_reset:6126(enp16s0f0)]Неизвестная фаза сброса (0x0) от MCP Sep 11 16:41:37 pve05 kernel: bnx2x: [bnx2x_fw_command:3055(enp16s0f0)]FW не ответил! Sep 11 16:41:37 pve05 kernel: bnx2x 0000:10:00.0 enp16s0f0: bc 7.13.75 Sep 11 16:41:37 pve05 kernel: [63B blob data] Sep 11 16:41:37 pve05 kernel: bnx2x: [bnx2x_fw_dump_lvl:816(enp16s0f0)]Подпись буфера трассировки отсутствует. Sep 11 16:41:37 pve05 kernel: bnx2x: [bnx2x_acquire_hw_lock:2023(enp16s0f0)]lock_status 0xffffffff resource_bit 0x800 Sep 11 16:41:37 pve05 kernel: bnx2x: [bnx2x_acquire_hw_lock:2023(enp16s0f0)]lock_status 0xffffffff resource_bit 0x800 Sep 11 16:41:37 pve05 kernel: bnx2x: [bnx2x_acquire_hw_lock:2023(enp16s0f0)]lock_status 0xffffffff resource_bit 0x800 Sep 11 16:41:37 pve05 kernel: bnx2x: [bnx2x_acquire_hw_lock:2023(enp16s0f0)]lock_status 0xffffffff resource_bit 0x800 Sep 11 16:41:47 pve05 kernel: bnx2x: [bnx2x_fw_command:3055(enp16s0f0)]FW не ответил! Sep 11 16:41:47 pve05 kernel: bnx2x 0000:10:00.0 enp16s0f0: bc 7.13.75 Sep 11 16:41:47 pve05 kernel: [63B blob data] Sep 11 16:41:47 pve05 kernel: bnx2x: [bnx2x_fw_dump_lvl:816(enp16s0f0)]Подпись буфера трассировки отсутствует. Sep 11 16:41:47 pve05 kernel: bnx2x: [bnx2x_nic_load_request:2343(enp16s0f0)]Неудача ответа MCP, прерывание Sep 11 16:41:47 pve05 kernel: bnx2x: [bnx2x_acquire_hw_lock:2023(enp16s0f0)]lock_status 0xffffffff resource_bit 0x800 Карта: 57810S-10G-2S-X8 PVE: pve-manager/7.2-7/d0dd0e85 (работает на ядре: 5.15.53-1-pve) Плата: ASRockRack X570D4U ЦП: AMD Ryzen 7 PRO 5750G с графикой Radeon ОЗУ: 128 ГБ ECC После этого контейнер, использующий сетевую карту, становится недоступен. Перезагрузка сервера PVE пока мне помогала. Есть у кого-то идеи, что делать? Спасибо, Ульф.
10GbE контроллер Broadcom 57810S bnx2x таймаут доступа MDC/MDIO, Proxmox Виртуальная Среда
|
11.09.2022 17:01:00
|
|
|
|
|
|
11.11.2022 23:32:00
Ты это исправил? Та же проблема.
|
|
|
|
|
|
12.11.2022 14:59:00
Я исправил проблему с заменой карт 10GbE и 1GbE на чипы Intel. Теперь всё работает без ошибок.
|
|
|
|
|
|
14.11.2022 07:51:00
Нет, я не могу. Заменить карточки было для меня быстрее. Я мог вернуть их в магазин. У меня есть старый сервер, там я могу это протестировать. Но не в ближашие недели.
|
|
|
|
|
|
14.11.2022 18:46:00
Ты пробовал другие материнские платы? Думаю, проблема только в ASRock X570D4U, так как другая моя серверная плата H12DSi-N6 работает нормально.
|
||||
|
|
|
|||
Читают тему
