Всем привет. У меня возникла проблема с двумя нашими узлами, которые используют один и тот же Host Bus Adapter (HBA). Недавно они начали постоянно выдавать сообщения об ошибках, из-за которых засоряется журнал. Вот примеры повторяющихся сообщений об ошибках:
```
Apr 04 02:28:05 pve kernel: mpt3sas_cm0: log_info(0x300301e1): originator(IOP), code(0x03), sub_code(0x01e1) ... (Повторяющиеся ошибки) ...
Apr 04 02:28:25 pve kernel: mpt3sas_cm0: log_info(0x300301e1): originator(IOP), code(0x03), sub_code(0x01e1)
```
Эти ошибки возникают периодически, часто через минуты или меньше друг от друга. В попытке решить эту проблему я обновил драйверы для карт LSI/Broadcom 9400-8, что обновило mpt3sas до версии 49. Тем не менее, ошибки сохраняются. Несмотря на минимальную активность на этих системах, мои исследования позволяют предположить, что это могут быть ошибки таймаута...? Хотя это и звучит странно.
Учитывая, что эта проблема возникла одновременно на обоих узлах в течение последних нескольких недель, я изначально сомневался в аппаратной неисправности. Оба узла работают с последней доступной прошивкой для этих карт HBA, которая, несмотря на то, что несколько устарела, все еще должна поддерживаться, поскольку эти карты в настоящее время находятся в продаже. Учитывая, что эти узлы работали без подобных проблем более года, я начинаю подозревать проблему, связанную с ядром. Я также обновил BIOS серверов на обеих машинах после недавнего релиза, но этот шаг тоже не решил проблему.
На данном этапе ошибки, кажется, не вызывают функциональных проблем, но я обеспокоен тем, что они могут указывать на более серьезную проблему. Я немного в тупике и был бы очень признателен за любые советы или предложения от сообщества. Спасибо заранее за вашу помощь!
С уважением,
Keith
```
Apr 04 02:28:05 pve kernel: mpt3sas_cm0: log_info(0x300301e1): originator(IOP), code(0x03), sub_code(0x01e1) ... (Повторяющиеся ошибки) ...
Apr 04 02:28:25 pve kernel: mpt3sas_cm0: log_info(0x300301e1): originator(IOP), code(0x03), sub_code(0x01e1)
```
Эти ошибки возникают периодически, часто через минуты или меньше друг от друга. В попытке решить эту проблему я обновил драйверы для карт LSI/Broadcom 9400-8, что обновило mpt3sas до версии 49. Тем не менее, ошибки сохраняются. Несмотря на минимальную активность на этих системах, мои исследования позволяют предположить, что это могут быть ошибки таймаута...? Хотя это и звучит странно.
Учитывая, что эта проблема возникла одновременно на обоих узлах в течение последних нескольких недель, я изначально сомневался в аппаратной неисправности. Оба узла работают с последней доступной прошивкой для этих карт HBA, которая, несмотря на то, что несколько устарела, все еще должна поддерживаться, поскольку эти карты в настоящее время находятся в продаже. Учитывая, что эти узлы работали без подобных проблем более года, я начинаю подозревать проблему, связанную с ядром. Я также обновил BIOS серверов на обеих машинах после недавнего релиза, но этот шаг тоже не решил проблему.
На данном этапе ошибки, кажется, не вызывают функциональных проблем, но я обеспокоен тем, что они могут указывать на более серьезную проблему. Я немного в тупике и был бы очень признателен за любые советы или предложения от сообщества. Спасибо заранее за вашу помощь!
С уважением,
Keith
