У меня возникла такая проблема несколько лет назад, которая, казалось, разрешилась сама собой, но последние несколько дней у меня возникают проблемы с моим Unraid VM. Моя конфигурация выглядит следующим образом: материнская плата B450 с 32 ГБ ОЗУ, Proxmox работает с 1 ТБ SSD, подключенного напрямую к материнской плате по SATA. Затем у меня есть карта SATA LSI, к которой подключены жесткие диски Unraid для моих VM. Unraid имеет 8 ГБ ОЗУ, BIOS SeaBios Machine Q35, последняя версия, с установленным VIOMMU по умолчанию (None). Также есть передача USB-флешки и передачи карты SATA LSI
.
Проблема в том, что через несколько часов Proxmox останавливается со следующей ошибкой, и единственный способ это решить – перезагрузить сервер, после чего он повторяется примерно через 4 часа. Сначала появлялось следующее
, затем стало таким
, а теперь таким
. Но если я удалю контроллер SAS, то Unraid загрузится без проблем.
Я запустил команду smartctl -a /dev/sda, и, судя по всему, все в порядке.
smartctl 7.3 2022-02-28 r5338 [x86_64-linux-6.8.12-9-pve] (local build)
Copyright © 2002-22, Bruce Allen, Christian Franke,
=== НАЧАЛО РАЗДЕЛА ИНФОРМАЦИИ ===
Модельная семья: Western Digital Blue
Модель устройства: WDC WD10EZEX-08WN4A0
Серийный номер: WD-WCC6Y6VFX4PN
LU WWN Device Id: 5 0014ee 2654b4edf
Версия прошивки: 02.01A02
Емкость пользователя: 1 000 204 886 016 байт [1,00 ТБ]
Размеры секторов: 512 байт логический, 4096 байт физический
Скорость вращения: 7200 об/мин
Форм-фактор: 3,5 дюйма
Устройство: В базе данных smartctl 7.3/5319
Версия ATA: ACS-3 T13/2161-D revision 3b
Версия SATA: SATA 3.1, 6.0 Гб/с (текущая: 6.0 Гб/с)
Местное время: Пт Мая 30 21:09:28 2025 BST
Поддержка SMART: Доступна – устройство имеет возможности SMART.
Поддержка SMART: Включена.
=== НАЧАЛО РАЗДЕЛА ЧТЕНИЯ ДАННЫХ SMART ===
Общее состояние самооценки SMART: УСПЕШНО
Общие значения SMART:
Статус сбора данных в автономном режиме: (0x82)
Автономный сбор данных завершен без ошибок.
Автономный сбор данных: Включено.
Статус выполнения самотеста: (0) Предыдущая рутина самотеста завершена без ошибок или самотест никогда не запускался.
Общее время для завершения автономного сбора данных: (11400) секунд.
Возможности автономного сбора данных: (0x7b)
SMART выполняет автономный немедленно.
Автономный сбор данных включен/выключен.
Приостановить автономный сбор при новом команде.
Поддержка автономного сканирования поверхности.
Поддержка самотеста.
Поддержка самотеста конвейера.
Поддержка выборочного самотеста.
Возможности SMART: (0x0003)
Сохраняет данные SMART перед входом в режим энергосбережения.
Поддержка таймера автоматического сохранения SMART.
Возможность ведения журнала ошибок: (0x01)
Поддержка ведения журнала ошибок.
Поддержка ведения журнала общего назначения.
Рекомендуемое время выполнения короткой рутины самотестирования: (2) минуты.
Рекомендуемое время выполнения расширенной рутины самотестирования: (118) минут.
Рекомендуемое время выполнения рутины самотестирования конвейера: (5) минут.
Возможности SCT: (0x3035)
Поддержка статуса SCT.
Поддержка управления функциями SCT.
Поддержка таблицы данных SCT.
Номер ревизии структуры данных SMART с атрибутами, специфичными для поставщика: 16
Атрибуты SMART с порогами, специфичные для поставщика:
ID# Атрибут_ИМЯ ФЛАГ ЦЕННОСТЬ ХУДШЕ ПОРОГ ТИП ОБНОВЛЕНО КОГДА_ПРОИЗВЕДЕТСЯ НОМЕР_LBA
1 Raw_Read_Error_Rate 0x002f 200 200 051 Предварительная_неисправность Всегда - 0
3 Spin_Up_Time 0x0027 179 172 021 Предварительная_неисправность Всегда - 2033
4 Start_Stop_Count 0x0032 100 100 000 Старый_возраст Всегда - 881
5 Reallocated_Sector_Ct 0x0033 200 200 140 Предварительная_неисправность Всегда - 0
7 Seek_Error_Rate 0x002e 200 200 000 Старый_возраст Всегда - 0
9 Power_On_Hours 0x0032 052 052 000 Старый_возраст Всегда - 35469
10 Spin_Retry_Count 0x0032 100 100 000 Старый_возраст Всегда - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Старый_возраст Всегда - 0
12 Power_Cycle_Count 0x0032 100 100 000 Старый_возраст Всегда - 0
SMART Журнал ошибок версии: 1
Ошибок не зафиксировано
Структура журнала самотестирования SMART ревизии номер 1
SP AN MIN_LBA MAX_LBA ТЕКУЩИЙ_СТАТУС_ТЕСТА
1 0 0 Не_тестируется
2 0 0 Не_тестируется
3 0 0 Не_тестируется
4 0 0 Не_тестируется
5 0 0 Не_тестируется
Флаги выборочного самотеста (0x0): После сканирования выбранных диапазонов не читать-сканировать остаток диска. Если выборочный самотест ожидается при включении, возобновите через 0 минут задержки.
И когда я смотрю в Proxmox, я вижу все свои жесткие диски, подключенные к контроллеру SAS,
, как можно догадаться, я очень сбит с толку. И любая помощь будет очень признательна.
.Проблема в том, что через несколько часов Proxmox останавливается со следующей ошибкой, и единственный способ это решить – перезагрузить сервер, после чего он повторяется примерно через 4 часа. Сначала появлялось следующее
, затем стало таким
, а теперь таким
. Но если я удалю контроллер SAS, то Unraid загрузится без проблем.Я запустил команду smartctl -a /dev/sda, и, судя по всему, все в порядке.
smartctl 7.3 2022-02-28 r5338 [x86_64-linux-6.8.12-9-pve] (local build)
Copyright © 2002-22, Bruce Allen, Christian Franke,
=== НАЧАЛО РАЗДЕЛА ИНФОРМАЦИИ ===
Модельная семья: Western Digital Blue
Модель устройства: WDC WD10EZEX-08WN4A0
Серийный номер: WD-WCC6Y6VFX4PN
LU WWN Device Id: 5 0014ee 2654b4edf
Версия прошивки: 02.01A02
Емкость пользователя: 1 000 204 886 016 байт [1,00 ТБ]
Размеры секторов: 512 байт логический, 4096 байт физический
Скорость вращения: 7200 об/мин
Форм-фактор: 3,5 дюйма
Устройство: В базе данных smartctl 7.3/5319
Версия ATA: ACS-3 T13/2161-D revision 3b
Версия SATA: SATA 3.1, 6.0 Гб/с (текущая: 6.0 Гб/с)
Местное время: Пт Мая 30 21:09:28 2025 BST
Поддержка SMART: Доступна – устройство имеет возможности SMART.
Поддержка SMART: Включена.
=== НАЧАЛО РАЗДЕЛА ЧТЕНИЯ ДАННЫХ SMART ===
Общее состояние самооценки SMART: УСПЕШНО
Общие значения SMART:
Статус сбора данных в автономном режиме: (0x82)
Автономный сбор данных завершен без ошибок.
Автономный сбор данных: Включено.
Статус выполнения самотеста: (0) Предыдущая рутина самотеста завершена без ошибок или самотест никогда не запускался.
Общее время для завершения автономного сбора данных: (11400) секунд.
Возможности автономного сбора данных: (0x7b)
SMART выполняет автономный немедленно.
Автономный сбор данных включен/выключен.
Приостановить автономный сбор при новом команде.
Поддержка автономного сканирования поверхности.
Поддержка самотеста.
Поддержка самотеста конвейера.
Поддержка выборочного самотеста.
Возможности SMART: (0x0003)
Сохраняет данные SMART перед входом в режим энергосбережения.
Поддержка таймера автоматического сохранения SMART.
Возможность ведения журнала ошибок: (0x01)
Поддержка ведения журнала ошибок.
Поддержка ведения журнала общего назначения.
Рекомендуемое время выполнения короткой рутины самотестирования: (2) минуты.
Рекомендуемое время выполнения расширенной рутины самотестирования: (118) минут.
Рекомендуемое время выполнения рутины самотестирования конвейера: (5) минут.
Возможности SCT: (0x3035)
Поддержка статуса SCT.
Поддержка управления функциями SCT.
Поддержка таблицы данных SCT.
Номер ревизии структуры данных SMART с атрибутами, специфичными для поставщика: 16
Атрибуты SMART с порогами, специфичные для поставщика:
ID# Атрибут_ИМЯ ФЛАГ ЦЕННОСТЬ ХУДШЕ ПОРОГ ТИП ОБНОВЛЕНО КОГДА_ПРОИЗВЕДЕТСЯ НОМЕР_LBA
1 Raw_Read_Error_Rate 0x002f 200 200 051 Предварительная_неисправность Всегда - 0
3 Spin_Up_Time 0x0027 179 172 021 Предварительная_неисправность Всегда - 2033
4 Start_Stop_Count 0x0032 100 100 000 Старый_возраст Всегда - 881
5 Reallocated_Sector_Ct 0x0033 200 200 140 Предварительная_неисправность Всегда - 0
7 Seek_Error_Rate 0x002e 200 200 000 Старый_возраст Всегда - 0
9 Power_On_Hours 0x0032 052 052 000 Старый_возраст Всегда - 35469
10 Spin_Retry_Count 0x0032 100 100 000 Старый_возраст Всегда - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Старый_возраст Всегда - 0
12 Power_Cycle_Count 0x0032 100 100 000 Старый_возраст Всегда - 0
SMART Журнал ошибок версии: 1
Ошибок не зафиксировано
Структура журнала самотестирования SMART ревизии номер 1
SP AN MIN_LBA MAX_LBA ТЕКУЩИЙ_СТАТУС_ТЕСТА
1 0 0 Не_тестируется
2 0 0 Не_тестируется
3 0 0 Не_тестируется
4 0 0 Не_тестируется
5 0 0 Не_тестируется
Флаги выборочного самотеста (0x0): После сканирования выбранных диапазонов не читать-сканировать остаток диска. Если выборочный самотест ожидается при включении, возобновите через 0 минут задержки.
И когда я смотрю в Proxmox, я вижу все свои жесткие диски, подключенные к контроллеру SAS,
, как можно догадаться, я очень сбит с толку. И любая помощь будет очень признательна.