Мои характеристики сервера:
Код: MB: Supermicro H12SSL-i
CPU: AMD Epyc 7742
GPU: NVIDIA RTX 3090
RAM: 512GB DDR4 RDIMM ECC
Сегодня мой Proxmox 8 выдал следующую ошибку:
Код: [40.294701] EXT-fs error (device dm-1): ext_journal_check_start:84: comm systemd-journal: Detected aborted journal
EXT4-fs (dm-1): Remounting filesystem read-only
Эта ошибка появляется примерно через 30 секунд после загрузки Proxmox, даже если я могу ввести имя пользователя и пароль, и через несколько секунд — БАМ — появляется вышеуказанная ошибка. Сначала подумал, что умирает мой 2ТБ Samsung NVMe. У меня в сервере только один диск. К счастью, у меня есть два совершенно новых NVMe от Samsung, причем даже на 4ТБ. Так я скачал Clonezilla и начал клонирование старого "якобы" сломанного NVMe на 2ТБ на новый 4ТБ NVMe. Клонирование прошло успешно!
Так я установил новый 4ТБ NVMe и БАМ — та же ошибка даже на новом диске. Чтобы было еще страннее, я взял этот 4ТБ диск и подключил его к другой машине, где была установлена Ubuntu 22.04. Я удалил Ubuntu NVMe и установил на него 4ТБ клонированный Proxmox, и там Proxmox загрузился и отлично работает на моем ПК, и Proxmox стартует без отображения этой ошибки, но на сервере SuperMicro — нет.
Там, на ПК, который раньше работал с Ubuntu, когда я вставил начальный 2ТБ диск с сервера, к моему еще большему удивлению, он работал без каких-либо ошибок, как и 4ТБ клонированный диск.
Так я решил запустить тест, чтобы посмотреть, здоров ли диск, и выполнил `sudo smartctl -a /dev/nvme0n1`, в результате чего получил:
Код: SMART overall-health self-assessment test result: PASSED
Если этот результат точен, то диск должен быть в порядке, и почему бы и нет, он прекрасно работает на моем обычном ПК. Почему он не работает на моем сервере SuperMicro?
Чтобы протестировать сервер, я взял NVMe с моего Ubuntu ПК и подключил его к серверу, чтобы прийти к еще более странному результату: Ubuntu загружается в том же слоте NVMe, в котором он отказывается загружать начальные 2ТБ или клонированный 4ТБ NVMe-диски с Proxmox.
Как могут происходить такие странные результаты, у кого-нибудь есть предположения? Эта конфигурация работала так месяцами без проблем.
Что мне делать, чтобы вернуть Proxmox в онлайн без этой неприятной `comm systemd-journal: Detected aborted journal`? Есть какие-нибудь советы?
Код: MB: Supermicro H12SSL-i
CPU: AMD Epyc 7742
GPU: NVIDIA RTX 3090
RAM: 512GB DDR4 RDIMM ECC
Сегодня мой Proxmox 8 выдал следующую ошибку:
Код: [40.294701] EXT-fs error (device dm-1): ext_journal_check_start:84: comm systemd-journal: Detected aborted journal
EXT4-fs (dm-1): Remounting filesystem read-only
Эта ошибка появляется примерно через 30 секунд после загрузки Proxmox, даже если я могу ввести имя пользователя и пароль, и через несколько секунд — БАМ — появляется вышеуказанная ошибка. Сначала подумал, что умирает мой 2ТБ Samsung NVMe. У меня в сервере только один диск. К счастью, у меня есть два совершенно новых NVMe от Samsung, причем даже на 4ТБ. Так я скачал Clonezilla и начал клонирование старого "якобы" сломанного NVMe на 2ТБ на новый 4ТБ NVMe. Клонирование прошло успешно!
Так я установил новый 4ТБ NVMe и БАМ — та же ошибка даже на новом диске. Чтобы было еще страннее, я взял этот 4ТБ диск и подключил его к другой машине, где была установлена Ubuntu 22.04. Я удалил Ubuntu NVMe и установил на него 4ТБ клонированный Proxmox, и там Proxmox загрузился и отлично работает на моем ПК, и Proxmox стартует без отображения этой ошибки, но на сервере SuperMicro — нет.
Там, на ПК, который раньше работал с Ubuntu, когда я вставил начальный 2ТБ диск с сервера, к моему еще большему удивлению, он работал без каких-либо ошибок, как и 4ТБ клонированный диск.
Так я решил запустить тест, чтобы посмотреть, здоров ли диск, и выполнил `sudo smartctl -a /dev/nvme0n1`, в результате чего получил:
Код: SMART overall-health self-assessment test result: PASSED
Если этот результат точен, то диск должен быть в порядке, и почему бы и нет, он прекрасно работает на моем обычном ПК. Почему он не работает на моем сервере SuperMicro?
Чтобы протестировать сервер, я взял NVMe с моего Ubuntu ПК и подключил его к серверу, чтобы прийти к еще более странному результату: Ubuntu загружается в том же слоте NVMe, в котором он отказывается загружать начальные 2ТБ или клонированный 4ТБ NVMe-диски с Proxmox.
Как могут происходить такие странные результаты, у кого-нибудь есть предположения? Эта конфигурация работала так месяцами без проблем.
Что мне делать, чтобы вернуть Proxmox в онлайн без этой неприятной `comm systemd-journal: Detected aborted journal`? Есть какие-нибудь советы?
