+7 (495) 320-70-49
- Назад
- Телефоны
- +7 (495) 320-70-49
- Заказать звонок
info@proxmox.su
Москва, Бакунинская улица, 69с1
Пн-Пт: 09-00 до 18-00
Сб-Вс: выходной

ПАНИКА в zfs_quota.c:88: zpl_get_file_info(), Proxmox Виртуальная Среда

LostInTranslation

Guest

09.01.2025 18:24:00

Привет, у меня были проблемы с ошибками файловой системы некоторое время назад (см. сообщения здесь). Поскольку четких доказательств не было, я решил заменить модули RAM в том сервере на новые ECC RAM модули четыре недели назад. С тех пор проблемы с файловой системой исчезли, но дважды возникало следующее сообщение об ошибке (один раз 27.12.24 и один раз прошлой ночью): Код: Jan 09 00:42:46 proxmoxt kernel: VERIFY3(sa.sa_magic == SA_MAGIC) failed (8192 == 3100762)
Jan 09 00:42:46 proxmoxt kernel: PANIC at zfs_quota.c:88:zpl_get_file_info() Подключение к серверу больше невозможно. У zpool достаточно места (используется всего около 10% от общего объема). К сожалению, в логах ничего полезного не нахожу. Есть какие-нибудь советы, как сузить круг поиска проблемы?
BR, Jens

LostInTranslation

Guest

10.02.2025 08:03:00

Привет всем,

Мы все еще разбираемся с этой проблемой. Примерно каждые 2-3 недели (обычно во время начала бэкапов в Proxmox Backup) мы видим полностью не отвечающий Proxmox сервер. В journalctl видны следующие строки:

Code: Feb 08 23:58:43 proxmoxt kernel: VERIFY3(sa.sa_magic == SA_MAGIC) failed (8192 == 3100762)
Feb 08 23:58:43 proxmoxt kernel: PANIC at zfs_quota.c:88:zpl_get_file_info()
Feb 08 23:58:43 proxmoxt kernel: Showing stack for process 1864533
Feb 08 23:58:43 proxmoxt kernel: CPU: 2 PID: 1864533 Comm: proxmox-backup- Tainted: P IO 6.8.12-7-pve #1
Feb 08 23:58:43 proxmoxt kernel: Hardware name: Dell Inc. Precision WorkStation T3500 /09KPNV, BIOS A17 05/28/2013
Feb 08 23:58:43 proxmoxt kernel: Call Trace:
Feb 08 23:58:43 proxmoxt kernel: <TASK>
Feb 08 23:58:43 proxmoxt kernel: dump_stack_lvl+0x76/0xa0
Feb 08 23:58:43 proxmoxt kernel: dump_stack+0x10/0x20
Feb 08 23:58:43 proxmoxt kernel: spl_dumpstack+0x29/0x40 [spl]
Feb 08 23:58:43 proxmoxt kernel: spl_panic+0xfc/0x120 [spl]
Feb 08 23:58:43 proxmoxt kernel: ? dnode_cons+0x2ab/0x2d0 [zfs]
Feb 08 23:58:43 proxmoxt kernel: zpl_get_file_info+0x23a/0x250 [zfs]
Feb 08 23:58:43 proxmoxt kernel: dmu_objset_userquota_get_ids+0x257/0x4c0 [zfs]
Feb 08 23:58:43 proxmoxt kernel: dnode_setdirty+0x38/0x110 [zfs]
Feb 08 23:58:43 proxmoxt kernel: dnode_allocate+0x16b/0x1f0 [zfs]
Feb 08 23:58:43 proxmoxt kernel: dmu_object_alloc_impl+0x36e/0x420 [zfs]
Feb 08 23:58:43 proxmoxt kernel: ? __kmalloc_node+0x1cb/0x430
Feb 08 23:58:43 proxmoxt kernel: dmu_object_alloc_dnsize+0x1f/0x40 [zfs]
Feb 08 23:58:43 proxmoxt kernel: zfs_mknode+0x1de/0x1020 [zfs]
Feb 08 23:58:43 proxmoxt kernel: zfs_create+0x774/0xa20 [zfs]
Feb 08 23:58:43 proxmoxt kernel: zpl_create+0xca/0x1e0 [zfs]
Feb 08 23:58:43 proxmoxt kernel: path_openat+0xec9/0x1190
Feb 08 23:58:43 proxmoxt kernel: do_filp_open+0xaf/0x170
Feb 08 23:58:43 proxmoxt kernel: do_sys_openat2+0xb3/0xe0
Feb 08 23:58:43 proxmoxt kernel: __x64_sys_openat+0x6c/0xa0
Feb 08 23:58:43 proxmoxt kernel: x64_syscall+0x44/0x48
Feb 08 23:58:43 proxmoxt kernel: entry_SYSCALL_64_after_hwframe+0x78/0x80

Мы уже поставили новый сервер (другое хостинг-провайдер, другой блок питания, другая материнская плата, другой процессор, другая RAM – также протестировали с memtest86+). Просто перенесли четыре HDD с установкой PVE и ZFS пулом. Проблема сохраняется. Значения SMART для четырех HDD кажутся нормальными. Но на этих выходных начали заменять первый HDD после события. Резервирование прошло нормально. Какие есть советы, как действовать дальше?

С уважением,
Йенс

fabian

Guest

10.02.2025 08:50:00

Если у тебя раньше были проблемы с оперативной памятью, и пул был записан в этот период, вполне возможно, что файловая система повреждена кое-где. Тест, который завершается с ошибкой, проверяет "магическое значение" части файла, связанной с xattr. Этот тест есть не просто так — он не должен завершаться с ошибкой, если только что-то не повреждено, и тогда всё может пойти не так.

LostInTranslation

Guest

10.02.2025 09:21:00

Окей. Были проблемы с оперативной памятью ещё месяц назад. С тех пор я уже несколько раз делал zpool scrub. А ещё паника не происходит при каждом бэкапе (если это повреждение, должно же оно происходить постоянно, верно?). Что посоветуете в этом случае?

fabian

Guest

10.02.2025 09:29:00

Постарайся восстановить как можно больше данных и начинай всё с чистого листа. В общем, после работы системы с неисправной памятью, ты вряд ли сможешь точно сказать, что именно могло быть повреждено или сломано в результате.

LostInTranslation Guest	#6 0 12.02.2025 04:32:00 Только один последний вопрос/проверка: я так понял, что zfs scrub (которую делали несколько раз) должна была бы находить и хотя бы сообщать о таких повреждениях… Я ошибаюсь?

fabian Guest	#7 0 12.02.2025 08:41:00 Проверка ZFS (scrub) проверит контрольные суммы dnodes/blocks, но я не уверен, попытается ли она реально читать xattrs на семантическом уровне.

Читают тему

Главная Каталог 0 Корзина 0 Избранные Кабинет 0 Сравнение Акции Контакты Услуги Бренды Отзывы Компания Лицензии Документы Реквизиты Поиск Блог Обзоры