+7 (495) 320-70-49
- Назад
- Телефоны
- +7 (495) 320-70-49
- Заказать звонок
info@proxmox.su
Москва, Бакунинская улица, 69с1
Пн-Пт: 09-00 до 18-00
Сб-Вс: выходной

MDRAID и O_DIRECT, Proxmox Виртуальная Среда

esi_y

Guest

16.10.2024 13:30:00

Я перенёс это от Proxmox 4.4 из-за проблемы с virtio_scsi, чтобы не воскресать старую тему, это ответ на сообщение от @t.lamprecht. Замечу, что я не жду никакой реакции, просто даю возможность всем, кто хочет меня поправить, сделать это. Но вот как я понимаю всю эту историю.

Как я это понял:

1. Где-то у какого-то пользователя на mdraid происходила необъяснимая порча данных;
2. Были выдвинуты гипотезы, почему это происходит;
3. Написан тестовый кейс (который потом передали Станиславу, чтобы он отправил его в kernel BZ?);
4. Не увидев действий, гипотеза (пункт 2) была добавлена в обсуждение;
5. Устав ждать, выбрали другое решение.

Меня не особо волнует пункт (5), это ваш выбор и ваше решение, но рассуждения там абсолютно неверные:

6. Если сейчас я отправлю этот тестовый кейс (пункт 3) Ханнесу, меня будут просто смеяться, потому что я воспроизводлю то, что и так должно работать именно так;
7. Я не могу воспроизвести гипотезу (пункт 2), которую должен был показать тест (пункт 3);
8. Я могу выбрать файловую систему, которая игнорирует мой O_DIRECT (как сделали вы), но;
9. Я могу и вовсе не использовать O_DIRECT.

Стоит заметить, что qemu даже по умолчанию не ставит O_DIRECT. Вы просто снесли (в вашем списке) абсолютно все файловые системы, кроме CoW. Так называемый тестовый кейс не актуален (пункт 6). Это немного похоже на утверждение, что тест доказывает, будто mdraid уровня 1 не может исправить тихую порчу данных. Но воспроизвести её нельзя, у меня нет кейса, который это демонстрирует.

То есть, вместо того чтобы не использовать этот кейс, вам *нужна* файловая система, которая... просто его игнорирует. Все вы ссылаетесь друг на друга, но по факту только Дитмар был прав, когда говорил, что «слишком сложно для пользователей восстанавливаться после сбоев». Есть причины не использовать mdraid, но они известны и не связаны с этим надуманным вопросом.

До сих пор мы не знаем, что реально вызвало проблему. Я знаю это чувство, у меня тоже случалось с какой-то безымянной файловой системой.

giner

Guest

16.10.2025 03:23:00

К слову, 1. Один из пользователей был я. Исходная проблема возникала с DRBD (виртуальные машины с файлом подкачки иногда зависали при миграции с одного хоста Proxmox VE на другой). 3. Тестовый сценарий написан мной (Станиславом) как доказательство концепции.

RolandK

Guest

19.10.2025 23:41:00

@t.lamprecht @giner, я создал репродусер для этой проблемы, чтобы воспроизвести ситуацию без записи через O_DIRECT пользователем — просто обращаясь к памяти и вызывая свап/трэшинг системы. Сделал это, потому что были жалобы, что «нельзя так подавать direct_io», например, на списке рассылки linux-raid, см. https://bugzilla.kernel.org/show_bug.cgi?id=99171#c36

RolandK

Guest

01.11.2025 14:34:00

Похоже, сообщество Linux и разработчики не особо волнуются этой проблемой. Это действительно подтверждает, что Proxmox считает mdraid «неподдерживаемым», и я бы ещё добавил: держитесь подальше от Linux mdraid! Не только потому, что он не работает с O_DIRECT или сложно управлять ошибками, но главное — когда возникают проблемы, никому до этого нет дела.

emunt6 Guest	#5 0 24.11.2025 21:10:00 Как насчёт lvm-raid? Код: https://www.linux.org/docs/man7/lvmraid.html

emunt6 Guest	#6 0 24.11.2025 21:23:00 Учитывая следующее, с ZFS тоже можно получить бесшумное повреждение загрузочного раздела:

RolandK Guest	#7 0 25.11.2025 10:27:00 Это тоже затронуто. https://bugzilla.kernel.org/show_bug.cgi?id=99171#c24

RolandK Guest	#8 0 25.11.2025 10:28:00 Хороший и справедливый аргумент. @emunt6, не хочешь открыть баг-тикет по этому поводу?

t.lamprecht Guest	#9 0 25.11.2025 10:31:00 Мы явно дублируем UEFI-разделы вне ZFS. А то, что при нескольких месяцах работы без перезагрузок ничего не заметили, означает, что за этот период не устанавливались обновления. Иначе при установке нового ядра возникли бы ошибки ввода-вывода, которые сразу бы бросились в глаза. В таком случае, скорее всего, с такой конфигурацией вообще ничего странного не проявится.

Читают тему

Главная Каталог 0 Корзина 0 Избранные Кабинет 0 Сравнение Акции Контакты Услуги Бренды Отзывы Компания Лицензии Документы Реквизиты Поиск Блог Обзоры