Я перенёс это от Proxmox 4.4 из-за проблемы с virtio_scsi, чтобы не воскресать старую тему, это ответ на сообщение от @t.lamprecht. Замечу, что я не жду никакой реакции, просто даю возможность всем, кто хочет меня поправить, сделать это. Но вот как я понимаю всю эту историю.
Как я это понял:
1. Где-то у какого-то пользователя на mdraid происходила необъяснимая порча данных;
2. Были выдвинуты гипотезы, почему это происходит;
3. Написан тестовый кейс (который потом передали Станиславу, чтобы он отправил его в kernel BZ?);
4. Не увидев действий, гипотеза (пункт 2) была добавлена в обсуждение;
5. Устав ждать, выбрали другое решение.
Меня не особо волнует пункт (5), это ваш выбор и ваше решение, но рассуждения там абсолютно неверные:
6. Если сейчас я отправлю этот тестовый кейс (пункт 3) Ханнесу, меня будут просто смеяться, потому что я воспроизводлю то, что и так должно работать именно так;
7. Я не могу воспроизвести гипотезу (пункт 2), которую должен был показать тест (пункт 3);
8. Я могу выбрать файловую систему, которая игнорирует мой O_DIRECT (как сделали вы), но;
9. Я могу и вовсе не использовать O_DIRECT.
Стоит заметить, что qemu даже по умолчанию не ставит O_DIRECT. Вы просто снесли (в вашем списке) абсолютно все файловые системы, кроме CoW. Так называемый тестовый кейс не актуален (пункт 6). Это немного похоже на утверждение, что тест доказывает, будто mdraid уровня 1 не может исправить тихую порчу данных. Но воспроизвести её нельзя, у меня нет кейса, который это демонстрирует.
То есть, вместо того чтобы не использовать этот кейс, вам *нужна* файловая система, которая... просто его игнорирует. Все вы ссылаетесь друг на друга, но по факту только Дитмар был прав, когда говорил, что «слишком сложно для пользователей восстанавливаться после сбоев». Есть причины не использовать mdraid, но они известны и не связаны с этим надуманным вопросом.
До сих пор мы не знаем, что реально вызвало проблему. Я знаю это чувство, у меня тоже случалось с какой-то безымянной файловой системой.
Как я это понял:
1. Где-то у какого-то пользователя на mdraid происходила необъяснимая порча данных;
2. Были выдвинуты гипотезы, почему это происходит;
3. Написан тестовый кейс (который потом передали Станиславу, чтобы он отправил его в kernel BZ?);
4. Не увидев действий, гипотеза (пункт 2) была добавлена в обсуждение;
5. Устав ждать, выбрали другое решение.
Меня не особо волнует пункт (5), это ваш выбор и ваше решение, но рассуждения там абсолютно неверные:
6. Если сейчас я отправлю этот тестовый кейс (пункт 3) Ханнесу, меня будут просто смеяться, потому что я воспроизводлю то, что и так должно работать именно так;
7. Я не могу воспроизвести гипотезу (пункт 2), которую должен был показать тест (пункт 3);
8. Я могу выбрать файловую систему, которая игнорирует мой O_DIRECT (как сделали вы), но;
9. Я могу и вовсе не использовать O_DIRECT.
Стоит заметить, что qemu даже по умолчанию не ставит O_DIRECT. Вы просто снесли (в вашем списке) абсолютно все файловые системы, кроме CoW. Так называемый тестовый кейс не актуален (пункт 6). Это немного похоже на утверждение, что тест доказывает, будто mdraid уровня 1 не может исправить тихую порчу данных. Но воспроизвести её нельзя, у меня нет кейса, который это демонстрирует.
То есть, вместо того чтобы не использовать этот кейс, вам *нужна* файловая система, которая... просто его игнорирует. Все вы ссылаетесь друг на друга, но по факту только Дитмар был прав, когда говорил, что «слишком сложно для пользователей восстанавливаться после сбоев». Есть причины не использовать mdraid, но они известны и не связаны с этим надуманным вопросом.
До сих пор мы не знаем, что реально вызвало проблему. Я знаю это чувство, у меня тоже случалось с какой-то безымянной файловой системой.
