+7 (495) 320-70-49
- Назад
- Телефоны
- +7 (495) 320-70-49
- Заказать звонок
info@proxmox.su
Москва, Бакунинская улица, 69с1
Пн-Пт: 09-00 до 18-00
Сб-Вс: выходной

Репликация ZFS не удалась: вышло время ожидания., Proxmox Виртуальная Среда

MAgno Santos

Guest

30.07.2020 09:39:00

Всем привет! У меня есть кластер с двумя группами серверов: 2 — Dell R720 и ещё 2 — Dell R710. На всех запущены ВМ в ZFS пуле, собранном из SSD. На паре R710 иногда сбивается репликация ZFS между узлами, и я это замечаю только потому, что приходят уведомления на почту. Ниже пример такого уведомления:

Код: команда 'zfs snapshot R710SSD1/vm-107-disk-0@__replicate_107-0_1596076021__' не удалась: время ожидания превышено.

Некоторые из этих репликаций настроены на выполнение каждые 5 минут, с целью реализовать сценарий высокой доступности без необходимости переходить на CEPH (а для CEPH нужны 4 узла и более качественная сеть).

Есть идеи, в чём может быть причина (ладно, в этом случае — таймаут, но почему?) и как это исправить? Заранее спасибо!

damago1

Guest

15.07.2023 13:00:00

На мой взгляд, это какая-то ошибка, а не перегрузка ввода-вывода. У меня есть система, где: 1. Ввод-вывод не перегружен, система в целом отзывчива, 2. команда 'zfs snapshot' из командной строки выполняется всего за несколько секунд. Кстати, упомянутые снапшоты существуют и после неудачной репликации. И несмотря на это, появляются указанные ошибки, и репликация всё равно не проходит.

Jota V. Guest	#3 0 22.08.2020 19:00:00 Можно увеличить значения таймаута?

Michael Herf

Guest

14.08.2023 23:32:00

У меня постоянно происходят тайм-ауты ZFS при выполнении сканирования (scrub) на таргете. По определению, сканирование не должно быть задачей с повышенным приоритетом ввода-вывода. Думаю, тайм-аут должен быть длиннее нескольких секунд или настраиваемым — иначе при каждом сканировании пула я получаю сотни писем о неудачных репликациях.

Michael Herf

Guest

15.07.2025 01:57:00

Все еще возникают ошибки «got timeout» во время проверки zfs. Поскольку это приводит к множеству писем каждый месяц, я решил поискать, какой именно таймаут можно изменить. Пока что мой лучший вариант — патч в файле /usr/share/perl5/PVE/Storage/ZFSPoolPlugin.pm: я поменял последнюю строку с таймаутом с 10 на 60 секунд: # $timeout = 10 if !$timeout; $timeout = 60 if !$timeout; Перезапустил pvedaemon командой "systemctl restart pvedaemon" — хотя не уверен, что это обязательно. Посмотрим, поможет ли.

Gilberto Ferreira Guest	#6 0 03.12.2025 15:36:00 Привет... Ты получил такие же хорошие результаты после этого изменения? Жду твоего ответа. Спасибо.

Michael Herf Guest	#7 0 03.12.2025 15:50:00 Да, думаю, с патчем стало на 95% лучше, максимум по одному сообщению на пользователя теперь, тогда как раньше приходили десятки писем.

Gilberto Ferreira Guest	#8 0 03.12.2025 15:57:00 О! Хорошо знать. Может, сотрудники Proxmox смогут сделать что-то подобное в веб-интерфейсе репликации, чтобы увеличить это значение. Просто идея. @fiona @t.lamprecht

Читают тему

Главная Каталог 0 Корзина 0 Избранные Кабинет 0 Сравнение Акции Контакты Услуги Бренды Отзывы Компания Лицензии Документы Реквизиты Поиск Блог Обзоры