Во время тестирования этой ночью, когда отправляли резервные копии на объем CIFS, возникла проблема с samba на целевом сервере (он использовал более 80 ГБ оперативной памяти и SWAP, из-за чего сервер вышел из строя). Недоступность сервера CIFS сказалась на резервных копиях, которые выполнялись. Я ожидал, что задачи резервного копирования провалятся, но этого не произошло. Они просто зависли. Попытка остановить резервные копии через интерфейс не сработала. Также попытки убить процесс vzdump на узлах pve не увенчались успехом. Всё было заблокировано из-за объемов CIFS. Оглядываясь на логи, я увидел множество сообщений о зависших задачах и т.д. Перезапуск smbd и даже перезагрузка сервера CIFS не помогли решить проблему. В конечном итоге нам пришлось остановить ВМ и перезагрузить узлы. Но даже перезагрузка не завершалась, так как система всё ещё висела, пытаясь отсоединить объем CIFS. Нам пришлось сделать жесткий сброс узла pve, чтобы вернуть его в рабочее состояние. Жесткая перезагрузка только из-за утечки памяти в Samba на сервере, куда мы отправляем резервные копии. Это нормальное поведение или есть что-то не так с нашей настройкой? Я думал, что монтирования CIFS по умолчанию являются мягкими или прерываемыми. Разве все монтирования для объемов, таких как CIFS и NFS, не должны быть мягкими или, по крайней мере, прерываемыми, на случай если что-то пойдет не так? Сильно ударить по узлу только из-за проблем файлового сервера — это довольно радикально для производственной среды. Спасибо, Дэвид.
Мягкие / прерываемые крепления для целевых устройств резервного копирования, Proxmox Виртуальная Среда
|
15.01.2020 13:11:00
|
|
|
|
|
|
12.09.2020 22:40:00
Это явно не только проблема Proxmox, но и общая проблема дизайна реализации cifs и nfs.
|
|
|
|
|
|
14.01.2022 07:23:00
Привет! Есть ли способ установить echo_interval=1 вручную в PVE? Спасибо, Майкл.
|
||||
|
|
|
|||
Читают тему
