Последние несколько недель были для меня просто кошмар. Каждый раз, когда запускался график резервного копирования, виртуалка зависала. После принудительной остановки и запуска виртуалки файлы /etc/shadow и /etc/passwd иногда оказывались пустыми, что приводило к полному хаосу. Это повторялось на нескольких Proxmox серверах и виртуалках, из-за чего пришлось провести много бессонных ночей, пересоздавая, например, MySQL, SSH и всех остальных пользователей. Не помогает и то, что в моей конфигурации 300-400 пользователей (cPanel). Я решил разобраться в этом. Сначала я отключил qemu-guest-agent freeze. Когда я делал резервную копию, сидя рядом с ней, заметил, что iowait внутри виртуалки поднимался до 40. SSH был странным, показывал только bash 5.1 (а не обычное имя хоста), и большинство сервисов не отвечали. Запуск чего-то вроде: dnf install xyz был невозможен. Посещение curl localhost тоже не отвечало. Как только я остановил задачу резервного копирования со стороны Proxmox, проблема исчезла. Я экспериментировал со всеми вариантами, включая iowait и iotread limit. В итоге я нашел параметр "fleecing" во вкладке "Advanced". Это мгновенно решило проблему. Теперь iowait вернулся к 0.0 wa, и сервисы отвечают. Кажется, это также решает проблему с опустошением файлов /etc/passwd, /etc/shadow (ох, какой кошмар!). Я очень рад, что нашел этот параметр, но сколько места для этого нужно? На каждом сервере у меня только 1x виртуалка с разделом на 3.5 TB. Общий размер диска Proxmox сервера - 3.6 TB (осталось 100 GB). Хватит ли 1x 1 TB SSD диска, или нужно больше? Имеет ли значение, если это NVMe вместо SSD диска? Мое локальное хранилище - NVMe. Резервное копирование пишет со скоростью 100 MiB/s.
INFO: 17% (588.9 GiB из 3.4 TiB) за 43м 20с, чтение: 240.2 MiB/s, запись: 106.4 MiB/s
INFO: 18% (623.5 GiB из 3.4 TiB) за 48м 42с, чтение: 110.2 MiB/s, запись: 94.7 MiB/s
INFO: 19% (658.7 GiB из 3.4 TiB) за 50м 29с, чтение: 337.0 MiB/s, запись: 111.6 MiB/s
INFO: 20% (692.8 GiB из 3.4 TiB) за 55м 36с, чтение: 113.6 MiB/s, запись: 98.7 MiB/s
Имеет ли смысл делать резервное копирование каждые 4 часа вместо ежедневного с включенным fleecing?
INFO: 17% (588.9 GiB из 3.4 TiB) за 43м 20с, чтение: 240.2 MiB/s, запись: 106.4 MiB/s
INFO: 18% (623.5 GiB из 3.4 TiB) за 48м 42с, чтение: 110.2 MiB/s, запись: 94.7 MiB/s
INFO: 19% (658.7 GiB из 3.4 TiB) за 50м 29с, чтение: 337.0 MiB/s, запись: 111.6 MiB/s
INFO: 20% (692.8 GiB из 3.4 TiB) за 55м 36с, чтение: 113.6 MiB/s, запись: 98.7 MiB/s
Имеет ли смысл делать резервное копирование каждые 4 часа вместо ежедневного с включенным fleecing?
