Я делаю большую еженедельную резервную копию снимков, в PBS, и одна из них — резервная копия lxc с NFS-монтом, который пробрасывается в lxc. Довольно часто кажется, что резервная копия зависает (без ошибок), что оставляет один из моих lxc заблокированным, а весь узел — с вопросительными знаками повсюду. Я все еще могу получить доступ к узлу. Я пробовал различные команды, чтобы перезапустить все службы PVE, и 50% времени это работает 100% времени. Я не уверен, где мне нужно искать ошибки или источник этих зависаний. В /var/log/syslog ничего полезного нет в момент резервного копирования. Мой /etc/fstab: 192.168.1.206:/Media /mnt/zee/Media nfs auto,rw,noatime,nolock,bg,soft,nfsvers=4,intr,tcp,timeo=50,retrans=5,actimeo=10,retry=5 0 0 Я делаю как обычно, убиваю процесс vzdump, затем: service pve-cluster stop
service corosync stop
service pvestatd stop
service pveproxy stop
service pvedaemon stop
service pve-cluster start
service corosync start
service pvestatd start
service pveproxy start
service pvedaemon start Затем узел показывает, что он в сети, и мои ВМ показывают, что они в сети. Все мои хранилища и lxc все равно показывают ?. Несмотря на это, pvesm status показывает, что все хранилища в сети.
service corosync stop
service pvestatd stop
service pveproxy stop
service pvedaemon stop
service pve-cluster start
service corosync start
service pvestatd start
service pveproxy start
service pvedaemon start Затем узел показывает, что он в сети, и мои ВМ показывают, что они в сети. Все мои хранилища и lxc все равно показывают ?. Несмотря на это, pvesm status показывает, что все хранилища в сети.

Есть ли более безопасный способ монтировать NFS, чтобы, когда он пытается что-то сделать, например, загрузиться, запустить lxc или сделать бэкап, вся нода не падала?