Пытаюсь настроить систему резервного копирования для моей системы. Система использует гиперконвергентный Ceph-кластер с не привилегированными контейнерами LXC, образ контейнера находится в пуле Ceph RBD. В некоторых контейнерах смонтирована файловая система Ceph через ceph-fuse. Если я делаю снимок контейнера, у которого нет смонтированной файловой системы cephfs, то все работает корректно. Если я делаю снимок контейнера с смонтированной файловой системой cephfs и без открытых файлов из монтирования (в теории, это зависит от того, когда и как происходит сбой), то все работает корректно. Если я делаю снимок контейнера с смонтированной файловой системой cephfs и хотя бы один файл открыт, то кажется, что он всегда сбоит. После того, как система не смогла сделать снимок, кажется, что есть заблокированный процесс какого-то рода, который требует перезагрузки хоста. После перезагрузки GUI Proxmox показывает, что снимок существует, но не является родителем "NOW". При непосредственном просмотре образа RBD снимка в образе нет. Единственное, что я могу найти и что может быть релевантно, — это ошибка в syslog, указывающая на то, что мой ключ администратора Ceph отсутствует (затем ошибка ключа), хотя он очень даже есть. Похоже, что не-root процесс пытается прочитать ключ администратора Ceph, но я не могу найти никакого такого процесса. Кто-нибудь сталкивался с чем-то подобным раньше и если да, то какие есть предложения, как это обойти?
Снимки RBD в Ceph зависают, когда в LXC смонтирована файловая система ceph-fuse., Proxmox Виртуальная Среда
|
20.02.2024 13:30:00
|
|
|
|
|
Читают тему
