Привет. Обновил Proxmox на трёх узлах, каждый из которых содержит по 2 выделенных SSD-диска для sheepdog; они смонтированы через xfs на /var/lib/sheepdog/disc{0,1}. Первоначальная настройка под proxmox-2.3 была сделана на каждом узле, и тогда кластер работал. Сейчас, после обновления до 3.0, sheepdog не запускается и выдаёт ошибку:
Aug 19 01:57:18 [main] init_obj_path(245) /var/lib/sheepdog/disc0 is meta-store, abort
Я проверил код, и эта ошибка появляется из-за того, что в каталогах /var/lib/sheepdog/disc{0,1} есть файлы «epoch» и «config». Вывод ls -l /var/lib/sheepdog/disc0 (disc1 похож):
-rw-r----- 1 root root 40 May 7 12:17 config
drwxr-x--- 2 root root 4096 Aug 18 19:00 epoch
drwxr-x--- 2 root root 6 May 7 12:17 journal
-rw-r----- 1 root root 0 May 7 12:15 lock
drwxr-x--- 4 root root 557056 Aug 18 19:13 obj
-rw-r--r-- 1 root root 4770639 Aug 18 19:15 sheep.log
srwxr-xr-x 1 root root 0 May 12 22:27 sock
-rw-r--r-- 1 root root 0 May 7 12:14 startup
Эти файлы создал сам sheepdog, так что похоже, он запутался в собственных данных. Что мне теперь делать? Удалить всё, кроме каталога obj, и попробовать снова? Как безопасно восстановить этот кластер? Спасибо!
Aug 19 01:57:18 [main] init_obj_path(245) /var/lib/sheepdog/disc0 is meta-store, abort
Я проверил код, и эта ошибка появляется из-за того, что в каталогах /var/lib/sheepdog/disc{0,1} есть файлы «epoch» и «config». Вывод ls -l /var/lib/sheepdog/disc0 (disc1 похож):
-rw-r----- 1 root root 40 May 7 12:17 config
drwxr-x--- 2 root root 4096 Aug 18 19:00 epoch
drwxr-x--- 2 root root 6 May 7 12:17 journal
-rw-r----- 1 root root 0 May 7 12:15 lock
drwxr-x--- 4 root root 557056 Aug 18 19:13 obj
-rw-r--r-- 1 root root 4770639 Aug 18 19:15 sheep.log
srwxr-xr-x 1 root root 0 May 12 22:27 sock
-rw-r--r-- 1 root root 0 May 7 12:14 startup
Эти файлы создал сам sheepdog, так что похоже, он запутался в собственных данных. Что мне теперь делать? Удалить всё, кроме каталога obj, и попробовать снова? Как безопасно восстановить этот кластер? Спасибо!
