Всем привет! Как и вы, я увлечён opensource, Proxmox и Ceph. Недавно я попробовал кое-что в своём Ceph-кластере, когда хотел изменить подсеть для своих MON (одновременно). Это сломало мой кластер. Знаю, что было глупо. Версия Ceph – Reef (18). Мои новые MON больше не видели кластер, а мои OSD не отслеживались моими MON. Чтобы восстановить исходное состояние после нескольких попыток, я решил следовать рекомендациям Ceph: И, конкретно, применить этот скрипт, который я соответственно модифицировал: Скрипт запустился без проблем. Но, к сожалению, у меня всё ещё нет доступа к кластеру. Я получил это сообщение в команде 'ceph -s' (вчера): Bash: 2025-06-23T20:55:03.630+0200 77b0f4e006c0 -1 monclient(hunting): handle_auth_bad_method server allowed_methods but i only support [errno 13] RADOS permission denied (error connecting to the cluster) Сегодня та же команда возвращает после долгого времени: Bash: caps mds = "allow *" 2025-06-24T20:58:24.760+0200 7158566006c0 0 monclient(hunting): authenticate timed out after 300 [errno 110] RADOS timed out (error connecting to the cluster) Мой кластер состоит из 3 узлов и 17 OSDS и 3 MON. После скрипта у меня работают только 2 Monitor. - На pve01, pve02, pve03, в /var/lib/ceph/osd/ceph-pve0x, у всех OSD есть следующие файлы: block fsid ready type ceph_fsid keyring require_osd_release whoami - ceph_fsid для каждого OSD одинаковый и соответствует тому, что в ceph.conf - файл '/etc/pve/priv/ceph.client.admin.keyring' существует: Bash: caps mds = "allow *" caps mgr = "allow *" caps mon = "allow *" caps osd = "allow *" - Pve01 и pve02 имеют одинаковый keyring в “/var/lib/ceph/mon/ceph-{host}”. Единственный вопрос, который у меня сейчас: Официально ли мой кластер мёртв? Или вы думаете, я близок к надежде? И если да, то у вас есть какие-нибудь идеи? У меня нет. Спасибо.
