Ошибка BluestoreDB в CEPH 17.2.8, Proxmox Виртуальная Среда
DEZERTIR
Guest
0
25.01.2026 18:27:00
Всем привет, нужна ваша помощь. Недавно мы обновили наш кластер до версий PVE 8.4.16 и CEPH 17.2.8, и только после обновления прочитали статью, в которой говорится, что нужно срочно обновляться с этой версии из-за критической ошибки в bluestore. Подскажите, эта ошибка ещё актуальна? И стоит ли паниковать? Ссылка на статью — stability and data safety.
kwinz
Guest
0
15.02.2026 10:04:00
У меня Proxmox 8.4.16 на платной подписке. Proxmox VE 8.4 должен поддерживаться до августа 2026 года. Я только что обновил кластер и, к своему удивлению, после перезагрузки первого сервера Ceph Monitor не запустился! Поэтому я приостановил перезагрузку остальных серверов и начал разбираться. Я только что прочитал: «Обновитесь до версии 17.2.9 или 18.2.7. Не устанавливайте и не оставайтесь на версии 17.2.8». to version 17.2.9 or 18.2.7. Do not deploy or remain on version 17.2.8 Однако 17.2.8 — это текущая и последняя версия в репозитории Proxmox 8.4 с платной лицензией? Редактирую: Похоже, что срочно нужно , а потом обязательно проследить, чтобы срок поддержки мажорного релиза Ceph не пропускался в будущем.
SteveITS
Guest
0
15.02.2026 12:13:00
Да, это отдельный процесс. — следующий.
Neobin
Guest
0
15.02.2026 13:14:00
Исправление: [1] есть в версии 17.2.8-pve2: [2]. Но, как уже многократно говорилось, Ceph 17/Quincy уже достиг конца поддержки (EOL): [3] [5], и Ceph 18/Reef скоро тоже полностью перестанет поддерживаться: [4] [5]. P.S. Если это ещё не очевидно, у PVE и Ceph разные жизненные циклы поддержки (даже у Proxmox)... [1] [2] [3] [4] [5]
kwinz
Guest
0
15.02.2026 13:46:00
Спасибо всем! Облегчение, что Proxmox перенёс исправление ошибки повреждения данных в версию 17.2.8-pve2. С моей стороны я успешно решил проблему следующим образом:
1. Следовал инструкции (18.x) 2. На этом этапе один из мониторов Ceph на узле pve4 отказывался запускаться, даже после перезагрузки и разных попыток, из-за чего я не мог завершить обновление до Reef с параметром ceph osd require-osd-release reef. Логи: Feb 15 11:06:43 pve4 ceph-mon[2072]: *** Пойман сигнал (Aborted) ** Feb 15 11:06:43 pve4 ceph-mon[2072]: в потоке 747c4a490e40 thread_name:ceph-mon Feb 15 11:06:43 pve4 ceph-mon[2072]: версия ceph 18.2.7 (4cac8341a72477c60a6f153f3ed344b49870c932) reef (stable) Feb 15 11:06:43 pve4 ceph-mon[2072]: 1: /lib/x86_64-linux-gnu/libc.so.6(+0x3c050) [0x747c4b85a050] Feb 15 11:06:43 pve4 ceph-mon[2072]: 2: /lib/x86_64-linux-gnu/libc.so.6(+0x8aeec) [0x747c4b8a8eec] Feb 15 11:06:43 pve4 ceph-mon[2072]: 3: gsignal() Feb 15 11:06:43 pve4 ceph-mon[2072]: 4: abort() Feb 15 11:06:43 pve4 ceph-mon[2072]: 5: (ceph::__ceph_assert_fail(char const*, char const*, int, char const*)+0x178) [0x747c4c0aa881] Feb 15 11:06:43 pve4 ceph-mon[2072]: 6: /usr/lib/ceph/libceph-common.so.2(+0x2aa9c4) [0x747c4c0aa9c4] Feb 15 11:06:43 pve4 ceph-mon[2072]: 7: (LogMonitor::update_from_paxos(bool*)+0x22d1) [0x5cd668c0db61] Feb 15 11:06:43 pve4 ceph-mon[2072]: 8: (Monitor::refresh_from_paxos(bool*)+0x10c) [0x5cd668b7e36c] Feb 15 11:06:43 pve4 ceph-mon[2072]: 9: (Monitor::preinit()+0x95d) [0x5cd668baad8d] Feb 15 11:06:43 pve4 ceph-mon[2072]: 10: main() Feb 15 11:06:43 pve4 ceph-mon[2072]: 11: /lib/x86_64-linux-gnu/libc.so.6(+0x2724a) [0x747c4b84524a] Feb 15 11:06:43 pve4 ceph-mon[2072]: 12: __libc_start_main() Feb 15 11:06:43 pve4 ceph-mon[2072]: 13: _start() [...] Feb 15 11:06:43 pve4 systemd[1]: ceph-mon@pve4.service: Основной процесс завершился, код=killed, статус=6/ABRT Feb 15 11:06:43 pve4 systemd[1]: ceph-mon@pve4.service: Завершилось с результатом 'signal'. [...] Feb 15 11:07:24 pve4 systemd[1]: Не удалось запустить ceph-mon@pve4.service – демон монитора кластера Ceph.
Я успешно решил эту проблему на данном узле, уничтожив сломанный монитор и создав его заново:
3. После этого я продолжил обновление Ceph по инструкции (19.x) 4. И в итоге я успешно обновил весь кластер по одному от PVE 8 до PVE 9
ghandalf
Guest
0
21.02.2026 21:10:00
Привет, @kwinz! Пока я думаю о создании кластера PVE и Ceph на 3 узлах, хотел спросить: были ли у тебя сбои во время решения всех проблем? Проблемы, конечно, могут возникать, но полный простой данных — это совсем плохо. Было бы здорово узнать о твоём опыте.
kwinz
Guest
0
21.02.2026 23:00:00
Никаких сбоев при отключении одного мониторинга Ceph — я по-прежнему мог полностью читать и записывать данные. И кроме этого небольшого сбоя на прошлой неделе, система работает как часы уже несколько лет.