Привет! У меня простой кластер Proxmox 8.3 с 3 серверами от Scaleway (бывший dedibox). Из-за сбоя сервера мне пришлось заменять все узлы по одному (один после жёсткого выключения), поддерживая кластер в рабочем состоянии. Теперь вроде бы всё вернулось в норму, но служба pacemaker постоянно выдаёт такие ошибки, примерно каждую секунду:
Bash: 13 марта 20:27:58 host04 pacemaker-fenced[xxxx524]: notice: Клиент stonith-api.1074640 хочет перезагрузить 4 с использованием любого устройства.
13 марта 20:27:58 host04 pacemaker-fenced[xxxx524]: notice: Запрос на перезагрузку пира host06.
13 марта 20:27:58 host04 pacemaker-fenced[xxxx524]: notice: Не удалось найти, кто может перезагрузить host06 с использованием любого устройства.
13 марта 20:27:58 host04 pacemaker-fenced[xxxx524]: error: Операция 'reboot' в отношении host06 от неизвестного узла для stonith-api.xxxx640@host04: Произошла ошибка (No fence device).
13 марта 20:27:58 host04 pacemaker-controld[xxxx528]: notice: Пир host06 не был завершён (reboot) кластером от имени stonith-api.1074640@host04: No fence device.
У меня нет доступа к STONITH, но вопрос в следующем: как сообщить pacemaker, что всё вернулось в норму и больше не получать таких запросов на перезагрузку?
Bash: 13 марта 20:27:58 host04 pacemaker-fenced[xxxx524]: notice: Клиент stonith-api.1074640 хочет перезагрузить 4 с использованием любого устройства.
13 марта 20:27:58 host04 pacemaker-fenced[xxxx524]: notice: Запрос на перезагрузку пира host06.
13 марта 20:27:58 host04 pacemaker-fenced[xxxx524]: notice: Не удалось найти, кто может перезагрузить host06 с использованием любого устройства.
13 марта 20:27:58 host04 pacemaker-fenced[xxxx524]: error: Операция 'reboot' в отношении host06 от неизвестного узла для stonith-api.xxxx640@host04: Произошла ошибка (No fence device).
13 марта 20:27:58 host04 pacemaker-controld[xxxx528]: notice: Пир host06 не был завершён (reboot) кластером от имени stonith-api.1074640@host04: No fence device.
У меня нет доступа к STONITH, но вопрос в следующем: как сообщить pacemaker, что всё вернулось в норму и больше не получать таких запросов на перезагрузку?
