Кластер из трех узлов, в целом обновлён: обновил первый сервер srv1 после миграции всех ВМ на srv2, перезагрузил srv1... неплохо. Во время миграции всех ВМ с srv2 на srv1 я поторопился и уже запустил `apt upgrade`. Теперь кажется, что миграция ВМ идёт или не идёт... по крайней мере, ничего не происходит. ВМ работают. Я убил apt/dpkg (да, стоило этого избежать...), и запустил: Bash: root@srv2:~# dpkg --configure -a
Setting up pve-ha-manager (4.0.7) ...
watchdog-mux.service — отключенная или статичная служба, не запускаю её. Она там посидела, и теперь выглядит хорошо: Bash: # pvecm status
Информация о кластере
-------------------
Имя: xyz
Версия конфигурации: 11
Транспорт: knet
Безопасная аутентификация: включена
Информация о кворуме
------------------
Дата: вт апр 15 10:04:43 2025
Поставщик кворума: corosync_votequorum
Узлы: 3
ID узла: 0x00000005
Ring ID: 4.1e0
Кворум: Да
Информация о голосование кворума
----------------------
Ожидаемые голоса: 3
Наибольшее ожидаемое: 3
Общее количество голосов: 3
Кворум: 2
Флаги: Кворум
Информация о членстве
----------------------
Nodeid Голоса Имя
0x00000004 1 172.31.31.201
0x00000005 1 172.31.31.202 (local)
0x00000006 1 172.31.31.203
# ha-manager status
кворум ОК
master srv1 (активен, вт апр 15 10:03:29 2025)
lrm srv1 (активен, вт апр 15 10:03:30 2025)
lrm srv2 (режим перезапуска, вт апр 15 10:03:30 2025)
lrm srv3 (активен, вт апр 15 10:03:31 2025)
service ct:107 (srv1, остановлен)
service ct:109 (srv1, остановлен)
service vm:100 (srv1, остановлен)
service vm:103 (srv2, завис)
service vm:108 (srv2, миграция)
service vm:110 (srv3, запущен)
service vm:111 (srv3, запущен)
[..] Но двигаться не двигается
... Например, я попробовал выключить остановку ВМ 103... ничего не происходит. Что здесь делать? Спасибо за подсказки. Мой оборонительный подход — подождать вечера и перезагрузить этот узел... (когда клиенты не обращаются к своим ВМ)
Setting up pve-ha-manager (4.0.7) ...
watchdog-mux.service — отключенная или статичная служба, не запускаю её. Она там посидела, и теперь выглядит хорошо: Bash: # pvecm status
Информация о кластере
-------------------
Имя: xyz
Версия конфигурации: 11
Транспорт: knet
Безопасная аутентификация: включена
Информация о кворуме
------------------
Дата: вт апр 15 10:04:43 2025
Поставщик кворума: corosync_votequorum
Узлы: 3
ID узла: 0x00000005
Ring ID: 4.1e0
Кворум: Да
Информация о голосование кворума
----------------------
Ожидаемые голоса: 3
Наибольшее ожидаемое: 3
Общее количество голосов: 3
Кворум: 2
Флаги: Кворум
Информация о членстве
----------------------
Nodeid Голоса Имя
0x00000004 1 172.31.31.201
0x00000005 1 172.31.31.202 (local)
0x00000006 1 172.31.31.203
# ha-manager status
кворум ОК
master srv1 (активен, вт апр 15 10:03:29 2025)
lrm srv1 (активен, вт апр 15 10:03:30 2025)
lrm srv2 (режим перезапуска, вт апр 15 10:03:30 2025)
lrm srv3 (активен, вт апр 15 10:03:31 2025)
service ct:107 (srv1, остановлен)
service ct:109 (srv1, остановлен)
service vm:100 (srv1, остановлен)
service vm:103 (srv2, завис)
service vm:108 (srv2, миграция)
service vm:110 (srv3, запущен)
service vm:111 (srv3, запущен)
[..] Но двигаться не двигается
... Например, я попробовал выключить остановку ВМ 103... ничего не происходит. Что здесь делать? Спасибо за подсказки. Мой оборонительный подход — подождать вечера и перезагрузить этот узел... (когда клиенты не обращаются к своим ВМ)