Я несколько лет управляю кластером через L2TP/IPSEC VPN с интерфейсами управления/corosync в одной подсети по второму слою. Работало прекрасно — за исключением штормов или других сетевых сбоев между двумя площадками — до Proxmox v6. Кластер стал зависать, требуя перезапуска corosync на одном или нескольких узлах. Это происходит случайно. Иногда кластер работает целый день, иногда всего пять минут. Я проводил исследование, но так и не нашел рациональных инструкций, как уменьшить чувствительность по времени в corosync. Да, это должен быть кластер. Нет, я редко выполняю живую миграцию между площадками, но делал это. Площадка "A" находится на соединении 250Mb/250Mb, площадка "B" — на 1Gb/50Mb с другим провайдером. Время пинга обычно 35-40ms. В данный момент кластер состоит из трех хостов, всего 4 сокета/36 ядер, 256GB/48TB, работающих с 35-50 виртуальными машинами в зависимости от текущих задач. Я перезапускал corosync дважды, пока писал это сообщение. Время пинга сохранялось стабильным в течение всего времени. Единственное, что изменилось с начала проблемы — это обновление с версии 5 до 6.