Привет, у нас есть VE-кластер с 5 серверами, все серверы: Supermicro Server CSE-819U 2x 14-Core Xeon E5-2690 v4 2,6GHz 128GB 9361-8i prox1 до prox5 имеют одинаковую сетевую конфигурацию 192.168.1.150-154 (adminnet).
На каждом сервере работает 2-3 ВМ с локальным ZFS хранилищем, есть общее хранилище и 3 сервера резервного копирования в кластере. Общее хранилище находится в одной сети, серверы резервного копирования - в той же.
Странно, что кластер работает не очень хорошо с 5 серверами онлайн, потому что prox2 отключается. - smartdog отключает prox2, - prox2 снова запускается, но не подключается к кластеру. В кластере я вижу, что prox2 оффлайн, мне приходится хард-ресетить сервер.
Мы заменили оборудование на prox2, включая сетевую карту и материнскую плату. После того, как мы заменили все оборудование, сервер работал в автономном режиме с Proxmox и тестовой ВМ без проблем. Теперь, спустя 10 дней, мы добавили prox2 в кластер, и он отключается почти через час. Когда мы удаляем сервер из кластера, все работает без проблем.
Разница между prox2 и остальными серверами в том, что prox2 был свежеустановлен с версии 8.2 и обновлен до 8.3, а остальные серверы установлены с версии 8.0 и обновлены до 8.4.
Внутренняя сеть - 10Gbit сеть. HA активирована почти на всех ВМ. Все установки Proxmox программного обеспечения стандартные и сейчас работают на версии 8.4.
Какие есть идеи, что происходит?
На каждом сервере работает 2-3 ВМ с локальным ZFS хранилищем, есть общее хранилище и 3 сервера резервного копирования в кластере. Общее хранилище находится в одной сети, серверы резервного копирования - в той же.
Странно, что кластер работает не очень хорошо с 5 серверами онлайн, потому что prox2 отключается. - smartdog отключает prox2, - prox2 снова запускается, но не подключается к кластеру. В кластере я вижу, что prox2 оффлайн, мне приходится хард-ресетить сервер.
Мы заменили оборудование на prox2, включая сетевую карту и материнскую плату. После того, как мы заменили все оборудование, сервер работал в автономном режиме с Proxmox и тестовой ВМ без проблем. Теперь, спустя 10 дней, мы добавили prox2 в кластер, и он отключается почти через час. Когда мы удаляем сервер из кластера, все работает без проблем.
Разница между prox2 и остальными серверами в том, что prox2 был свежеустановлен с версии 8.2 и обновлен до 8.3, а остальные серверы установлены с версии 8.0 и обновлены до 8.4.
Внутренняя сеть - 10Gbit сеть. HA активирована почти на всех ВМ. Все установки Proxmox программного обеспечения стандартные и сейчас работают на версии 8.4.
Какие есть идеи, что происходит?
