Информация
Услуги
  • Внедрение
  • Настройка
  • Поддержка
  • Ремонт
Контакты
Оплата
Новости
Доставка
Загрузки
Форум
Настройка
    info@proxmox.su
    +7 (495) 320-70-49
    Заказать звонок
    Аспро: ЛайтШоп
    Войти
    0 Сравнение
    0 Избранное
    0 Корзина
    Аспро: ЛайтШоп
    Войти
    0 Сравнение
    0 Избранное
    0 Корзина
    Аспро: ЛайтШоп
    Телефоны
    +7 (495) 320-70-49
    Заказать звонок
    0
    0
    0
    Аспро: ЛайтШоп
    • +7 (495) 320-70-49
      • Назад
      • Телефоны
      • +7 (495) 320-70-49
      • Заказать звонок
    • info@proxmox.su
    • Москва, Бакунинская улица, 69с1
    • Пн-Пт: 09-00 до 18-00
      Сб-Вс: выходной
    • 0 Сравнение
    • 0 Избранное
    • 0 Корзина
    Главная
    Форум
    Proxmox Виртуальная Среда
    Proxmox 4. Узлы кластера светятся красным :(

    Форумы: Proxmox Виртуальная Среда, Proxmox Backup Server, Proxmox Mail Gateway, Proxmox Datacenter Manager
    Поиск  Пользователи  Правила  Войти
    Страницы: 1
    RSS
    Proxmox 4. Узлы кластера светятся красным :(, Proxmox Виртуальная Среда
     
    nandex
    Guest
    #1
    0
    17.02.2016 14:37:00
    # cat /etc/pve/.members  
    {  
     "nodename": "node-01",  
     "version": 4,  
     "cluster": {  
       "name": "cluster",  
       "version": 9,  
       "nodes": 6,  
       "quorate": 1  
     },  
     "nodelist": {  
       "node-01": {  
         "id": 1,  
         "online": 1,  
         "ip": "X.X.X.X"  
       },  
       "node-02": {  
         "id": 2,  
         "online": 0  
       },  
       "node-03": {  
         "id": 3,  
         "online": 0  
       },  
       "node-04": {  
         "id": 4,  
         "online": 0  
       },  
       "node-05": {  
         "id": 5,  
         "online": 0  
       }  
     }  
    }  
    pve-manager/4.1-13/cfb599fb (запущенное ядро: 4.2.6-1-pve)  
    Я попробую выполнить "pvecm updatecerts --force" и "pvecm add master --force", но ничего не происходит, узлы остаются красными.
     
     
     
    mateusz
    Guest
    #2
    0
    04.03.2016 12:59:00
    Привет, у меня похожая проблема. У нас есть два кластера PVE — dev и production. Кластеры подключены к одним и тем же коммутаторам, но в разных IP-сетях и без VLAN. Вчера я обновил dev-кластер с PVE 3.4 до 4.1. Процедура из wiki PVE прошла без проблем, но через несколько минут dev-кластер потерял кворум. Я не могу его запустить. До обновления всё работало отлично. Хуже всего то, что я понял через несколько часов после обновления, что production-кластер тоже потерял кворум. В /var/log/cluster/corosync.log (production-кластер версии 3.4) — в приложении. Можете объяснить, почему dev-кластер повлиял на production? Как можно восстановить кворум production-кластера? Сейчас dev-кластер выключен, а production работает без кворума (только для чтения в /etc/pve/), но все виртуальные машины запущены. С уважением, Mateusz
     
     
     
    t.lamprecht
    Guest
    #3
    0
    04.03.2016 13:47:00
    Похоже, ты серьезно напортачил с конфигурацией corosync? По крайней мере, сейчас это выглядит именно так. Коллизии должны возникать здесь, я запускаю несколько кластеров версии 3.4 и 4.X в одной сети (виртуально через мосты и по реальным каналам). Ты проверил: перепроверь конфигурацию коммутаторов, чтобы исключить их как источник проблемы. Ты создавал кластер заново с помощью инструмента pvecm? С уникальным именем кластера? Можешь выложить конфиг corosync, лучше сразу с обоих кластеров, если есть возможность. И на продакшене можно перезапустить службы corosync и pve-cluster на всех узлах — это должно вернуть кворум. Пока что — не очень, если с сетью всё в порядке, возможно, где-то упустил шаг, без обид. Но, пожалуйста, выложи конфиги corosync, может, там что-то подозрительное найдём:  
    Код:  
    # для dev-кластера 4.X  
    cat /etc/pve/corosync.conf  
    # для версии 3.4  
    cat /etc/pve/cluster.conf  
    cman_tool status
     
     
     
    mateusz
    Guest
    #4
    0
    04.03.2016 14:00:00
    Вероятно, IGMP Snooping отключен. Сейчас я это проверяю. Девелоперский кластер был пересоздан через pvecm. Кластеры имеют уникальные имена ('backup' и 'c01'). Стоит ли перезапускать по очереди, начиная с первого узла?  
    /etc/pve/cluster.conf из кластера 3.4  
    Код:  
    <?xml version="1.0"?>  
    <cluster name="c01" config_version="8">  

     <cman keyfile="/var/lib/pve-cluster/corosync.authkey">  
     </cman>  

     <clusternodes>  
     <clusternode name="kvm12" votes="1" nodeid="1"/>  
     <clusternode name="kvm27" votes="1" nodeid="2"/>  
     <clusternode name="kvm17" votes="1" nodeid="3"/>  
     <clusternode name="kvm37" votes="1" nodeid="4"/>  
     <clusternode name="kvm32" votes="1" nodeid="5"/>  
     <clusternode name="kvm22" votes="1" nodeid="6"/>  
     </clusternodes>  

    </cluster>  
    /etc/pve/corosync.conf опубликую позже, так как серверы сейчас выключены.
     
     
     
    t.lamprecht
    Guest
    #5
    0
    04.03.2016 14:22:00
    Поскольку сейчас у вас нет кворума, это особо не важно (может только улучшиться, надеюсь), но да, это было бы хорошо. Конфигурация выглядит нормально (мне не очень нравится corosync 1/cman, потому что там непонятно, что происходит и как всё настроено). Команда: cman_tool status тоже была бы кстати, особенно после перезапуска сервисов.
     
     
     
    mateusz
    Guest
    #6
    0
    06.03.2016 12:21:00
    Привет! Сегодня я выключил все серверы Proxmox, а потом включал их по очереди. Каждый сервер подключается к кластеру и работает, но только минут 10, а потом кворум падает. Сейчас глобально включен IGMP Snooping, кластерный интерфейс выключается. В приложении лог corosync.

    Код: pvecm status  
    Версия: 6.2.0  
    Версия конфига: 8  
    Имя кластера: c01  
    ID кластера: 541  
    Член кластера: Да  
    Поколение кластера: 5764  
    Статус членства: член кластера  
    Узлы: 1  
    Ожидаемые голоса: 6  
    Всего голосов: 1  
    Голоса узла: 1  
    Кворум: 4, блокировка активности  
    Активные подсистемы: 1  
    Флаги:  
    Закреплённые порты: 0  
    Имя узла: kvm12  
    ID узла: 1  
    Мультикаст адреса: 239.192.2.31  
    Адреса узла: 10.20.8.12  

    pvecm nodes  
    Узел  Ст  Inc  Подключён           Имя  
     1    M  5548  2016-03-06 10:19:25  kvm12  
     2    X  5668                      kvm27  
     3    X  5668                      kvm17  
     4    X  5668                      kvm37  
     5    X  5668                      kvm32  
     6    X  5668                      kvm22
     
     
     
    t.lamprecht
    Guest
    #7
    0
    07.03.2016 07:04:00
    Ты пробовал и проверял рекомендации из: https://pve.proxmox.com/wiki/Troubleshooting_multicast,_quorum_and_cluster_issues? Также стоит глянуть первые сообщения в этой теме: https://forum.proxmox.com/threads/howto-fix-corosync-totem-retransmit-list-errors.23795/. У меня складывается ощущение, что проблема в коммутаторе, но не уверен. Тяжело сказать только по одному логу corosync с одного узла.
     
     
     
    mateusz
    Guest
    #8
    0
    07.03.2016 16:04:00
    Спасибо за эту информацию. В воскресенье я перевёл dev-кластер в VLAN 2000, но это не помогло. Прочитав ссылки, я включил IGMP L2-general-querier, и теперь кворум есть на каждом кластере. К сожалению, omping не работает (и до, и после изменения функции L2 querier), хотя, как мне кажется, должен работать. Сейчас в конфигурации коммутатора у меня такие настройки:

    Код:  
    Switch on-off IGMP snooping: Включено  
    IGMP Snooping VLAN Config: VID2000 - Включено  
    IGMP Snooping Configuration:  
    – vlan 2000  
     – Immediate leave configuration – Отключено  
     – L2-general-querier configuration – Включено  
     – Group number – 50  
     – Source table number – 40  

    IGMP snooping mrouter port configuration:  
    – vlan 2000  
     – VLAN ID 2000  
     – Mrouter port – нет  
     – MRouter port alive time – 255  

    IGMP snooping query configuration:  
    – vlan 2000  
     – VLAN ID – 2000  
     – Query-Interval – 125  
     – Query-mrsp configuration – 10  
     – Query-robustness configuration – 2  
     – Suppression-query-time configuration – 255  

    Некоторые из этих значений — настройки по умолчанию на моём коммутаторе (DCN DCRS-5750). Есть ли в этом ошибка или нужно настроить что-то ещё? И ещё один вопрос: почему это работало два года, а вдруг перестало после обновления одного из кластеров до PVE 4.1? Ещё раз огромное спасибо за помощь. С наилучшими пожеланиями!
     
     
     
    Страницы: 1
    Читают тему
    +7 (495) 320-70-49
    info@proxmox.su

    Конфиденциальность Оферта
    © 2026 Proxmox.su
    Главная Каталог 0 Корзина 0 Избранные Кабинет 0 Сравнение Акции Контакты Услуги Бренды Отзывы Компания Лицензии Документы Реквизиты Поиск Блог Обзоры