Информация
Услуги
  • Внедрение
  • Настройка
  • Поддержка
  • Ремонт
Контакты
Оплата
Новости
Доставка
Загрузки
Форум
Настройка
    info@proxmox.su
    +7 (495) 320-70-49
    Заказать звонок
    Аспро: ЛайтШоп
    Войти
    0 Сравнение
    0 Избранное
    0 Корзина
    Аспро: ЛайтШоп
    Войти
    0 Сравнение
    0 Избранное
    0 Корзина
    Аспро: ЛайтШоп
    Телефоны
    +7 (495) 320-70-49
    Заказать звонок
    0
    0
    0
    Аспро: ЛайтШоп
    • +7 (495) 320-70-49
      • Назад
      • Телефоны
      • +7 (495) 320-70-49
      • Заказать звонок
    • info@proxmox.su
    • Москва, Бакунинская улица, 69с1
    • Пн-Пт: 09-00 до 18-00
      Сб-Вс: выходной
    • 0 Сравнение
    • 0 Избранное
    • 0 Корзина
    Главная
    Форум
    Proxmox Виртуальная Среда
    Proxmox Watchdog: как увеличить время обратного отсчета Хочу разобраться с таймером Watchdog в Proxmox. По умолчанию время обратного отсчета слишком маленькое, и VM постоянно перезагружаются. Есть ли способ увеличить этот период? Я пробовал править кон

    Форумы: Proxmox Виртуальная Среда, Proxmox Backup Server, Proxmox Mail Gateway, Proxmox Datacenter Manager
    Поиск  Пользователи  Правила  Войти
    Страницы: 1
    RSS
    Proxmox Watchdog: как увеличить время обратного отсчета Хочу разобраться с таймером Watchdog в Proxmox. По умолчанию время обратного отсчета слишком маленькое, и VM постоянно перезагружаются. Есть ли способ увеличить этот период? Я пробовал править кон, Proxmox Виртуальная Среда
     
    m4rek11
    Guest
    #1
    0
    19.11.2021 10:47:00
    Привет, у меня проблема со временем сброса обратного отсчета сторожевого таймера. Я включил сторожевой таймер, используя: https://pve.proxmox.com/wiki/High_Availability_with_Proxmox#Dell_IDrac_.28module_.22ipmi_watchdog.22.29. У меня установлено: WATCHDOG_MODULE=ipmi_watchdog.

    Настройки по умолчанию:

    Код:
    Watchdog Timer Use:     SMS/OS (0x44)
    Watchdog Timer Is:      Started/Running
    Watchdog Timer Actions: Power Cycle (0x03)
    Pre-timeout interval:   0 seconds
    Timer Expiration Flags: 0x00
    Initial Countdown:      10 sec
    Present Countdown:      9 sec

    Я хотел увеличить "initial countdown", и сделал это так:

    Код:
    ipmiutil wdt -a 1 -t 300

    После этого вывод:

    Код:
    ipmiutil wdt ver 3.17
    -- BMC version 2.65, IPMI version 2.0
    wdt data: 44 03 00 00 64 00 60 00
    Watchdog timer is started for use with SMS/OS. Logging
                  pretimeout is 0 seconds, pre-action is None
                  timeout is 10 seconds, counter is 9 seconds
                  action is Power cycle
    Setting watchdog timer to 300 seconds ...
    wdt data: 44 01 00 00 b8 0b b8 0b
    Watchdog timer is started for use with SMS/OS. Logging
                  pretimeout is 0 seconds, pre-action is None
                  timeout is 300 seconds, counter is 300 seconds
                  action is Hard Reset

    И командой ipmitool mc watchdog get получается:

    Код:
    Watchdog Timer Use:     SMS/OS (0x44)
    Watchdog Timer Is:      Started/Running
    Watchdog Timer Actions: Hard Reset (0x01)
    Pre-timeout interval:   0 seconds
    Timer Expiration Flags: 0x00
    Initial Countdown:      300 sec
    Present Countdown:      299 sec

    Время изменилось – это хорошо. Но после остановки сервиса watchdog-mux, обратный отсчет начинается с 10 секунд, а настройки сбрасываются обратно к 10 секундам. Так вопрос в том, как сделать увеличение времени до 300 секунд постоянным?

    С уважением,
    Марек.
     
     
     
    spirit
    Guest
    #2
    0
    19.11.2021 11:38:00
    Ты не сможешь это изменить, потому что HA перезапускает ВМ примерно через минуту. (Поэтому, если ты заставишь watchdog работать 300 секунд, ВМ может запуститься одновременно на двух нодах, что приведёт к повреждению данных.)
     
     
     
    m4rek11
    Guest
    #3
    0
    19.11.2021 15:01:00
    Спасибо за ответ.
     
     
     
    seed_7
    Guest
    #4
    0
    03.06.2025 17:43:00
    Интересно, я до сих пор гадаю, что-нибудь ли изменилось. Мои узлы перезагружаются после потери сетевого подключения.
     
     
     
    UdoB
    Guest
    #5
    0
    03.06.2025 19:45:00
    Это ожидаемое и нужное поведение для PVE-кластера с активным High-Availability. https://pve.proxmox.com/pve-docs/pve-admin-guide.html#ha_manager_fencing Есть вопросы?
     
     
     
    seed_7
    Guest
    #6
    0
    04.06.2025 18:50:00
    Да, есть. Я добавил избыточную ссылку для Corosync. Надеялся, если Link 0 упадёт, кластер сможет использовать Link 1, что должно было предотвратить перезапуск узлов сторожевым механизмом. Похоже, я ошибся, так и вышло... Есть способ это сделать? Допустим, у нас 5 узлов, Link 0 – 172.16.0.0/24, а Link 1 – 192.168.0.0/24. Высокая доступность настроена. Если Link 0 упадёт, связь всё равно должна быть возможна через Link 1, поэтому я не понимаю, зачем сторожевому механизму инициировать перезапуск.
     
     
     
    UdoB
    Guest
    #7
    0
    04.06.2025 19:53:00
    Да, именно так всё и должно работать. Разумеется, это требует, чтобы оба канала были на независимых проводах и были целыми. Посмотри на текущий статус, чтобы убедиться, вот так:
    Код: ~# corosync-cfgtool -n
    Local node ID 8, transport knet
    nodeid: 2 reachable
      LINK: 0 udp (10.3.16.8->10.3.16.9) enabled connected mtu: 1397
      LINK: 1 udp (10.11.16.8->10.11.16.9) enabled connected mtu: 1397

    nodeid: 4 reachable
      LINK: 0 udp (10.3.16.8->10.3.16.10) enabled connected mtu: 1397
      LINK: 1 udp (10.11.16.8->10.11.16.10) enabled connected mtu: 1397
    ...
    и так далее, все узлы должны отображать две строки "enabled connected" в твоём кластере, верно? Если один из этих колец (=все NIC-и на ОДНОМ канале) будет отключён, мой кластер останется онлайн. Именно так это работает у меня.
     
     
     
    seed_7
    Guest
    #8
    0
    06.06.2025 18:23:00
    Я провёл серию симуляций, и, похоже, если настроить оба соединения при создании кластера, то получаю те же результаты, что и у тебя. Однако, если добавить второе соединение после создания кластера, отредактировав файл corosync.conf, Link:1 показывает отключённым. Давай ещё раз проверю, чтобы убедиться, что я ничего не натворил. Мне нужно это настроить для продакшена, но сначала убежусь, что всё делаю правильно, а то испорчу всё.
     
     
     
    Страницы: 1
    Читают тему
    +7 (495) 320-70-49
    info@proxmox.su

    Конфиденциальность Оферта
    © 2026 Proxmox.su
    Главная Каталог 0 Корзина 0 Избранные Кабинет 0 Сравнение Акции Контакты Услуги Бренды Отзывы Компания Лицензии Документы Реквизиты Поиск Блог Обзоры