Информация
Услуги
  • Внедрение
  • Настройка
  • Поддержка
  • Ремонт
Контакты
Оплата
Новости
Доставка
Загрузки
Форум
Настройка
    info@proxmox.su
    +7 (495) 320-70-49
    Заказать звонок
    Аспро: ЛайтШоп
    Войти
    0 Сравнение
    0 Избранное
    0 Корзина
    Аспро: ЛайтШоп
    Войти
    0 Сравнение
    0 Избранное
    0 Корзина
    Аспро: ЛайтШоп
    Телефоны
    +7 (495) 320-70-49
    Заказать звонок
    0
    0
    0
    Аспро: ЛайтШоп
    • +7 (495) 320-70-49
      • Назад
      • Телефоны
      • +7 (495) 320-70-49
      • Заказать звонок
    • info@proxmox.su
    • Москва, Бакунинская улица, 69с1
    • Пн-Пт: 09-00 до 18-00
      Сб-Вс: выходной
    • 0 Сравнение
    • 0 Избранное
    • 0 Корзина
    Главная
    Форум
    Proxmox Виртуальная Среда
    Случайная задача репликации '110-0' сначала упала, потом заработала, потом опять упала… И так по кругу.

    Форумы: Proxmox Виртуальная Среда, Proxmox Backup Server, Proxmox Mail Gateway, Proxmox Datacenter Manager
    Поиск  Пользователи  Правила  Войти
    Страницы: 1
    RSS
    Случайная задача репликации '110-0' сначала упала, потом заработала, потом опять упала… И так по кругу., Proxmox Виртуальная Среда
     
    drjaymz@
    Guest
    #1
    0
    17.03.2025 10:29:00
    Я начал замечать все больше и больше ошибок "не удалось выполнить задание репликации". К тому моменту, когда я до них добираюсь, проблема уже исчезла, и я не могу найти разумный лог, чтобы понять, что произошло. Я бы предположил, что конфигурация не ошибочна сама по себе, иначе бы она не работала большую часть времени. Я получаю кучу писем для различных гостевых контейнеров или ВМ примерно в одно и то же время. Моя репликация идет по выделенной сети, показанной ниже на подсети 200. Это просто коммутатор с 6 машинами (5 PVE и 1 PBS) и больше ничего. Я мог бы предположить, что это какой-то неисправный коммутатор, но это не только один сайт, это начинает "заражать" два других. Код: Задание репликации '110-0' с целевым сервером 'proxmoxmon1' и расписанием '09/15' завершилось неудачей!

    Последняя успешная синхронизация: 2025-03-17 08:24:52
    Следующая попытка синхронизации: 2025-03-17 08:44:00
    Количество сбоев: 1

    Ошибка:
    команда '/usr/bin/ssh -e none -o 'BatchMode=yes' -o 'HostKeyAlias=proxmoxmon1' -o 'UserKnownHostsFile=/etc/pve/nodes/proxmoxmon1/ssh_known_hos­ts' -o 'GlobalKnownHostsFile=none' root@192.168.200.6 -- pvesr prepare-local-job 110-0 --scan local-zfs local-zfs:subvol-110-disk-0 --last_sync 1742199892' завершилась неудачей: код выхода 255. Я изменил расписания репликации, чтобы распределить их по времени, но это не дало никакого эффекта. Я проверил все гостевые машины, у которых была проблема, и к тому моменту, когда я до них добираюсь, они работают, и репликация занимает всего 1-2 секунды, так что, насколько я вижу, нет конфликтов. Я использую 8.3.2, и они были обновлены не так давно. Я спрашиваю, как мне узнать, в чем проблема? Возможно, связано с https://forum.proxmox.com/threads/random-zfs-replication-errors.82486/ Тот же симптом, но, похоже, это не применимо. Не очень удобно, что логи не сохраняются.
     
     
     
    drjaymz@
    Guest
    #2
    0
    18.03.2025 16:57:00
    Я посмотрел. Видел один-два Mar 09 07:15:09 proxmoxmon3 sshd[2062129]: fatal: ssh_packet_send_debug: send DEBUG: Connection reset by peer Mar 10 08:30:13 proxmoxmon3 sshd[335445]: fatal: ssh_packet_send_debug: send DEBUG: Connection reset by peer Mar 11 21:45:06 proxmoxmon3 sshd[4001944]: fatal: ssh_packet_send_debug: send DEBUG: Connection reset by peer Mar 13 00:15:09 proxmoxmon3 sshd[2446943]: fatal: ssh_packet_send_debug: send DEBUG: Connection reset by peer Mar 16 16:18:15 proxmoxmon3 sshd[3172737]: fatal: ssh_packet_send_debug: send DEBUG: Connection reset by peer Это, похоже, не совпадает с ошибками репликации и, возможно, не связано. Кажется, это проблема с сетью, но она исчезла после перезагрузки сервера. Прошло еще 30 часов, и это не повторилось.
     
     
     
    ghusson
    Guest
    #3
    0
    18.03.2025 16:59:00
    Ок. Возможно, это связано с сетевой проблемой. Вы отслеживаете состояние интерфейсов и пропускную способность?
     
     
     
    drjaymz@
    Guest
    #4
    0
    19.03.2025 09:18:00
    Да, проблем с интерфейсом не было – иногда, когда всё идёт наперекосяк, можно увидеть, как интерфейсы падают и поднимаются, но в данном случае все интерфейсы не менялись. Ещё раз, физическая сеть тут ни при чём, скорее что-то в сетевом стеке Proxmox, потому что ничего не менялось, впрочем, я даже физически к серверам не подходил, просто перезагрузил, и всё стало нормально. В этом кластере 5 серверов, выделенная сеть и подсеть для репликации, и сервер номер 4 вышел из строя как раз перед тем, как у нас начались проблемы – похоже на неисправность материнской платы. Система отсадила 4 ВМ и попыталась перенести их на узел 1, но не смогла, потому что у узла 1 не было базового образа (хотя он там и был). После того, как сервер номер 4 вышел из строя, я обнаружил, что у узла 3 есть полный набор реплицированных образов, и я вернул их в строй – так что мы снова заработали всего через несколько минут после сбоя, но отказоустойчивый failover не сработал. Затем ВМ, которых я запустил на узле 3, начали периодически испытывать проблемы с репликацией. Этого удалось добиться перезагрузкой узлов 1 и 3. Моя теория (доказательства которой, вероятно, уже потеряны) заключалась в том, что, возможно, сбой сервера номер 4 оставил какие-то "висячие" соединения, и где-то был лимит на количество соединений, который он постоянно превышал. Это, конечно, очищается перезагрузкой – хотя если бы я знал, что это было, я бы просто перезагрузил соответствующую вещь. Твоё предположение про SSH было неплохим, скорее всего, это что-то подобное.
     
     
     
    ghusson
    Guest
    #5
    0
    19.03.2025 09:33:00
    Окей. Рад, что помог. Странная же проблема, в любом случае.
     
     
     
    drjaymz@
    Guest
    #6
    0
    18.03.2025 09:17:00
    Перезапустил два узла, у которых больше всего были проблемы, во время обновления до 8.3.5. Проблема пока не повторилась. Отпишусь через несколько дней. Так что, пока что ответа на вопрос, в чем была причина, нет.
     
     
     
    ghusson
    Guest
    #7
    0
    18.03.2025 09:43:00
    Привет, у меня была подобная проблема. Это был openssh-server, который перестал принимать SSH-соединения как мера безопасности. Можно посмотреть логи, может, там ssh-сервер что-то пишет?
     
     
     
    Страницы: 1
    Читают тему
    +7 (495) 320-70-49
    info@proxmox.su

    Конфиденциальность Оферта
    © 2026 Proxmox.su
    Главная Каталог 0 Корзина 0 Избранные Кабинет 0 Сравнение Акции Контакты Услуги Бренды Отзывы Компания Лицензии Документы Реквизиты Поиск Блог Обзоры