Информация
Услуги
  • Внедрение
  • Настройка
  • Поддержка
  • Ремонт
Контакты
Оплата
Новости
Доставка
Загрузки
Форум
Настройка
    info@proxmox.su
    +7 (495) 320-70-49
    Заказать звонок
    Аспро: ЛайтШоп
    Войти
    0 Сравнение
    0 Избранное
    0 Корзина
    Аспро: ЛайтШоп
    Войти
    0 Сравнение
    0 Избранное
    0 Корзина
    Аспро: ЛайтШоп
    Телефоны
    +7 (495) 320-70-49
    Заказать звонок
    0
    0
    0
    Аспро: ЛайтШоп
    • +7 (495) 320-70-49
      • Назад
      • Телефоны
      • +7 (495) 320-70-49
      • Заказать звонок
    • info@proxmox.su
    • Москва, Бакунинская улица, 69с1
    • Пн-Пт: 09-00 до 18-00
      Сб-Вс: выходной
    • 0 Сравнение
    • 0 Избранное
    • 0 Корзина
    Главная
    Форум
    Proxmox Виртуальная Среда
    [КРИТИЧНО] Огромная нагрузка на дисковую систему вызывает зависание во время резервного копирования

    Форумы: Proxmox Виртуальная Среда, Proxmox Backup Server, Proxmox Mail Gateway, Proxmox Datacenter Manager
    Поиск  Пользователи  Правила  Войти
    Страницы: 1
    RSS
    [КРИТИЧНО] Огромная нагрузка на дисковую систему вызывает зависание во время резервного копирования, Proxmox Виртуальная Среда
     
    gkovacs
    Guest
    #1
    0
    28.06.2013 03:10:00
    У нас появилась новая критическая проблема, которая стала проявляться на нескольких наших узлах PVE 3.0. Во время ночного создания снимков vzdump, вероятно при интенсивных операциях ввода-вывода с файлами внутри контейнера, весь сервер зависает в состоянии iowait. Процессы продолжают работать, но, по всей видимости, ни одна дисковая операция не завершается, средняя нагрузка поднимается до сотен. Помогает только жесткая перезагрузка (даже shutdown -rn не может успешно перезапустить сервер). Проблема стала появляться с тех пор, как мы на прошлой неделе обновились до нового ядра 2.6.32-20!

    htop показывает огромное значение kernel iowait  
    iotop не показывает операций ввода-вывода со стороны userland  
    в консоли появляются сообщения о тайм-ауте зависших задач  

    Окружение:  
    Intel Core i7, контроллер Adaptec HW RAID  
    Proxmox VE 3.0  
    Файловая система ext4, планировщик deadline  

    Код:  
    pve-manager: 3.0-23 (pve-manager/3.0/957f0862)  
    running kernel: 2.6.32-20-pve  
    proxmox-ve-2.6.32: 3.0-100  
    pve-kernel-2.6.32-20-pve: 2.6.32-100  
    pve-kernel-2.6.32-19-pve: 2.6.32-96  
    pve-kernel-2.6.32-18-pve: 2.6.32-88  
    lvm2: 2.02.95-pve3  
    clvm: 2.02.95-pve3  
    corosync-pve: 1.4.5-1  
    openais-pve: 1.1.4-3  
    libqb0: 0.11.1-2  
    redhat-cluster-pve: 3.2.0-2  
    resource-agents-pve: 3.9.2-4  
    fence-agents-pve: 4.0.0-1  
    pve-cluster: 3.0-4  
    qemu-server: 3.0-20  
    pve-firmware: 1.0-22  
    libpve-common-perl: 3.0-4  
    libpve-access-control: 3.0-4  
    libpve-storage-perl: 3.0-8  
    vncterm: 1.1-4  
    vzctl: 4.0-1pve3  
    vzprocps: 2.0.11-2  
    vzquota: 3.1-2  
    pve-qemu-kvm: 1.4-13  
    ksm-control-daemon: 1.1-1
     
     
     
    gkovacs
    Guest
    #2
    0
    16.07.2013 19:03:00
    Мы обновили прошивку RAID-контроллера Adaptec на обоих узлах до последней версии 5.2.0 Build 19109 (21 декабря 2012) пять дней назад, и с тех пор проблема не появлялась. Версии прошивки 18512 и 19076 обе выдавали эту ошибку, так что, похоже, её исправили в самой свежей сборке. Драйвер мы не трогали, всё ещё используем 1.2-1[29900]. Если проблема снова проявится, обновлю эту ветку. Спасибо за совет, Том!
     
     
     
    gkovacs
    Guest
    #3
    0
    18.07.2013 12:06:00
    К сожалению, проблема вернулась спустя 6 дней. Похоже, что обновление прошивки Adaptec снизило вероятность её появления, но полностью не устранило. Следующее, что нужно проверить — это драйвер 30200 в новом ядре PVE. Есть примерные сроки выхода стабильной версии? Мы не очень рады использовать тестовые ядра на боевых серверах.
     
     
     
    tom
    Guest
    #4
    0
    18.07.2013 12:16:00
    позже сегодня.
     
     
     
    stef1777
    Guest
    #5
    0
    18.07.2013 12:16:00
    Просто хочу сказать, что у меня такая же проблема с серверами Dell R420. У меня также есть сервер HP DL360G7 в кластере pve, и он не падает. http://forum.proxmox.com/threads/14678-General-crash-during-snaphot-backup-of-CTs Крэши происходят примерно 5 из 7 дней.
     
     
     
    e100
    Guest
    #6
    0
    01.08.2013 07:04:00
    У меня тоже такая же проблема с контроллером Areca 1880. Новый ядро помогло?
     
     
     
    gkovacs
    Guest
    #7
    0
    01.08.2013 09:11:00
    Новый ядро -107 немного помог, но, к сожалению, полностью проблему не решил. Теперь зависание происходит раз в неделю, вместо того чтобы каждую ночь. Похоже, что проблема связана с одним VE, в папке которого тысячи файлов.
     
     
     
    Страницы: 1
    Читают тему
    +7 (495) 320-70-49
    info@proxmox.su

    Конфиденциальность Оферта
    © 2026 Proxmox.su
    Главная Каталог 0 Корзина 0 Избранные Кабинет 0 Сравнение Акции Контакты Услуги Бренды Отзывы Компания Лицензии Документы Реквизиты Поиск Блог Обзоры