+7 (495) 320-70-49
- Назад
- Телефоны
- +7 (495) 320-70-49
- Заказать звонок
info@proxmox.su
Москва, Бакунинская улица, 69с1
Пн-Пт: 09-00 до 18-00
Сб-Вс: выходной

RSS

PVE падает при запуске виртуальных машин, потому что не проверяет свободную память хоста перед запуском ВМ., Proxmox Виртуальная Среда

Larion

Guest

20.04.2021 13:11:00

Я перешёл с Hyper-V и сейчас тестирую Proxmox для боевого окружения. Обнаружил серьёзную проблему в том, как PVE управляет памятью хоста и гостя, из-за чего виртуалки падают:

Тестовый сценарий 1: Один хост с 128 ГБ ОЗУ. На хосте 2 Windows 10 ВМ с выделенной памятью по 96 ГБ каждая, обе в выключенном состоянии. Запускаю VM1 — без проблем. Память хоста: выделено 100 ГБ, свободно ~20 ГБ. Запускаю VM2 — PVE никак не проверяет, сколько памяти осталось на хосте. VM2 запускается, а VM1 падает! Это нормально? Почему VM2 вообще разрешили стартовать?

----------------------------------------------------

Тестовый сценарий 2: кластер Proxmox из 3 нод (каждая с 128 ГБ ОЗУ) с Ceph, гиперконвергентная HA-группа, все ноды настроены по умолчанию (без приоритетов между нодами, max restart & relocate = 1), все ВМ — Windows 10.

Нода 1: VM1 с 96 ГБ памяти запущена, на ноде свободно ~20 ГБ
Нода 2: VM2 с 96 ГБ памяти запущена, на ноде свободно ~20 ГБ
Нода 3: VM3 с 96 ГБ памяти запущена, на ноде свободно ~20 ГБ

Выключаю питание ноды 1, чтобы проверить поведение миграции.
Результат: VM1 мигрирует на ноду 2 и запускается там, где уже работает VM2. Вследствие этого VM2 падает, потому что её память выделена VM1! VM2 перезапускается (из-за настроек HA-группы), VM1 падает! Затем VM1 тоже перезапускается, снова падает VM2, и так по кругу! Это нормально? Почему VM1, которая мигрировала, разрешена к запуску в таком состоянии? Как это предотвратить?

----------------------------------------------------

Это огромная проблема... Почему Proxmox не проверяет свободную память хоста перед стартом ВМ? Другие гипервизоры делают это! Есть ли у меня где-то какой-то параметр, который я пропустил? Это в списке приоритетов разработки? Потому что так точно должно быть…

MiguelLTS

Guest

19.09.2021 22:43:00

Вообще я не люблю воскресать старые темы, но у меня примерно такая же ситуация, как и у Лариона, и этот топик как раз про то, что меня тоже интересовало. Единственное отличие — я с VMware, но суть та же. Есть ли баг-репорт или какой-то статус по вашей «более общей» идее выключать последнюю запущенную ВМ вместо старых? С точки зрения удобства для пользователя, либо не давайте мне запускать 8Гб ВМ при наличии всего 2Гб на хосте, либо предлагайте запустить её на другом хосте (если в кластере), либо выключайте именно *эту* ВМ, а не старые. Если такой системы нет, я с радостью могу отправить заявку для отслеживания, но проблема в том, что кто-то может быстро нажать кнопку *START*, не подумав и не подсчитав, после чего начнут неожиданно отключаться случайные ВМ. А если при этом убитые ВМ настроены на HA, тогда начинается настоящее веселье...

t.lamprecht Guest	#3 0 20.09.2021 08:11:00 Есть https://bugzilla.proxmox.com/show_bug.cgi?id=2932, который я только что обновил, добавив ссылку на эту ветку и направление решения, которое я имел в виду.

sdet00

Guest

20.07.2022 07:16:00

Хотя эта тема уже старая, хочу вставить свои пять копеек — у меня была такая же проблема. Мой пример чуть более реалистичный — у меня есть облачный хост с Proxmox и 4 ГБ оперативки, на котором работают простые VPN-сервисы. Обычно загружено около 60% памяти, а самая большая виртуалка использует примерно 400 МБ. Один из коллег скопировал несколько виртуалок для апгрейда. К сожалению, он по ошибке назначил виртуальной машине 2 ГБ (значение по умолчанию) вместо 512 МБ, и в разгар дня у хоста случился крах, отключив всю команду. Поскольку у нас BTRFS RAID 1 и нет свопа, всё упало и пришлось жестко перезагружать. Было бы здорово, если бы можно было просто проверить, не сломается ли хост при запуске виртуалки.

run

Guest

23.10.2025 12:11:00

Прошло уже 4,5 года. Существует ли какое-то общественно признанное решение этой проблемы? GPT предлагает либо установить в cgroup MemoryMax для pve-qemu.slice (что, насколько я понимаю, на самом деле не останавливает OOM killer), либо использовать пользовательский скрипт-хук, который проверяет свободную память перед запуском или созданием виртуальных машин. Прежде чем пробовать эти варианты, просто интересно, есть ли проверенное или широко используемое решение, на которое люди обычно полагаются?

LnxBil

Guest

23.10.2025 17:54:00

Кроме таких очевидных вещей, как «не выделяй слишком много ресурсов» или «следи за состоянием», больше ничего не приходит в голову. Единственное, что я могу посоветовать — использовать hugepages везде. Если их не будет, виртуальная машина просто не запустится.

PwrBank Guest	#7 0 23.10.2025 19:47:00 Используйте ballooning-память, чтобы виртуальная машина всегда использовала 100% выделенной ей оперативной памяти. Прошло уже очень много времени с тех пор, как мне действительно удалось полностью загрузить узел. Даже при 24 ГБ оперативки можно запустить довольно много виртуальных машин с включённым ballooning.

Читают тему

Главная Каталог 0 Корзина 0 Избранные Кабинет 0 Сравнение Акции Контакты Услуги Бренды Отзывы Компания Лицензии Документы Реквизиты Поиск Блог Обзоры