Привет! У меня происходит исчерпание памяти на двух из трёх узлов Proxmox в одном и том же кластере с высокой доступностью (HA). Я много искал, но не смог найти точного решения для моей ситуации, поэтому ниже привёл информацию, которую запрашивали в похожих случаях.
Чтобы исключить главное подозрение — я не использую ZFS.
arcstat показывает:
Bash: root@ovh-px-01:~# arcstat
time read ddread ddh% dmread dmh% pread ph% size c avail
16:27:44 0 0 0 0 0 0 0 2.8K 2.0G -1.2G
arc_summary -s arc показывает:
Bash: root@ovh-px-01:~# arc_summary -s arc
------------------------------------------------------------------------
Отчёт подсистемы ZFS Ср 03 сен 2025 16:32:01
Linux 6.14.11-1-pve 2.3.4-pve1
Машина: ovh-px-01 (x86_64) 2.3.4-pve1
Статус ARC:
Общий размер памяти: 62.4 ГиБ
Минимальный целевой размер: 3.1 % 2.0 ГиБ
Максимальный целевой размер: 19.2 % 12.0 ГиБ
Целевой размер (адаптивный): < 0.1 % 2.0 ГиБ
Текущий размер: < 0.1 % 2.8 КиБ
Размер свободной памяти: 860.2 МиБ
Доступная память: -1441892224 байт
Структурный разбор ARC (текущий размер): 2.8 КиБ
Сжатый размер: 0.0 % 0 байт
Размер накладных расходов: 0.0 % 0 байт
Размер бонуса: 0.0 % 0 байт
Размер dnode: 0.0 % 0 байт
Размер dbuf: 0.0 % 0 байт
Размер заголовка: 100.0 % 2.8 КиБ
Размер заголовка L2: 0.0 % 0 байт
Потери на абстрагированные блоки (ABD chunk waste):0.0 % 0 байт
Разбивка типов ARC (сжато + накладные расходы): 0 байт
Размер данных: н/д 0 байт
Размер метаданных: н/д 0 байт
Разбивка состояний ARC (сжато + накладные расходы): 0 байт
Размер анонимных данных: н/д 0 байт
Размер анонимных метаданных: н/д 0 байт
Целевой размер MFU данных: 37.5 % 0 байт
Размер MFU данных: н/д 0 байт
Размер удаляемых MFU данных: н/д 0 байт
Размер MFU «призрачных» данных: 0 байт
Целевой размер MFU метаданных: 12.5 % 0 байт
Размер MFU метаданных: н/д 0 байт
Удаляемый размер MFU метаданных: н/д 0 байт
Размер MFU «призрачных» метаданных: 0 байт
Целевой размер MRU данных: 37.5 % 0 байт
Размер MRU данных: н/д 0 байт
Удаляемый размер MRU данных: н/д 0 байт
Размер MRU «призрачных» данных: 0 байт
Целевой размер MRU метаданных: 12.5 % 0 байт
Размер MRU метаданных: н/д 0 байт
Удаляемый размер MRU метаданных: н/д 0 байт
Размер MRU «призрачных» метаданных: 0 байт
Размер неспрокэшированных данных: н/д 0 байт
Размер неспрокэшированных метаданных: н/д 0 байт
Разбивка хеша ARC:
Элементы: 0
Коллизии: 0
Максимальная длина цепочки: 0
Цепочки: 0
Прочее по ARC:
Несжатый размер: н/д 0 байт
Ограничения по памяти: 0
Прямые возвраты памяти: 0
Косвенные возвраты памяти: 0
Удалено: 0
Промахи мьютекса: 0
Пропуски при вытеснении: 0
Пропуски при вытеснении из-за записи L2: 0
Вытеснения кэша L2: 0 байт
Допустимые вытеснения L2: 0 байт
Допустимые вытеснения MFU L2: н/д 0 байт
Допустимые вытеснения MRU L2: н/д 0 байт
Недопустимые вытеснения L2: 0 байт
free -h показывает:
Bash: root@ovh-px-01:~# free -h
total used free shared buff/cache available
Mem: 62 ГиБ 61 ГиБ 789 МиБ 44 МиБ 534 МиБ 652 МиБ
Swap: 2.0 ГиБ 2.0 ГиБ 1.5 МиБ
top -co%MEM показывает:

И страница с сводкой:

Вот второй повреждённый узел:

А это статус-страница неповреждённого узла:

Команда echo 1 > /proc/sys/vm/drop_caches практически ничего не даёт.
На этом кластере работает очень мало служб:

Общий объём используемой памяти всеми ВМ едва достигает 8 ГБ на всех узлах вместе взятых.
Пожалуйста, помогите понять, что вызывает утечки памяти.
Чтобы исключить главное подозрение — я не использую ZFS.
arcstat показывает:
Bash: root@ovh-px-01:~# arcstat
time read ddread ddh% dmread dmh% pread ph% size c avail
16:27:44 0 0 0 0 0 0 0 2.8K 2.0G -1.2G
arc_summary -s arc показывает:
Bash: root@ovh-px-01:~# arc_summary -s arc
------------------------------------------------------------------------
Отчёт подсистемы ZFS Ср 03 сен 2025 16:32:01
Linux 6.14.11-1-pve 2.3.4-pve1
Машина: ovh-px-01 (x86_64) 2.3.4-pve1
Статус ARC:
Общий размер памяти: 62.4 ГиБ
Минимальный целевой размер: 3.1 % 2.0 ГиБ
Максимальный целевой размер: 19.2 % 12.0 ГиБ
Целевой размер (адаптивный): < 0.1 % 2.0 ГиБ
Текущий размер: < 0.1 % 2.8 КиБ
Размер свободной памяти: 860.2 МиБ
Доступная память: -1441892224 байт
Структурный разбор ARC (текущий размер): 2.8 КиБ
Сжатый размер: 0.0 % 0 байт
Размер накладных расходов: 0.0 % 0 байт
Размер бонуса: 0.0 % 0 байт
Размер dnode: 0.0 % 0 байт
Размер dbuf: 0.0 % 0 байт
Размер заголовка: 100.0 % 2.8 КиБ
Размер заголовка L2: 0.0 % 0 байт
Потери на абстрагированные блоки (ABD chunk waste):0.0 % 0 байт
Разбивка типов ARC (сжато + накладные расходы): 0 байт
Размер данных: н/д 0 байт
Размер метаданных: н/д 0 байт
Разбивка состояний ARC (сжато + накладные расходы): 0 байт
Размер анонимных данных: н/д 0 байт
Размер анонимных метаданных: н/д 0 байт
Целевой размер MFU данных: 37.5 % 0 байт
Размер MFU данных: н/д 0 байт
Размер удаляемых MFU данных: н/д 0 байт
Размер MFU «призрачных» данных: 0 байт
Целевой размер MFU метаданных: 12.5 % 0 байт
Размер MFU метаданных: н/д 0 байт
Удаляемый размер MFU метаданных: н/д 0 байт
Размер MFU «призрачных» метаданных: 0 байт
Целевой размер MRU данных: 37.5 % 0 байт
Размер MRU данных: н/д 0 байт
Удаляемый размер MRU данных: н/д 0 байт
Размер MRU «призрачных» данных: 0 байт
Целевой размер MRU метаданных: 12.5 % 0 байт
Размер MRU метаданных: н/д 0 байт
Удаляемый размер MRU метаданных: н/д 0 байт
Размер MRU «призрачных» метаданных: 0 байт
Размер неспрокэшированных данных: н/д 0 байт
Размер неспрокэшированных метаданных: н/д 0 байт
Разбивка хеша ARC:
Элементы: 0
Коллизии: 0
Максимальная длина цепочки: 0
Цепочки: 0
Прочее по ARC:
Несжатый размер: н/д 0 байт
Ограничения по памяти: 0
Прямые возвраты памяти: 0
Косвенные возвраты памяти: 0
Удалено: 0
Промахи мьютекса: 0
Пропуски при вытеснении: 0
Пропуски при вытеснении из-за записи L2: 0
Вытеснения кэша L2: 0 байт
Допустимые вытеснения L2: 0 байт
Допустимые вытеснения MFU L2: н/д 0 байт
Допустимые вытеснения MRU L2: н/д 0 байт
Недопустимые вытеснения L2: 0 байт
free -h показывает:
Bash: root@ovh-px-01:~# free -h
total used free shared buff/cache available
Mem: 62 ГиБ 61 ГиБ 789 МиБ 44 МиБ 534 МиБ 652 МиБ
Swap: 2.0 ГиБ 2.0 ГиБ 1.5 МиБ
top -co%MEM показывает:

И страница с сводкой:

Вот второй повреждённый узел:

А это статус-страница неповреждённого узла:

Команда echo 1 > /proc/sys/vm/drop_caches практически ничего не даёт.
На этом кластере работает очень мало служб:

Общий объём используемой памяти всеми ВМ едва достигает 8 ГБ на всех узлах вместе взятых.
Пожалуйста, помогите понять, что вызывает утечки памяти.



Заранее спасибо за дополнительную информацию.