Информация
Услуги
  • Внедрение
  • Настройка
  • Поддержка
  • Ремонт
Контакты
Оплата
Новости
Доставка
Загрузки
Форум
Настройка
    info@proxmox.su
    +7 (495) 320-70-49
    Заказать звонок
    Аспро: ЛайтШоп
    Войти
    0 Сравнение
    0 Избранное
    0 Корзина
    Аспро: ЛайтШоп
    Войти
    0 Сравнение
    0 Избранное
    0 Корзина
    Аспро: ЛайтШоп
    Телефоны
    +7 (495) 320-70-49
    Заказать звонок
    0
    0
    0
    Аспро: ЛайтШоп
    • +7 (495) 320-70-49
      • Назад
      • Телефоны
      • +7 (495) 320-70-49
      • Заказать звонок
    • info@proxmox.su
    • Москва, Бакунинская улица, 69с1
    • Пн-Пт: 09-00 до 18-00
      Сб-Вс: выходной
    • 0 Сравнение
    • 0 Избранное
    • 0 Корзина
    Главная
    Форум
    Proxmox Виртуальная Среда
    [РЕШЕНО] Много записей в syslog "CPUx: температура пакета выше допустимого порога, тактовая частота процессора снижена"?

    Форумы: Proxmox Виртуальная Среда, Proxmox Backup Server, Proxmox Mail Gateway, Proxmox Datacenter Manager
    Поиск  Пользователи  Правила  Войти
    Страницы: 1
    RSS
    [РЕШЕНО] Много записей в syslog "CPUx: температура пакета выше допустимого порога, тактовая частота процессора снижена"?, Proxmox Виртуальная Среда
     
    n1nj4888
    Guest
    #1
    0
    24.07.2019 03:02:00
    Привет! У меня есть NUC8i5BEH (процессор Intel Core i5-8259U), и я заметил, что мой syslog Proxmox (бегущий на Proxmox PVE 6, но такая же ситуация была и на PVE 5.4) часто выводит набор критических ошибок в течение дня: Код: 23/07/2019 23:26:56 crit pve-host1.local kern kernel [292528.057261] mce: CPU2: Температура пакета выше порога, тактовая частота процессора ограничена (всего событий = 153468) 23/07/2019 23:26:56 crit pve-host1.local kern kernel [292528.057260] mce: CPU6: Температура пакета выше порога, тактовая частота процессора ограничена (всего событий = 153468) 23/07/2019 23:26:56 crit pve-host1.local kern kernel [292528.057253] mce: CPU5: Температура пакета выше порога, тактовая частота процессора ограничена (всего событий = 153468) 23/07/2019 23:26:56 crit pve-host1.local kern kernel [292528.057232] mce: CPU1: Температура пакета выше порога, тактовая частота процессора ограничена (всего событий = 153468) 23/07/2019 23:26:56 crit pve-host1.local kern kernel [292528.057231] mce: CPU0: Температура пакета выше порога, тактовая частота процессора ограничена (всего событий = 153468) 23/07/2019 23:26:56 crit pve-host1.local kern kernel [292528.057227] mce: CPU4: Температура пакета выше порога, тактовая частота процессора ограничена (всего событий = 153468) 23/07/2019 23:26:56 crit pve-host1.local kern kernel [292528.057226] mce: CPU3: Температура пакета выше порога, тактовая частота процессора ограничена (всего событий = 153468) 23/07/2019 23:26:56 crit pve-host1.local kern kernel [292528.057206] mce: CPU7: Температура пакета выше порога, тактовая частота процессора ограничена (всего событий = 153468) 23/07/2019 23:26:56 crit pve-host1.local kern kernel [292528.057205] mce: CPU4: Температура ядра выше порога, тактовая частота процессора ограничена (всего событий = 139201) 23/07/2019 23:26:56 crit pve-host1.local kern kernel [292528.057204] mce: CPU0: Температура ядра выше порога, тактовая частота процессора ограничена (всего событий = 139201) ... А немного позже (в основном в ту же секунду) появляется следующий набор сообщений, указывающий, что температура вернулась в норму? Код: 23/07/2019 23:26:56 Информация pve-host1.local kern kernel [292528.058260] mce: CPU6: Температура/скорость пакета нормальные 23/07/2019 23:26:56 Информация pve-host1.local kern kernel [292528.058260] mce: CPU2: Температура/скорость пакета нормальные 23/07/2019 23:26:56 Информация pve-host1.local kern kernel [292528.058258] mce: CPU5: Температура/скорость пакета нормальные 23/07/2019 23:26:56 Информация pve-host1.local kern kernel [292528.058258] mce: CPU1: Температура/скорость пакета нормальные 23/07/2019 23:26:56 Информация pve-host1.local kern kernel [292528.058229] mce: CPU0: Температура/скорость пакета нормальные 23/07/2019 23:26:56 Информация pve-host1.local kern kernel [292528.058227] mce: CPU4: Температура/скорость пакета нормальные 23/07/2019 23:26:56 Информация pve-host1.local kern kernel [292528.058226] mce: CPU3: Температура/скорость пакета нормальные 23/07/2019 23:26:56 Информация pve-host1.local kern kernel [292528.058226] mce: CPU7: Температура/скорость пакета нормальные 23/07/2019 23:26:56 Информация pve-host1.local kern kernel [292528.058225] mce: CPU4: Температура/скорость ядра нормальные 23/07/2019 23:26:56 Информация pve-host1.local kern kernel [292528.058224] mce: CPU0: Температура/скорость ядра нормальные Этот набор сообщений о превышении пороговой температуры/возвращении к норме был выведен в журнал 40 раз вчера, но поскольку я следил за температурой процессора сервера каждую минуту через SNMP, я вижу, что минимальная, максимальная и средняя температуры были следующими вчера и должны указывать на то, что сервер не перегревается, по крайней мере, не в тот момент, когда производится считывание SNMP... Мин: 42C Макс: 57C Среднее: 45C У меня есть второй узел (менее мощный NUC7PJYH), у которого такой же температурный профиль, и я не вижу тех же ошибок на этом узле, так что я думаю, что ошибки либо ложные срабатывания, либо есть какая-то настройка, которая устанавливает порог температуры слишком низко. Есть идеи (A) Что контролирует эти сообщения, выводимые в syslog, и (B) Где я могу настроить "пороговые значения", которые, по всей видимости, используются? Спасибо!
     
     
     
    Alwin
    Guest
    #2
    0
    05.09.2019 17:13:00
    Возможно, что значения, полученные ядром, неверны, или же работает турбо и вызывает сообщения. Ограничение максимальной температуры в BIOS должно остановить ПК в любом случае.
     
     
     
    n1nj4888
    Guest
    #3
    0
    07.09.2019 11:12:00
    Я в итоге начал следить за температурами пакета0 с помощью grafana /snmp, и они оказались выше того, что я ожидал как "нормальное"... Поэтому я открыл обращение в службу поддержки Intel, которую выяснила, что это аппаратная неисправность моего конкретного NUC и заменила устройство. Замененный NUC (та же модель) не проявляет такого же поведения, так что это можно считать РЕШЕННЫМ - Аппаратная проблема... Спасибо!
     
     
     
    luckman212
    Guest
    #4
    0
    05.02.2020 05:09:00
    звучит как довольно классное решение. не мог бы ты поделиться, как ты это делаешь? графана работает как виртуальная машина на самом хосте или это с какого-то внешнего сервера?
     
     
     
    n1nj4888
    Guest
    #5
    0
    05.02.2020 05:53:00
    У меня Docker работает внутри виртуальной машины на кластере PVE. Внутри Docker запущены контейнеры TIG (Telegraf, InfluxDB и Grafana). Я установил SNMP-сервер на все физические хосты PVE и использую Telegraf (виртуальная машина Docker) для опроса хостов PVE на предмет общих метрик CPU/Память/Диск/Сеть по SNMP, записываю соответствующие ответы метрик в InfluxDB и визуализирую их с помощью Grafana... В дополнение я также настроил сервер внешних метрик PVE на хостах PVE для записи своих собственных "метрик PVE" в тот же экземпляр InfluxDB (хотя в другую таблицу в Influx)... Все важные и полезные метрики затем визуализируются в Grafana с помощью пользовательского дашборда, который я построил в основном из шаблонов (включая PVE VM/LXC) на сайте дашбордов Grafana.
     
     
     
    luckman212
    Guest
    #6
    0
    05.02.2020 15:27:00
    Спасибо @n1nj4888 - я собираюсь попробовать это сделать...
     
     
     
    Страницы: 1
    Читают тему
    +7 (495) 320-70-49
    info@proxmox.su

    Конфиденциальность Оферта
    © 2026 Proxmox.su
    Главная Каталог 0 Корзина 0 Избранные Кабинет 0 Сравнение Акции Контакты Услуги Бренды Отзывы Компания Лицензии Документы Реквизиты Поиск Блог Обзоры