Привет! У меня есть NUC8i5BEH (процессор Intel Core i5-8259U), и я заметил, что мой syslog Proxmox (бегущий на Proxmox PVE 6, но такая же ситуация была и на PVE 5.4) часто выводит набор критических ошибок в течение дня: Код: 23/07/2019 23:26:56 crit pve-host1.local kern kernel [292528.057261] mce: CPU2: Температура пакета выше порога, тактовая частота процессора ограничена (всего событий = 153468) 23/07/2019 23:26:56 crit pve-host1.local kern kernel [292528.057260] mce: CPU6: Температура пакета выше порога, тактовая частота процессора ограничена (всего событий = 153468) 23/07/2019 23:26:56 crit pve-host1.local kern kernel [292528.057253] mce: CPU5: Температура пакета выше порога, тактовая частота процессора ограничена (всего событий = 153468) 23/07/2019 23:26:56 crit pve-host1.local kern kernel [292528.057232] mce: CPU1: Температура пакета выше порога, тактовая частота процессора ограничена (всего событий = 153468) 23/07/2019 23:26:56 crit pve-host1.local kern kernel [292528.057231] mce: CPU0: Температура пакета выше порога, тактовая частота процессора ограничена (всего событий = 153468) 23/07/2019 23:26:56 crit pve-host1.local kern kernel [292528.057227] mce: CPU4: Температура пакета выше порога, тактовая частота процессора ограничена (всего событий = 153468) 23/07/2019 23:26:56 crit pve-host1.local kern kernel [292528.057226] mce: CPU3: Температура пакета выше порога, тактовая частота процессора ограничена (всего событий = 153468) 23/07/2019 23:26:56 crit pve-host1.local kern kernel [292528.057206] mce: CPU7: Температура пакета выше порога, тактовая частота процессора ограничена (всего событий = 153468) 23/07/2019 23:26:56 crit pve-host1.local kern kernel [292528.057205] mce: CPU4: Температура ядра выше порога, тактовая частота процессора ограничена (всего событий = 139201) 23/07/2019 23:26:56 crit pve-host1.local kern kernel [292528.057204] mce: CPU0: Температура ядра выше порога, тактовая частота процессора ограничена (всего событий = 139201) ... А немного позже (в основном в ту же секунду) появляется следующий набор сообщений, указывающий, что температура вернулась в норму? Код: 23/07/2019 23:26:56 Информация pve-host1.local kern kernel [292528.058260] mce: CPU6: Температура/скорость пакета нормальные 23/07/2019 23:26:56 Информация pve-host1.local kern kernel [292528.058260] mce: CPU2: Температура/скорость пакета нормальные 23/07/2019 23:26:56 Информация pve-host1.local kern kernel [292528.058258] mce: CPU5: Температура/скорость пакета нормальные 23/07/2019 23:26:56 Информация pve-host1.local kern kernel [292528.058258] mce: CPU1: Температура/скорость пакета нормальные 23/07/2019 23:26:56 Информация pve-host1.local kern kernel [292528.058229] mce: CPU0: Температура/скорость пакета нормальные 23/07/2019 23:26:56 Информация pve-host1.local kern kernel [292528.058227] mce: CPU4: Температура/скорость пакета нормальные 23/07/2019 23:26:56 Информация pve-host1.local kern kernel [292528.058226] mce: CPU3: Температура/скорость пакета нормальные 23/07/2019 23:26:56 Информация pve-host1.local kern kernel [292528.058226] mce: CPU7: Температура/скорость пакета нормальные 23/07/2019 23:26:56 Информация pve-host1.local kern kernel [292528.058225] mce: CPU4: Температура/скорость ядра нормальные 23/07/2019 23:26:56 Информация pve-host1.local kern kernel [292528.058224] mce: CPU0: Температура/скорость ядра нормальные Этот набор сообщений о превышении пороговой температуры/возвращении к норме был выведен в журнал 40 раз вчера, но поскольку я следил за температурой процессора сервера каждую минуту через SNMP, я вижу, что минимальная, максимальная и средняя температуры были следующими вчера и должны указывать на то, что сервер не перегревается, по крайней мере, не в тот момент, когда производится считывание SNMP... Мин: 42C Макс: 57C Среднее: 45C У меня есть второй узел (менее мощный NUC7PJYH), у которого такой же температурный профиль, и я не вижу тех же ошибок на этом узле, так что я думаю, что ошибки либо ложные срабатывания, либо есть какая-то настройка, которая устанавливает порог температуры слишком низко. Есть идеи (A) Что контролирует эти сообщения, выводимые в syslog, и (B) Где я могу настроить "пороговые значения", которые, по всей видимости, используются? Спасибо!
[РЕШЕНО] Много записей в syslog "CPUx: температура пакета выше допустимого порога, тактовая частота процессора снижена"?, Proxmox Виртуальная Среда
|
24.07.2019 03:02:00
|
|
|
|
|
|
05.09.2019 17:13:00
Возможно, что значения, полученные ядром, неверны, или же работает турбо и вызывает сообщения. Ограничение максимальной температуры в BIOS должно остановить ПК в любом случае.
|
|
|
|
|
|
05.02.2020 05:09:00
звучит как довольно классное решение. не мог бы ты поделиться, как ты это делаешь? графана работает как виртуальная машина на самом хосте или это с какого-то внешнего сервера?
|
|
|
|
|
|
05.02.2020 15:27:00
Спасибо @n1nj4888 - я собираюсь попробовать это сделать...
|
||||
|
|
|
|||
Читают тему
