GUIDA Guida al cooling: risoluzione problemi e scelta del sistema di raffreddamento

Pubblicità

Niemand

Utente Èlite
Messaggi
7,472
Reazioni
2,077
Punteggio
152
Nel forum ci sono frequenti richieste di aiuto o di consigli legati alle temperature della CPU.
Le richieste di aiuto riguardano temperature anomale mentre i consigli sono per un nuovo dissipatore, per la sostituzione della pasta termica, o magari per la scelta del case.
Tralasciando le considerazioni estetiche, per poter dare un aiuto reale alle richieste c'è bisogno prima di tutto di capire:

1 - se c'è effettivamente un problema o si tratta di una valutazione errata dovuta a letture o interpretazioni parziali o “non filtrate”
2 - la natura del problema (potrebbe essere di hardware ma anche software) e gli eventuali punti critici

Ho pensato quindi di scrivere una guida che possa aiutare al 100% nell’evidenziare eventuali problemi o punti deboli.
Il mio consiglio è di appoggiarsi a questa guida per avere risultati attendibili dal lato della dissipazione, per poi eventualmente approfondire il tema, che sia hardware o software.

Software necessario:

a) HWinfo64 (portable) nella versione più aggiornata:
https://www.hwinfo.com/download/

b) un programma che stressi la CPU (vanno bene Prime95 o Cinebench):
https://www.maxon.net/it/downloads

una volta scaricato il software si lancia HWInfo (con flag su Sensors-only) e si individuano i due valori rilevanti della CPU, ovvero la temperatura e la potenza da dissipare.

Per Intel sono CPU Package (Temperatura) e CPU Package Power (Potenza)

Per AMD i valori sono CPU (Tctl/Tdie) (Temperatura) e CPU Package Power (Potenza)

GT_01.jpg

Ci sono diverse scuole di pensiero su quali siano i valori "giusti" in HWInfo64, ovvero quelli che rappresentano le temperature reali. Per questo tipo di analisi però non è importante il valore assoluto ma le sue variazioni nel tempo, quindi le differenze tra una riga e l'altra non sono così determinanti.
Infatti, per capire davvero il comportamento del sistema i singoli valori numerici non sono sufficienti e occorre visualizzarli in modo dinamico con un grafico: per ottenere il grafico basta cliccare col tasto destro del mouse e selezionare “Show Graph” (attenzione che il grafico appare sempre nello stesso posto e il secondo copre il primo se non lo si sposta). i due grafici si possono ingrandire e adattare ai parametri necessari (per le temperature può andar bene un intervallo 0-100, mentre per la potenza questa dipende ovviamente dalla CPU)

GT_02.jpg

Con i due grafici affiancati si può iniziare a valutare se c'è un problema di software, osservando i watt con il PC in idle (nessuna applicazione attiva escluso HWInfo64). Se si escludono eventuali picchi istantanei dovuti a processi temporaneamente attivi, l’assorbimento deve essere piuttosto basso e costante, nell'ordine dei 5-10 watt al massimo. Nei sistemi AMD con OC (manuale o automatico) questo valore può essere più alto (anche 20/30 W) ma in questo caso è bene comunque verificare che l'utilizzo totale della CPU sia sotto all'1%.
Con un assorbimento più elevato o comunque una CPU costantemente occupata oltre al 2% vale la pena andare a vedere in “gestione attività” di cosa si tratta: questo può essere un processo legittimo come ad esempio un aggiornamento in corso ma anche un processo "occulto" e indesiderato.
Assumendo di non avere assorbimenti significativi, già è possibile capire qualcosa riguardo al sistema di raffreddamento: una volta stabilizzate (grafico orizzontale), le temperature indicate in idle dipendono infatti dalla temperatura ambiente (come è ovvio che sia) ma anche dal ricambio di aria nel case, in particolare per laptop e micro PC.

Partendo da una situazione a riposo si può far partire il programma che sfrutterà a fondo la CPU. Se si sceglie Cinebench va avviato il test CPU (multi core) con i grafici di Hwinfo64 attivi. Già dopo pochi secondi sui grafici si ha una rappresentazione chiara dei principali parametri, anche se potrebbe essere necessario aspettare molto di più per una analisi dettagliata.

NOTA BENE: I grafici, anche se qui per esemplificazione vengono mostrati anche da soli, andrebbero rappresentati SEMPRE assieme (Power + Temperature).

Il grafico Power mostra la potenza (con il relativo calore) che il processore genera: con l’avvio del test di Cinebench la potenza “richiesta” è sostanzialmente immediata e costante al 100% (salvo una breve interruzione alla fine di ogni ciclo).

GT_03.jpg

Il sistema CPU/motherboard gestisce questa richiesta sviluppando la potenza effettiva in watt in base a parametri preimpostati dal produttore e dall’utente (TDP, overclock, ecc.), oltre a tenere conto di eventuali throttling termici (temperature troppo elevate).

Ecco un esempio di "taglio" della potenza dovuto a throttling termico:
GT_04.jpg
In questo caso specifico il grafico evidenzia quindi un problema.

Il grafico in questo contesto di raffreddamento serve invece a capire quanta potenza dovrà realmente venire dissipata in quelle condizioni: il valore infatti potrebbe differire di molto dal TDP dichiarato per quel processore.


Il grafico della temperatura è ovviamente il più importante perché consente di capire nel dettaglio il comportamento dei vari elementi della catena di trasmissione del calore, dal die all’aria esterna. A differenza della variazione della potenza in watt che può considerarsi istantanea, la variazione di temperatura rilevata dal processore è il frutto di un processo più complesso con un equilibrio variabile che tende a stabilizzarsi solo dopo molto tempo. Semplificando il processo per capirne meglio il principio, possiamo vederlo come composto da tre fasi distinte:

GT_05.jpg

Il primo equilibrio (area rossa) è quello che consente al die di iniziare a trasferire calore in modo efficace. Si raggiunge dopo circa uno o due secondi dall’avvio dello stress test e si distingue per un aumento quasi istantaneo della temperatura rispetto al valore in idle. Questa balzo è direttamente correlato alla potenza (potenza maggiore= temperatura più elevata) ma dipende anche dalla capacità di trasferire calore al dissipatore.
Il dissipatore invece non è rilevante in questo primo equilibrio.

I fattori in gioco sono quindi:
  1. la superficie del die
  2. la pasta termica o il metallo posto tra il die e l’IHS, ovvero quella piastra in metallo che è la parte visibile del processore (modelli desktop)
  3. la superficie e la massa dell’IHS (modelli desktop)
  4. la pasta termica tra il processore e il sistema di raffreddamento
  5. il montaggio del sistema di raffreddamento sul processore
un aumento troppo grande della temperatura in questa fase significa che c’è un problema (in particolare nei punti 2, 4 e 5). Leggendo soltanto i numeri nella tabella di HWInfo questo primo equilibrio viene completamente ignorato.
Come conseguenza di questa mancanza l’errore più comune è cercare di abbassare le temperature ricorrendo a un sistema di raffreddamento più prestante. Basta invece osservare il grafico per capire che, in caso di temperature non lontane dal throttling prima ancora che il sistema di raffreddamento abbia ricevuto una quantità significativa di calore, il problema è ovviamente a monte.

Ecco ad esempio un 8700K con la pasta secca sul die (Prime95 small FFT):
8700k prime95_3.jpg
il die raggiunge gli 80C in meno di un secondo, con il dissipatore sostanzialmente freddo.

ecco lo stesso processore dopo il delid (Prime95 small FFT):
8700k prime95_d1.jpg
è evidente la riduzione in altezza di tutta la curva (oltre 20C), con un utilizzo accettabile anche con dissipatore inadeguato (Arctic Alpine 12 CO)

Il secondo equilibrio (area blu) indica la capacità del sistema di raffreddamento di assorbire il calore che riceve. Le sue caratteristiche dipendono dalle dimensioni e dal materiale del sistema di raffreddamento. Nei dissipatori ad aria si tratta comunque di una fase transitoria piuttosto breve mentre, al contrario, nei sistemi ad acqua la capacità è molto elevata e questa fase dura per molti minuti (anche nel caso di AIO con radiatore da 120 mm). Negli impianti a liquido che funzionano correttamente il passaggio dalla prima alla seconda fase di equilibrio è visibilmente netto mentre una curva arrotondata come quella di un sistema ad aria denoterebbe un problema con la circolazione del liquido.

ecco lo stesso 8700K con un AIO.
Si nota il primo equilibrio sostanzialmente uguale al grafico precedente e il passaggio netto dal primo al secondo equilibrio:
GT_06.jpg


Il terzo equilibrio (area verde) è quello definitivo e rappresenta effettivamente la capacità del dissipatore di trasferire il calore all’aria circostante. In questo caso i fattori principali sono la superficie di scambio con l’aria e la velocità dell’aria che ci scorre sopra. Determinanti in questo caso sono le ventole che favoriscono appunto il passaggio dell'aria sulle superfici calde del sistema.
Se questa fase è molto importante durante uno stress test prolungato o, magari, un lavoro di rendering, occorre però sottolineare che, in un utilizzo meno estremo per il processore (come il gaming), il calore prodotto non è sempre al 100% e quindi diventano più importanti le fasi precedenti.

ecco le curve di un Ryzen 5600G con dissipatore Wraith Spire. Per raggiungere un equilibrio diverso la ventola è stata tarata con due scenari diversi.
1000 giri fissi:
GT_07.jpg

2000 giri fissi:
GT_08.jpg

per rendere ancora più chiaro come il dissipatore non sia in grado di influenzare picchi immediati di temperatura ecco di seguito tre diversi scenari con la stessa configurazione (i7 8700K senza limiti, AIO da 120 DeepCool, Prime95 small fft).


situazione 1 (pompa fissa a 2200 giri):
2200.jpg
il dissipatore tiene tranquillamente a bada i 180W, tenendo le temperature sotto gli 80C anche a Luglio


situazione 2 (pompa fissa a 1200 giri, circa 6V):
1200.jpg
con la pompa che gira piano le temperature sono un poco più alte ma resta tutto sotto controllo. La fase di transizione è solo leggermente più smussata ma il flusso d'acqua è evidentemente sufficiente.


situazione 3 (pompa a zero fino a 95C, poi 11.2 V)
zero.jpg
purtroppo non è possibile regolare la pompa sotto i 1000 giri (si ferma) e quindi non è possibile valutare il comportamento con flusso molto ridotto. Ho dovuto quindi studiare un espediente per visualizzare il funzionamento con pompa ferma. Grazie a una curva "taroccata", la pompa resta ferma fino a 95C per poi partire quasi al massimo. In questo modo si vede la velocità alla quale la temperatura scende quando parte la pompa ma, più interessante, è osservare la velocità a cui sale la temperatura appena la pompa si ferma.


Nell'immagine seguente ecco l'andamento delle temperature con sovrapposta la velocità della pompa.
nel cerchio rosso si vede chiaramente che, a pompa ferma, la temperatura sale molto velocemente ma non in modo istantaneo.
over.jpg
 
Ultima modifica:
Per CPU Package non conviene prendere il riferimento sotto DTS, invece che sotto Enhanced?
 
Mi iscrivo… perché in effetti passo metà del mio tempo qui a consigliare di fare questi test ?
 
Sì, ho visto che alcune volte CPU Package varia sotto le varie diciture e qui nel forum mi avete detto più volte di prendere come riferimento quella sotto DTS!


è solo per coerenza: il package power si trova in enhanced e quindi ha senso prendere i valori dalla stessa "fonte".
In realtà poi non cambia nulla visto che vanno considerati i valori relativi (delta tra idle e load)
 
Bel lavoro.
L'analisi del transitorio termico per capire dov'è un eventuale problema di raffreddamento effettivamente è una buona idea, che si applica poco qui sul forum.

Ti correggo su una cosa poco importante che però so già potrebbe creare ansie tra gli utenti.
Con una CPU Intel è normale avere assorbimenti in idle molto bassi, con AMD no, un po' perchè di per sè consumano di più, un po' perchè i software di monitoraggio fanno fatica a stimare la reale potenza assorbita a riposo.
Ti mostro il grafico relativo alla PPT del mio Ryzen 5 5600x (PPT o package power su AMD praticamente mostrano gli stessi valori):

1642677890805.webp

A parte qualche picco normale dovuto al fatto che stavo navigando, di base la CPU non va sotto i 25 watt (almeno questo dice HWiNFO), anche mentre sto guardando il desktop. Questo è un comportamento normale che hanno tutti i Ryzen.
 
confermo in pieno le parole di @pribolo : i Ryzen hanno una reattività ben diversa dagli Intel (escludendo Alder Lake su cui non so ancora abbastanza) in tal senso, quindi vedere parecchi spike di attività in apparente idle è normale.

Devo purtroppo notare come diverse persone usano questa guida ma non postano più i valori numerici di HWINFO64, mettendo solo i grafici.
I numeri per giudicare diverse come come EDC, TDC, PPT e le frequenze servono ancora. Il grafico è un ulteriore fonte di dati, che AFFIANCA ma non sostituisce la tabella numerica.
 
Bel lavoro.
L'analisi del transitorio termico per capire dov'è un eventuale problema di raffreddamento effettivamente è una buona idea, che si applica poco qui sul forum.

Ti correggo su una cosa poco importante che però so già potrebbe creare ansie tra gli utenti.
Con una CPU Intel è normale avere assorbimenti in idle molto bassi, con AMD no, un po' perchè di per sè consumano di più, un po' perchè i software di monitoraggio fanno fatica a stimare la reale potenza assorbita a riposo.
Ti mostro il grafico relativo alla PPT del mio Ryzen 5 5600x (PPT o package power su AMD praticamente mostrano gli stessi valori):


A parte qualche picco normale dovuto al fatto che stavo navigando, di base la CPU non va sotto i 25 watt (almeno questo dice HWiNFO), anche mentre sto guardando il desktop. Questo è un comportamento normale che hanno tutti i Ryzen.
Grazie,
in realtà stavo rivalutando anch'io il valore minimo a riposo.... però il dato che ho per il 5600G è coerente con i valori Intel (circa 5 w a riposo):
gt_07-jpg.425365
e anche un vecchio Ryzen 5 1400 è in linea con questi valori. forse il valore più alto dipende dell'effetto di un OC manuale o dalla disattivazione di alcune tecnologie di riduzione di tensione e potenza ai bassi carichi?
vorrei capirne di più prima di mettere un valore più corretto.
Tra l'altro ho notato che, rispetto ai grafici che avevo (R5 2600 e 3600) sono scomparsi quel "denti di sega"presenti col processore a riposo ma non so se questo dipende da BIOS più aggiornati o magari una versione di HWInfo che "spiana" i picchi.
intanto sto raccogliendo grafici proprio per fare un database completo nella terza parte.

per questo è ancora work in progress...
 
confermo in pieno le parole di @pribolo : i Ryzen hanno una reattività ben diversa dagli Intel (escludendo Alder Lake su cui non so ancora abbastanza) in tal senso, quindi vedere parecchi spike di attività in apparente idle è normale.

Devo purtroppo notare come diverse persone usano questa guida ma non postano più i valori numerici di HWINFO64, mettendo solo i grafici.
I numeri per giudicare diverse come come EDC, TDC, PPT e le frequenze servono ancora. Il grafico è un ulteriore fonte di dati, che AFFIANCA ma non sostituisce la tabella numerica.

In realtà grafici e tabelle suno utili per scopi diversi: il grafico di potenza e temperatura serve solo per capire se ci sono problemi di raffreddamento.
Questi problemi possono venire da un dissipatore difettoso, inadeguato o montato male, un case troppo chiuso o con ventole montate male, ecc. L'unico aspetto che riguarda il processore è l'eventuale necessità di delid, ma comunque si tratta di intervento hardware. I valori dei due grafici sono sufficienti per questo scopo e non servono tabelle.

Per fare una diagnosi sul funzionamento del processore e sui parametri impostati è evidente che il grafico di quei due valori è inutile : per quello servono assolutamente le tabelle, meglio se assistite da grafici di altri valori (vedi la presenza di spikes temporanei dei singoli core). L'ottimizzazione dei parametri dei processori però non era lo scopo di questa guida che più modestamente vuole limitarsi solo alla dissipazione.
 
In realtà grafici e tabelle suno utili per scopi diversi: il grafico di potenza e temperatura serve solo per capire se ci sono problemi di raffreddamento.
Questi problemi possono venire da un dissipatore difettoso, inadeguato o montato male, un case troppo chiuso o con ventole montate male, ecc. L'unico aspetto che riguarda il processore è l'eventuale necessità di delid, ma comunque si tratta di intervento hardware. I valori dei due grafici sono sufficienti per questo scopo e non servono tabelle.

Per fare una diagnosi sul funzionamento del processore e sui parametri impostati è evidente che il grafico di quei due valori è inutile : per quello servono assolutamente le tabelle, meglio se assistite da grafici di altri valori (vedi la presenza di spikes temporanei dei singoli core). L'ottimizzazione dei parametri dei processori però non era lo scopo di questa guida che più modestamente vuole limitarsi solo alla dissipazione.
si si, ma io vedo utili entrambe le cose. Postate insieme presentano il sistema nella sua interezza e danno una grossa mano a valutare il comportamento
 
Grazie,
in realtà stavo rivalutando anch'io il valore minimo a riposo.... però il dato che ho per il 5600G è coerente con i valori Intel (circa 5 w a riposo):
gt_07-jpg.425365
e anche un vecchio Ryzen 5 1400 è in linea con questi valori. forse il valore più alto dipende dell'effetto di un OC manuale o dalla disattivazione di alcune tecnologie di riduzione di tensione e potenza ai bassi carichi?
vorrei capirne di più prima di mettere un valore più corretto.
Tra l'altro ho notato che, rispetto ai grafici che avevo (R5 2600 e 3600) sono scomparsi quel "denti di sega"presenti col processore a riposo ma non so se questo dipende da BIOS più aggiornati o magari una versione di HWInfo che "spiana" i picchi.
intanto sto raccogliendo grafici proprio per fare un database completo nella terza parte.

per questo è ancora work in progress...

Allora, di sicuro posso dirti che overcloccando la RAM il consumo del SOC aumenta e il consumo del SOC è più o meno costante quindi ha una bella influenza nell'assorbimento in idle (ora ho indicativamente 12 watt solo sul SOC con Infinity Fabric a 1866MHz e RAM a 3733MHz).
Però 5 watt con il 5600x non li ho visti nemmeno la prima volta che ho acceso il PC che non avevo nemmeno l'XMP attivo: forse con le APU hanno ottimizzato un po' questo aspetto dei consumi in idle, d'altronde sono chip abbastanza diversi (monolitici).
Però secondo me non vale nemmeno la pena spenderci troppo tempo: l'assorbimento in idle può essere 5 watt, come 30 a seconda della CPU e delle impostazioni usate per la stessa, ma non è un dato così significativo, a meno che le temperature già a riposo siano fuori scala.
E' più interessante analizzare cosa succede sotto carico.
Comunque confermo che i gradini di temperatura con i Ryzen 5000 sono spariti, ma non saprei spiegarti perchè.

Poi, sono d'accordo con Max che i grafici e basta non sempre siano sufficienti, anche solo per valutare il raffreddamento. Abbastanza spesso temperature alte sono causate da impostazioni errate della CPU sui limit del PBO (per AMD) o sul vcore (per Intel). E' vero che solitamente questi fattori influiscono sul consumo, ma non sempre: ad esempio con i Ryzen 3000, il consumo indicato può essere inferiore a quello reale perchè alcune schede madri "barano" e per avere un riscontro di questo occorre monitorare la voce "Power Reporting Deviation" sempre su HWiNFO64 (se è sotto a 100% sotto carico, la scheda madre bara. Ad esempio, 90% significa che il consumo rilevato è il 90% di quello reale). Su questo forse sarebbe il caso di aggiungere una nota nella guida.

Ma in ogni caso fa comodo avere un colpo d'occhio sullo stato generale del sistema. Quindi la tendenza, secondo me corretta, quando qualcuno si presenta con un problema di temperatura è chidergli lo screen completo di HWiNFO, almeno delle voci riguardanti CPU e scheda madre.
 
Pubblicità
Pubblicità
Indietro
Top