PROBLEMA il PC va in crash/reboot quando è sotto sforzo

Pubblicità

NBV

Utente Attivo
Messaggi
470
Reazioni
67
Punteggio
57
Ciao a tutti,
ho un problema fastidiosissimo di crash/reboot sulla workstation, lavoro nel video editing e utilizzo Davinci Resolve Studio.
Quando il PC va sotto sforzo, ad esempio in fase di rendering o in fase di export, a volte il sistema va in crash e si riavvia. Il problema non si presenta mai nello stesso punto del render nè allo stesso modo, ogni volta non è possibile prevedere se andrà in crash oppure no. A volte ad esempio sono riuscito a effettuare un render che magari pochi attimi prima aveva mandato in crash il sistema.

Il problema cominciò a verificarsi circa un paio di anni fa, da quando sostituii la RTX 3060 8GB con una RTX 3090 24GB acquistata usata da un rivenditore affidabile.
Una volta montata mi feci aiutare qui sul forum da @BWD87 per testarla: appena avviato 3DMark Time Spy il sistema andò in crash, così mi aiutò per cercare di capire da cosa dipendesse. Fino ad oggi sono stati fatti i seguenti test:

- configurata la curva delle ventole con MSI Afterburner con conseguente miglioramento dei risultati delle temperature. Avrei anche dovuto provare a fare un undervolt della GPU ma non avendo esperienza non mi sono cimentato nel farlo per evitare di fare danni;
- provato a effettuare i rendering con il pannello laterale aperto per escludere le temperature ma crasha ugualmente nonostante non vadano oltre i 65°C per la CPU e i 74°C per la GPU;
- recentemente ho anche aggiunto una seconda ventola sul frontale per migliorare l'afflusso di aria fresca;
- testate le RAM con uno stress test di aida64 ma è tutto ok;
- ho escluso anche problemi agli SSD;
- il BIOS ad oggi è aggiornato all'ultima versione;
- tramite una presa smart ho monitorato i consumi e quando va in crash sta intorno ai 630 watt, anche se in realtà il psu è da 750 watt;
- oggi ho escluso anche la VRAM effettuando un test di un'ora con OCCT al 95% come settaggio memoria e non ci sono stati problemi;
- poco fa ho fatto un POWER TEST con OCCT e il sistema è crashato dopo 15 secondi: credo che al momento questo indizio porti direttamente all'alimentatore come indiziato principale;
- per curiosità ho fatto partire anche uno stress test della CPU sempre con OCCT e ho notato che la temperatura ha raggiunto subito i 100 °C, così l'ho immediatamente stoppato per paura di fare danni: è normale? (per chiarezza, quando si verificano i crash la CPU non lavora mai al 100% e le temperature sono ok, mentre ovviamente la GPU sta fissa al 100%).

Prima di chiedervi aiuto mi sono fatto un giro in rete e ho trovato altri utenti a cui il sistema va in crash dopo aver avviato il power test su OCCT:
- ad alcuni nonostante il cambio di alimentatore il problema si presenta ancora;
- alcuni parlano di problemi sulla MSI Mag Z690 DDR4 riguardo una specie di bug di sovravoltaggio della CPU;
- altri quindi consigliano di mettere mano al bios e fare undervolt della CPU;
- altri ancora dicono di aver risolto perchè avevano collegato male la GPU alle linee del psu ma sinceramente non ho capito cosa intendessero.

Al momento con le mie limitate competenze (non sono un noob ma non sono nemmeno un guru ecco) non so cos'altro fare e mi metto nelle vostre mani!

MB MSI Mag Z690 DDR4 WIFI
CPU Intel Core i7-12700K
CPU FAN ARCTIC Liquid Freezer II 360 A-RGB
RAM G.Skill Tident Z RGB 64 GB DDR4 K2 32GTZRC 3600 (4 x 16 GB) C16
VGA EVGA GeForce RTX 3090 FTW3 ULTRA GAMING, 24G-P5-3987-KR, 24GB GDDR6X, iCX3, ARGB LED, Metal Backplate
SSD 2x Western Digital SN850 SSD 1TB (OS e Programmi / Media Files 1) / 1x Sabrent Rocket SSD 512GB (Media Files) / 1x Western Digital SN850X SSD 2TB (Cache)
PSU Corsair RM750x 80 PLUS Gold
CASE Be quiet! Silent Base 601 window nero
OS Windows 11 Pro 64bit
 
così su 2 piedi verrebbe anche a me da dire alimentatore.

per la questione temperature cpu: ma ha solo un breve spike a 100° oppure ci rimane? (prova, una manciata di secondi a 100° non fanno nulla)la pompa com'è impostata da bios (in genere si setta fissa al 100%) ? la parta termica quanto è recente/vecchia?
 
L'alimentatore potrebbe andare in crisi con gli spike della 3090. Un 850W sarebbe meglio ma escudi problemi di temperature
 
Ho fatto un breve test di 3 minuti, poi ho staccato per paura: parte subito a 97 °C, poi oscilla tra i 97 e i 100, poi rimane fissa a 100.
In idle invece torna subito così: https://ibb.co/Mxs8FQPG

Nel bios la pompa della CPU è impostata così: https://ibb.co/PzMvnVfj

Ho montato la workstation (e quindi messo anche pasta termica) ad aprile 2022. Dopodichè nel corso del tempo ho aggiunto 32GB di RAM, installato SSD in più e cambiato la GPU.

L'alimentatore potrebbe andare in crisi con gli spike della 3090. Un 850W sarebbe meglio ma escudi problemi di temperature
Eventualmente, per capire la spesa, su che alimentatore ti orienteresti?
 
Ultima modifica da un moderatore:
Ho effettuato un nuovo test, questa volta non è arrivata a 100°C forse perchè l'aria nella stanza è un po' più fresca rispetto a prima, ma è comunque arrivata a 98°C.
aggiorna il bios della scheda madre all'ultima versione disponibile e cambia la pasta termoconduttiva sul waterblock a contatto con la CPU;

entra nel BIOS e:
  • disattiva eventuali opzioni di miglioramento automatico delle prestazioni (overclockano la CPU anche quando in idle e fanno alzare la temperatura), potrebbero chiamarsi con voci come "Enhanced Turbo" o "Multi-Core Enhancemente (MCE");
  • imposta Long Duration Power Limit (PL1) a 190 W, Short Duration Power Limit (PL2) a 190 W (serve a non lasciare libera la CPU di assorbire potenza a piacimento)
  • infine controlla se ti è possibile fare un po' di undervolt; nel BIOS MSI le impostazioni per le tensioni della CPU, dovrebbero essere:
    • CPU Core Voltage Mode: imposta [Adaptive + Offset]
    • CPU Core Voltage: imposta [Auto]
    • CPU Core Voltage Offset Mode: imposta il segno "-" (MENO)
    • CPU Core Voltage Offset: imposta inizialmente [0.050], è il valore dell'offset da applicare, si va a prove ma all'inizio metti 0.05 volt (ZERO PUNTO ZERO CINQUE). E' un valore prudente, se il test Cinebench finisce senza crash puoi provare a variarlo verso 0.1000, se c'è crash a diminuirlo verso 0.0400. Se facendo varie prove con Cinebench sei soddisfatto anche con l'offeset 0.05 non c'è bisogno di impazzire a fare prove su prove
  • salva le impostazioni ed esci dal BIOS
 
220/260 Watt non sono pochi e ci può anche stare che arrivi a 98 gradi....
sapere in quanto tempo ci arrivi potrebbe essere utile per capire se è il dissipatore a non farcela o sei sei proprio al limite della capacità di trasferimento.
 
aggiorna il bios della scheda madre all'ultima versione disponibile e cambia la pasta termoconduttiva sul waterblock a contatto con la CPU;

entra nel BIOS e:
  • disattiva eventuali opzioni di miglioramento automatico delle prestazioni (overclockano la CPU anche quando in idle e fanno alzare la temperatura), potrebbero chiamarsi con voci come "Enhanced Turbo" o "Multi-Core Enhancemente (MCE");
  • imposta Long Duration Power Limit (PL1) a 190 W, Short Duration Power Limit (PL2) a 190 W (serve a non lasciare libera la CPU di assorbire potenza a piacimento)
  • infine controlla se ti è possibile fare un po' di undervolt; nel BIOS MSI le impostazioni per le tensioni della CPU, dovrebbero essere:
    • CPU Core Voltage Mode: imposta [Adaptive + Offset]
    • CPU Core Voltage: imposta [Auto]
    • CPU Core Voltage Offset Mode: imposta il segno "-" (MENO)
    • CPU Core Voltage Offset: imposta inizialmente [0.050], è il valore dell'offset da applicare, si va a prove ma all'inizio metti 0.05 volt (ZERO PUNTO ZERO CINQUE). E' un valore prudente, se il test Cinebench finisce senza crash puoi provare a variarlo verso 0.1000, se c'è crash a diminuirlo verso 0.0400. Se facendo varie prove con Cinebench sei soddisfatto anche con l'offeset 0.05 non c'è bisogno di impazzire a fare prove su prove
  • salva le impostazioni ed esci dal BIOS
Credo di avere aggiornamenti positivi!
Il BIOS era già aggiornato, nonostante fossi convinto di avere la pasta termica ma in realtà me ne era rimasta pochissima, ho comunque proceduto ad effettuare modifiche dei settaggi e test.

Questo il riassunto delle modifiche effettuate al BIOS, ho fatto tutte quelle che mi hai indicato: https://ibb.co/VcXYvfpr
Ho visto che ci sono anche un paio di opzioni Intel Turbo Boost ma al momento non le ho toccate: https://ibb.co/wh4GTs8H

Così ho effettuato un CPU test con OCCT di 3 minuti (per farlo identico a quello che avevo fatto prima delle modifiche) ed effettivamente le temperature sono scese drasticamente per un massimo di 84 °C.

Dati HWiNFO al picco massimo del CPU test con OCCT: https://ibb.co/p6M4Nd6y

Allora ho effettuato anche un POWER test con OCCT (con GPU e CPU al massimo della potenza) e questa volta è andato avanti miracolosamente senza crash, poi a 8 minuti circa ho stoppato. Dai dati si notano i 98 °C della CPU ma sono stati raggiunti in maniera costante. Invece è possibile che il punto caldo della GPU abbia raggiunto i 98 °C?

Dati HWiNFO al picco massimo del POWER test con OCCT: https://ibb.co/5VmNfdn

In seguito avrei voluto fare un test con 3DMark TimeSpy ma non so perchè mi dice che non è più compatibile con il mio sistema. L'unico compatibile con la versione gratuita risulta essere Steel Nomad, che ho eseguito senza crash ma il test è molto breve quindi non gli darei tanto credito.

Infine ho fatto anche i vari test con Cinebench, tutto regolare: https://ibb.co/60jdxbNG

La cosa che ho notato è che in idle la CPU rimane costantemente intorno ai 3,5 - 4,6 GHz, è normale?
Inoltre v
orrei comunque cambiare la pasta termica della CPU, ho visto però che la classica Arctic MX-5 al momento non è disponibile, ci sono la 4 e la 6, che faccio?

Grazie per la disponibilità e la pazienza!

220/260 Watt non sono pochi e ci può anche stare che arrivi a 98 gradi....
sapere in quanto tempo ci arrivi potrebbe essere utile per capire se è il dissipatore a non farcela o sei sei proprio al limite della capacità di trasferimento.
Li raggiungeva nel giro di una decina di secondi durante lo stress test.

Ho appena provato a renderizzare un progetto bello pesante e il sistema è andato in crash. Quindi nulla di fatto!
Ora ho impostato il CPU core voltage offset a 0.040 e riprovo. Magari provo anche a fare un video a HWiNFO mentre renderizza per cercare di capire dai valori quale sia il problema.

Inviato dal mio Pixel 8 Pro utilizzando Tapatalk

Parallelamente al settaggio del CPU core voltage offset a 0.040, finalmente ho anche fatto l'undervolt della GPU raggiungendo il risultato di 900 mV a 1935 MHz.

Ho provato ad effettuare nuovamente il rendering del famoso progetto che mi andava sempre in crash e questa volta è andato tutto a buon fine. GPU a cannone per un'ora filata e relativa temperatura media intorno ai 70 °C (mai stata così bassa in render, tra l'altro con pannello laterale chiuso).

Non so se sia per l'undervolt della GPU, o per i settaggi di @BAT della CPU nel BIOS, oppure entrambi, oppure nessuno dei due ed è soltanto un caso e poi tornerà a crashare tutto, ma per il momento dita incrociate!
 
Ultima modifica da un moderatore:
ci sono la 4 e la 6, che faccio?
Arctic MX-6 (4g) oppure Noctua NT-H2 3.5g
Invece è possibile che il punto caldo della GPU abbia raggiunto i 98 °C?
sotto stress estremo sì ma in quel caso va fatto undervolt della scheda video (con cautela)
Non so se sia per l'undervolt della GPU, o per i settaggi di @BAT
l'undervolt in entrambi i casi ti ha fatto abbassare il calore prodotto, devi solo stare attento a non esagerare perché "troppo" undervolt porta instabilità, quindi se noti crash rilassa l'undervolt, ossia rendilo meno aggressivo
 
Arctic MX-6 (4g) oppure Noctua NT-H2 3.5g

sotto stress estremo sì ma in quel caso va fatto undervolt della scheda video (con cautela)

l'undervolt in entrambi i casi ti ha fatto abbassare il calore prodotto, devi solo stare attento a non esagerare perché "troppo" undervolt porta instabilità, quindi se noti crash rilassa l'undervolt, ossia rendilo meno aggressivo
Ok prendo la MX-6, grazie!

Per ora ho fatto un po' di test e di render ed è andato tutto bene! Se in futuro noto che non ho problemi, secondo te posso provare a riportare i valori della CPU a come erano prima, per verificare se alla fine bastava solamente fare l'undervolt alla GPU?
Nel senso, cambiando quei settaggi della CPU, ho perso un po' di prestazioni che potrei provare a recuperare riportandoli ai valori standard o è comunque meglio lasciare così con i valori che mi hai indicato?
Scusa se non sono stato chiaro ma mi sto incartando XD
 
Se in futuro noto che non ho problemi, secondo te posso provare a riportare i valori della CPU a come erano prima
meglio di no, i power limit devono essere quelli e un po' di undervolt se sei riuscito a farlo è utile
 
meglio di no, i power limit devono essere quelli e un po' di undervolt se sei riuscito a farlo è utile
Ok chiaro, grazie!
Stamattina ho applicato la MX-6 alla CPU, un chicco grande al centro e 4 più piccoli agli angoli, posto la foto per capire se l'ho messa bene: https://ibb.co/SDsPS5pt

Quando ho dovuto rimuovere quella vecchia ho visto che era bella dura, se ricordo bene quando la applicai qualche anno fa misi solo un chicco al centro, comunque la situazione che ho trovato era questa:

Il dubbio che ho è che nonostante abbia usato un bel po' di alcool, sulla piastra del dissipatore è rimasto un alone, come se fosse "bruciato", è normale? https://ibb.co/350zsvD6

Con Cinebench ho ottenuto questi risultati e temperature:

Ultima questione: ho approfittato per sistemare i cablaggi delle ventole del case, che prima erano collegate al controller manuale posto sul frontale (c'erano 3 livelli di regolazione, quando non c'era bisogno lo tenevo al minimo e durante i render al massimo), ma ora ho preferito collegarle direttamente alla scheda madre in modo tale che agiscano autonomamente in base alle temperature.
Mi potreste dare una mano a configurare settaggi e curve nel bios? E soprattutto a quale sensore devo agganciarle? Al momento sono collegate al sensore della CPU. Allego screenshot (la 2 e la 3 sono quelle in immissione sul frontale, la 4 quella in espulsione sul retro):

CPU: frontale in immissione (4 pin): https://ibb.co/y1JGMmn
frontale in immissione (3 pin): https://ibb.co/Fq5X9PQM
posteriore in espulsione (3 pin): https://ibb.co/hF3dLSD9

Grazie!
 
Ultima modifica:
capire se l'ho messa bene:
ok
è rimasto un alone, come se fosse "bruciato", è normale?
nulla di cui preoccuparsi
ettaggi e curve nel bios?
dove adesso hai 20% metti 30%
dove adesso hai 35% metti 40%
dove adesso hai 70% metti 80%
da qualche parte ci dovrebbe essere un'opzione che permette di regolare il ritardo (in secondi) di attivazione del cambio di velocità, mettici 3 secondi (cioè per esempio se superi gli 80° invece di far arrivare la ventola subito al 100% lo fa dopo 3 secondi, il tempo per "capire" se c'è stato solo un picco o se davvero la temperatura si sta alzando)
 
Pubblicità
Pubblicità
Indietro
Top