PC per modelli AI. Mi aiutate con la dissipazione del calore di 3 5090?

guz · 19 Novembre 2025

Ragazzi, non è un progetto così assurdo come pensavamo e anche se non si autorizza inferenza in cloud, il modello specializzato sarà ugualmente valido e anzi ho idea che mi stupirà. Riassumendo, la paura è che l'addestramento a 4 bit non fosse preciso e questo è sacrosanto. Per questa ragione pensavo più ad un RAG in modo che l'inferenza avesse sempre a disposizione informazioni pertinenti nel contesto. Poi mi sono reso conto che la specializzazione del modello è uno strato a 16bit. Il peso in VRAM aumenta in maniera trascurabile perchè il grosso generalista è congelato in 4bit, ma la specializzazione la sta stratificando in 16bit con inferenza maggiormente precisa proprio per il dominio che mi interessa. A questo punto miglioro il dataset con qualche altro migliaio di Q/A, codici e libri e per me il RAG diventerà il minimo indispensabile per evitare di fare qlora troppo frequenti.
Sempre grazie

illecitnom · 19 Novembre 2025

guz ha detto:
Ragazzi, non è un progetto così assurdo come pensavamo e anche se non si autorizza inferenza in cloud, il modello specializzato sarà ugualmente valido e anzi ho idea che mi stupirà. Riassumendo, la paura è che l'addestramento a 4 bit non fosse preciso e questo è sacrosanto. Per questa ragione pensavo più ad un RAG in modo che l'inferenza avesse sempre a disposizione informazioni pertinenti nel contesto. Poi mi sono reso conto che la specializzazione del modello è uno strato a 16bit. Il peso in VRAM aumenta in maniera trascurabile perchè il grosso generalista è congelato in 4bit, ma la specializzazione la sta stratificando in 16bit con inferenza maggiormente precisa proprio per il dominio che mi interessa. A questo punto miglioro il dataset con qualche altro migliaio di Q/A, codici e libri e per me il RAG diventerà il minimo indispensabile per evitare di fare qlora troppo frequenti.
Sempre grazie

Ciao Guz, come stai? Mi sa che hai sbagliato discussione... ;-)
Sono molto curioso sul lavoro che stai facendo. Se hai un certo numero di Q/A di qualità (cosa non banale) il RAG potrebbe davvero fare la differenza. Codici e libri generali per il dominio di tuo interesse li vedo piu' come materiale per l'addestramento del modello raw, o al piu' per un fine-tuning. Direi ottimo il fatto che la specializzazione sia a 16 bit.
Buon lavoro e facci sapere!

BAT · 19 Novembre 2025

@guz @illecitnom post spostati

guz · 21 Novembre 2025

BAT ha detto:
@guz @illecitnom post spostati

Mi dovete scusare. Avrò avuto un'allucinazione.
Grazie per avere spostato il mio post nel posto giusto

PC per modelli AI. Mi aiutate con la dissipazione del calore di 3 5090?

guz

Nuovo Utente

illecitnom

Nuovo Utente

BAT

MODERATORE

guz

Nuovo Utente