buongiorno stavo pensando di farmi una 1080ti per giocare su un tv 4k ,ma non e che mi conviene aspettare volta visti i prezzi delle schede attuali?
avrei anche un altra curiosita come mai le vega pur avendo tanti teraflops 13... la 64 va parecchio meno della 1080 ti che ne ha 11e rotti saranno le differenze architetturali , compressioni in memoria o come sono fatte le pipeline non ho le idee molto chiare a riguardo (se si potesse includere anche volta in un discorso improntato allo sviluppo futuro sarebbe il massimo)?mi piacerebbe approfondire questa tematica se avete qualche link(anche in inglese) o vi va di segnalarmi post precedenti saro felice di leggerli
E' troppo complesso da spiegare nel dettaglio, perchè la differenza sta nelle unità funzionali.
Nvidia ad una tot. precisione in virgola mobile, affianca le unità funzionali.
Ovvero:
Cuda-LDS-FPU
Ogni cuda, per rapporto in virgola mobile, ha accesso ai registri immediati (512 a 64 bit) ed alle FPU da cui si ricava i pixel, oltre alle operazioni trascendentali (seno-coseno e calcoli simili).
32 cuda, sono veicolati da 8 LDS e 8 SFU.
AMD queste se le deve emulare.
Prendi un CU con 64 elementi, 4 vettori da 16, di cui ogni l'istruzione su 128 shader come nvidia viene elaborata in 11 cicli (1 SIMD più 1 di latenza)
Ogni CU da 64 per clock (fma2) offre un tot di potenza in virgola mobile.
La somma è uguale ad nvidia a frequenze per shader, ma AMD deve emularsi per l'appunto le unità funzionali.
Se sei costretto ad emulare i load store, la potenza effettiva cala ad 1/4
Se devi emulare sia le load store che le SFU, la potenza teorica crolla a metà, Nvidia la mantiene costante
Dopo di questo vanno calcolate tutte le varie parti della VGA, tra cui, rop's, banda, ed elementi funzionali come il gigathread, la sua funzione, l'elaborazione dei thread, il consumo di l2 (10-20 cicli) in accesso load store.
Una LDS permette di elaborare 512 istruzioni contemporanee, e non aggrava la cache (AMD queste le deve emulare, scaricando in cache).
Quindi un cuda oltre a fornire una prestazione matematica efficiente, riesce pure a sgravare la cache, e sgravare la cache significa, meno peso in banda e meno cicli di clock per la GPU.
Poi ci sono le rop's.
Ripeto è una sintesi, troppo complesso spiegare tutto.
Buona serata.:ok: