UFFICIALE GTX 1060

  • Autore discussione Autore discussione Utente cancellato 159815
  • Data d'inizio Data d'inizio
Pubblicità
Le founders vengono vendute direttamente (ed esclusivamente) da nvidia sul sito ufficiale...lo shop è presente, credo, solo per germania, francia e regno unito.

si lo so, quello che non ho capito è perchè questa scelta solamente con le 1060, le altre due schede pascal in versione founders le hanno previste anche da noi, bho
 
Anche io sono interessato a questa scheda, però da quanto letto altrove, da uno che fa paura tecnicamente, le rop sono solo 32 perchè sono bloccate a 16 per ogni rasterizzatore.
La gtx 1080 ne ha il doppio in effetti.
Pensate che ci possano essere tagli simil gtx 970?

Sarà mikael :asd:

Ma guardando il diagramma sopra, io vedo 6 partition ROP\s, tre per cluster, che possono gestire 8 pixel per clock ciascuna: a loro volta esse dovrebbero essere legate con 6 chip di cache L2 (presumibilmente da 256KB) e 6 memory controller 32bit che generano il BUS aggregato di 192bit.
Quindi, secondo quel diagramma, ogni GPC ha un raster engine che gestisce un massimo di 24 pixel per clock, 48 in totale considerando l'intera GPU.

O il diagramma è sbagliato (ma poi non mi spiego il raccordo tra ROP\s e BUS), oppure la scheda gestisce effettivamente 40 pixel per clock, limitata dal numero di SM.

- - - Updated - - -

la 1060 dovrebbe avere 2 gpc completi attivi, 1 gpc collegato ma disattivo (altrimenti non potrebbe esserci un bus a 192bit e 48rop) e 1 gpc completamente spento compresi i due memory controller associati e i due blocchi rop da 8

con la 1050, se gp106, spegneranno completamente il terzo e il quarto gpc, quindi avremo 32rop e un bus a 128bit (ogni gpc è 2x32bit) e 4gb di vram
poi disabiliteranno un paio di SM (se si confermeranno i 1024cuda)

Possono esserci tre partion ROPs e tre memory controller per GPC...
Il GP106 ha 2 GPC, non 4: non è un GP104 castrato, è un altra GPU, più piccola.
 
Possono esserci tre partion ROPs e tre memory controller per GPC...
Il GP106 ha 2 GPC, non 4: non è un GP104 castrato, è un altra GPU, più piccola.

potrebbe essere come dici, anche se non credo che abbiano stravolto l'architettura così, sappiamo che ogni gpc su pascal è collegato ad un paio di memory controller a 32bit (quindi almeno in teoria l'unico modo per avere 192bit è quello di collegare cmq un terzo gpc, anche se non sfruttandolo a fini elaborativi)

inoltre sappiamo che l'architettura Pascal prevede per ogni gpc un'unità di rasterizzazione da 16ROP, quindi con soli 2 GPC avremmo 32ROP accessibili al massimo, le altre 16 quindi sono solo sulla carta quindi? le hanno lasciate solo per collegare i due memory controller in più? bho
 
Ultima modifica:
potrebbe essere come dici, anche se non credo che abbiano stravolto l'architettura così, sappiamo che ogni gpc su pascal è collegato ad un paio di memory controller a 32bit

l'unico modo per avere 192bit è quello di collegare cmq un terzo gpc, anche se non sfruttandolo a fini elaborativi ;)

E fare una GPU un buon 50% più grande? No, è impossibile IMHO...
Non è uno stravolgimento dell'architettura: infilare un partion ROPs in più e il relativo memory controller credo sia piuttosto semplice.
 
quindi abbiamo solamente 32 rop accessibili e sfruttabili delle 48 segnate, le altre 16 (suddivise in due raster da 8) sono servite esclusivamente per collegare due controller 32bit in più
 
Ultima modifica:
Uhm, da cosa lo deduci? Perchè non potrebbero essere tutte accessibili?

dal fatto che abbiamo solo due gpc e l'architettura Pascal prevede che ognuno di questi possa processare massimo 16rop (quindi 32rop totali accessibili e sfruttabili)

da qui la mia ipotesi che le ulteriori 16 sono state previste solamente per consentire il collegamento dei due memory controller in più (e raggiungere i 192bit)

hanno fatto lo stesso con la 1070, hanno lasciato le 64 rop per non perdere il bus a 256bit, ma quelle accessibili e sfruttabili sono 48 visti i soli 3 gpc attivi
 
Ultima modifica:
dal fatto che abbiamo solo due gpc e l'architettura Pascal prevede che ognuno di questi possa processare massimo 16rop (quindi 32rop totali accessibili e sfruttabili)

da qui la mia ipotesi che le ulteriori 16 sono state previste solamente per consentire il collegamento dei due memory controller in più (e raggiungere i 192bit)

hanno fatto lo stesso con la 1070, hanno lasciato le 64 rop per non perdere il bus a 256bit, ma quelle accessibili e sfruttabili sono 48 visti i soli 3 gpc attivi

Ma no, perchè 48 accessibili? La 1070 dovrebbe avere 60 accessibili su 64, per via dei 15SM attivi. C'è un limite di 4 pixel elaborati per SM ma non di 16 pixel per GPC. O meglio, tale limite c'è sul GP104 perchè i suoi GPC hanno raster engine con 16ROP\s l'uno: il limite è dato da quello. Ma nel caso il GPC della 1060 ne avesse 24, come si vede da quel diagramma, sarebbero tutti collegati e utilizzabili.

Tra l'altro il diagramma più corretto per la 1070 dovrebbe essere questo: https://www.techpowerup.com/reviews/NVIDIA/GeForce_GTX_1070/
Gli SM disattivi non sono tutti nel primo cluster...
 
anche se fosse come dici tu e su ogni GPC di GP106 avessero collegato tre raster da 8ROP ciascuno non li potresti mai sfruttare tutti perchè un GPC è limitato ad un massimo teorico di 20 pixel per clock (4pixel per ogni Thread/Texture Processing Cluster presente nel GPC stesso), quindi moltiplicato per 2 GPC avresti 8ROP ugualmente non sfruttate sulle 48 totali presenti

su Pascal GP104 il limite è di 16 pixel per clock per ogni GPC per il semplice fatto che per ognuno di questi sono previste 16ROP

il diagramma corretto del GP104-200 delle 1070 è questo dato che NVIDIA ha confermato alle varie testate la presenza di soli 3 GPC in questa GPU e non quella disabilitazione casuale di qualche TPC per ogni GPC ;)

NVIDIA-GeForce-GTX-1070-GP104-200-A1-Block-Diagram-635x518.webp

di conseguenza i due blocchi da 8 unità ROP in più sono lasciati attivi per consentire il collegamento dei due memory controller a 32bit in più, ma non sfruttati durante l'elaborazione (questo ovviamente limita la 1070 in termini di Pixel fillrate rispetto alla 1080, infatti si parla di valori sugli 80Gpixel/s invece di oltre 110Gpixel/s che sarebbero ottenibili sfruttando 64ROP)
 
Ultima modifica:
Ragazzi cosa si sa sulla 1050? Ormai credo che sia quella insieme alla 470 la scheda a cui puntare per stare sotto i 200€
 
Ragazzi cosa si sa sulla 1050? Ormai credo che sia quella insieme alla 470 la scheda a cui puntare per stare sotto i 200€

non si sa ancora molto, quasi niente, è possibile che utilizzeranno sempre il GP106 visto nelle 1060, privato di un paio di TPC (ipoteticamente useranno blocchi GPC da 4 TPC invece che 5), di 16rop e due controller di memoria

quindi potrebbe essere ipoteticamente una scheda con 1.024CUDA, 64TMU, 32ROP e bus 128bit con 4gb di gddr5, capace di prestazioni comparabili alla vecchia gtx960 o qualcosina in più
 
Ultima modifica:
anche se fosse come dici tu e su ogni GPC di GP106 avessero collegato tre raster da 8ROP ciascuno non li potresti mai sfruttare tutti perchè un GPC è limitato ad un massimo teorico di 20 pixel per clock (4pixel per ogni Thread/Texture Processing Cluster presente nel GPC stesso), quindi moltiplicato per 2 GPC avresti 8ROP ugualmente non sfruttate sulle 48 totali presenti

su Pascal GP104 il limite è di 16 pixel per clock per ogni GPC per il semplice fatto che per ognuno di questi sono previste 16ROP

il diagramma corretto del GP104-200 delle 1070 è questo dato che NVIDIA ha confermato alle varie testate la presenza di soli 3 GPC in questa GPU e non quella disabilitazione casuale di qualche TPC per ogni GPC ;)

Visualizza allegato 210318

di conseguenza i due blocchi da 8 unità ROP in più sono lasciati attivi per consentire il collegamento dei due memory controller a 32bit in più, ma non sfruttati durante l'elaborazione (questo ovviamente limita la 1070 in termini di Pixel fillrate rispetto alla 1080, infatti si parla di valori sugli 80Gpixel/s invece di oltre 110Gpixel/s che sarebbero ottenibili sfruttando 64ROP)

Esatto, è quello che dicevo prima: alla fine anche se fisicamente ci saranno 48 ROP\s (non 32) attivi ne verranno sfruttati solo 40 per via degli SM.

Per quanto riguarda la 1070, non sono convinto: va troppo forte per avere 48ROP\s, la differenza con la 1080 è sempre sotto il 25%. E infatti le specifiche ufficiali parlano di 64ROPs.
 
Ultima modifica:
Esatto, è quello che dicevo prima: alla fine anche se fisicamente ci saranno 48 ROP\s (non 32) attivi ne verranno sfruttati solo 40 per via degli SM.

Per quanto riguarda la 1070, non sono convinto: va troppo forte per avere 48ROP\s, la differenza con la 1080 è sempre sotto il 25%. E infatti le specifiche ufficiali parlano di 64ROPs.

esatto, se è come dici tu, ma molto probabilmente così non è, e resto dell'idea che sulla 1060 le rop sfruttabili sono 32 delle 48 presenti :D

sulla 1070 infatti 64rop ci sono e sono attive, nessuno contesta questo, ma solo 48 vengono sfruttate avendo 3 GPC e da qui non si scappa visto che è stato ufficialmente confermato da nvidia alle varie testate (non so se sei in contatto con la redazione di questo sito, se si basta che glielo chiedi e vedrai che te lo confermeranno visto che l'azienda l'ha comunicato a tutte le redazioni a cui ha inviato i sample) ;)

di conseguenza nessuno può dire ad nvidia che ha rilasciato specifiche errate, perchè le rop in più effettivamente ci sono, solo che servono per il collegamento dei controller di memoria e non per altro :)
 
Ultima modifica:
esatto, se è come dici tu, ma probabilmente così non è, e resto dell'idea che sulla 1060 le rop sfruttabili sono 32 delle 48 presenti :D

sulla 1070 infatti 64rop ci sono e sono attive, nessuno contesta questo, ma solo 48 vengono sfruttate avendo 3 GPC ;)

di conseguenza nessuno può dire ad nvidia che ha rilasciato specifiche errate, perchè le rop in più effettivamente ci sono, solo che servono per il collegamento dei controller di memoria e non per altro :)

Sì tutto può essere finchè non c'è l'ufficialità, però vorrebbe dire che quel diagramma a blocchi è sbagliato...

Ma il GPC di per sè non ti limita a 16, se mai ti limita a 20, perchè ha 5SM. Se le ROPs attive sono 64 (ed è così visto il BUS) e non 48 allora ne può sfruttare 60.
 
Sì tutto può essere finchè non c'è l'ufficialità, però vorrebbe dire che quel diagramma a blocchi è sbagliato...

Ma il GPC di per sè non ti limita a 16, se mai ti limita a 20, perchè ha 5SM. Se le ROPs attive sono 64 (ed è così visto il BUS) e non 48 allora ne può sfruttare 60.

quel diagramma comprende tutto quello che c'è in gp106, ma non è corretto al 100% come disposizione dei vari blocchi

un gpc lo so che avrebbe un potenziale di 20 pixel per clock, ma a quel valore ci potresti arrivare solamente se i due raster presenti per ogni gpc fossero da almeno 10rop, peccato che sono due da 8rop, quindi 16 è il massimo pixel per clock di un intero gpc

nvidia ha confermato la presenza di 3 gpc in gp104-200, di conseguenza basta fare 3x16 e scoprirai che la 1070 arriva a 48 pixel per clock al massimo, contro i 64 pixel per clock della 1080 basata su gp104-400, nessuna limitazione invece con le memorie, visto che grazie alla presenza di quegli ulteriori blocchi rop abbiamo cmq un bus aggregato di 256bit anche sulla 1070 (8 memory controller da 32bit), nonostante la perdita di un intero GPC
 
Ultima modifica:
Pubblicità
Pubblicità
Indietro
Top