UFFICIALE GTX 1060

  • Autore discussione Autore discussione Utente cancellato 159815
  • Data d'inizio Data d'inizio
Pubblicità
quali sono le differenze tra una 1060 della palit e una della msi o gigabyte per esempio? ovviamente non avete i benchamark ma cambiano di molto le prestazioni tra una casa e l'altra di solito?

Cambia magari il PCB che può essere mantenuto custom e variano la dissipazione, oppure PCB e dissipazione custom come le msi gaming x sorelle maggiori, questo però è da vedere appena escono tutte le specifiche e si capische bene quale pcb ha e se ha alimentazione supplementare eventualmente
 
Le rop sono 48 solo per confermare il bus a 192, ma che in effetti non è in grado di utilizzare :)
 
cdvxz.webp

più evidente di così si muore, basta guardare il pixelfillrate per rendersene conto, frequenza operativa* numero rop's e da come risultato il pixelfillrate effettivo

le rop's sono 32, la metà di gtx 1080

48 solo sulla carta, come le 96 solo sulla carta di gtx 980ti, 88 accessibili.. e tante altre schede vedi gk110
 
le ROPs attive presenti sono 48, quindi le specifiche ufficiali sono corrette;)
solamente che per ovvi motivi, avendo solo una coppia di GPC, le ROPs realmente sfruttabili per l'elaborazione sono 32

hanno lasciato attive le ulteriori 16 ROPs esclusivamente per consentire il collegamento di una coppia di memory controller in più, altrimenti la 1060 sarebbe stata limitata ad un bus aggregato massimo di 128bit

alla stessa maniera la 1070, ne ha 64 attive per non perdere il bus aggregato di 256bit, ma in realtà l'elaborazione avviene sfruttandone solamente 48 (GP104-200 ha 3GPC attivi completi ed uno completamente disattivato)

Mi sembrava strano, pensavo si riferisse ad un'eventuale versione 3 gb con bus a 128 bit di cui non ero a conoscenza.
Quindi era giusto 48 rops.
Aggiungo la nota di quelle sfruttabili, allora.
 
Quella 3gb forse entro l anno esce anche se vabbè a me ste divisioni fra modelli e giga le trovo insensate, ma magari voi mi fate cambiare idea :)
 
in blending comunque le usa in certi casi, sempre da hardware.fr, quindi non sono completamente non sfruttabili..
sfdefsd.webp




''Les GeForce traitent le blending en FP32 à une vitesse de 1/8ème alors que ce format est "seulement" 4x plus gros que l'INT8. Par conséquent la limite au niveau du fillrate se transfère à leur niveau, ce qui permet de confirmer, autant en 1x FP32 qu'en 4x FP32, que la GTX 1060 et le GP106 disposent bien de 48 ROP fonctionnels.''
 
Mi sembrava strano, pensavo si riferisse ad un'eventuale versione 3 gb con bus a 128 bit di cui non ero a conoscenza.
Quindi era giusto 48 rops.
Aggiungo la nota di quelle sfruttabili, allora.

non puoi avere una versione da 3GB con un bus di 128bit ;)
si vociferava di una 1060 con 3gb (zotac mini itx se non ricordo male) ma con bus sempre di 192bit, ma cmq nulla di ufficiale, NVIDIA prevede esclusivamente il modello da 6GB della 1060

- - - Updated - - -

in blending comunque le usa in certi casi, sempre da hardware.fr, quindi non sono completamente non sfruttabili..
Visualizza allegato 211766




''Les GeForce traitent le blending en FP32 à une vitesse de 1/8ème alors que ce format est "seulement" 4x plus gros que l'INT8. Par conséquent la limite au niveau du fillrate se transfère à leur niveau, ce qui permet de confirmer, autant en 1x FP32 qu'en 4x FP32, que la GTX 1060 et le GP106 disposent bien de 48 ROP fonctionnels.''

infatti sono attive le ROPs, non a caso le specifiche di NVIDIA sono corrette ;)

quelli di Hardware.fr intendono dire che sarebbe possibile memorizzare 48 pixel per MSAA

la realtà è che per ogni ciclo di clock è possibile memorizzare un massimo di 40 pixel avendo 2 GPC da 5 SM (il crossbar è bidirezionale ed ogni unità SM può attingere da ogni partizione ROPs)

poi l'elaborazione avviene sempre sfruttando solo 32 ROPs effettive, quindi un massimo di 32 pixel per ogni ciclo di clock

da questo non si scappa, il limite nell'elaborazione è dato dalla presenza di soli 2 GPC, una 1060 si comporterà sempre come una full 32ROPs sia in buffer che in blending
 
Ultima modifica:
non puoi avere una versione da 3GB con un bus di 128bit ;)
si vociferava di una 1060 con 3gb (zotac mini itx se non ricordo male) ma con bus sempre di 192bit, ma cmq nulla di ufficiale, NVIDIA prevede esclusivamente il modello da 6GB della 1060

- - - Updated - - -



infatti sono attive le ROPs, non a caso le specifiche di NVIDIA sono corrette ;)

quelli di Hardware.fr intendono dire che sarebbe possibile memorizzare 48 pixel per MSAA

la realtà è che per ogni ciclo di clock è possibile memorizzare un massimo di 40 pixel avendo 2 GPC da 5 SM (il crossbar è bidirezionale ed ogni unità SM può attingere da ogni partizione ROPs)

poi l'elaborazione avviene sempre sfruttando solo 32 ROPs effettive, quindi un massimo di 32 pixel per ogni ciclo di clock

da questo non si scappa

Ma se può elaborarne 40 pixels e ha 48 rops, perchè si ferma a 32?
Capisco GTX 970 che con 56 rops effettive elaborava al max 52 pixels o 1080 su un potenziale massimo di 80 si ferma a 64 e ci sta, non capisco la logica di 1060 in tal senso.
 
Ma se può elaborarne 40 pixels e ha 48 rops, perchè si ferma a 32?
Capisco GTX 970 che con 56 rops effettive elaborava al max 52 pixels o 1080 su un potenziale massimo di 80 si ferma a 64 e ci sta, non capisco la logica di 1060 in tal senso.

ogni GPC è associato ad un raster da 16 ROPs (suddiviso in due blocchi da 8 unità), quindi moltiplichi x2 ed ottiene il massimo delle ROPs elaborative

per poter sfruttare effettivamente 40 ROPs avrebbero dovuto utilizzare rasterizzatori da 20 e non da 16 unità, in questo modo avrebbero sfruttato appieno le potenzialità del GPC (composto da 5 SM capaci di elaborare un massimo di 4 pixel per clock ciascuno)

non ho idea del perchè non l'abbiano fatto, potrei supporre che il motivo sia quello di rendere più semplice il collegamento in eventuali varianti decurtate di fascia bassa
 
Ultima modifica:
Ma se può elaborarne 40 pixels e ha 48 rops, perchè si ferma a 32?
Capisco GTX 970 che con 56 rops effettive elaborava al max 52 pixels o 1080 su un potenziale massimo di 80 si ferma a 64 e ci sta, non capisco la logica di 1060 in tal senso.

:ciaociao:
Provo a darvi una mano.
Le rop's sono 48 (almeno per collegamento)
1 GPC è collegato a 64 bit da 16 rop's e 512kb l2.
Un canale da 32 bit, richiede 8 rop's collegate a 256kb per 1gb.
Lo SMM di nvidia è composto da 4 warp, ogni warp, ha il suo scheduler e due dispacht che si occupano sopratutto di load store ed sfu.
Ogni scheduler invia 32 cuda, 8 LDS ed 8 SFU.
Le SFU, operazioni trascendentali, sono 8 per 4 warp, necessitano di 4 cicli di clock e sfornano un pixel ogni due SFU per un totale di 4 pixel.

10 SMM possono sfornare 40 pixel, purtroppo il rasterizzatore non è esteso a 20 pixel ma a 16 come maxwell, di conseguenza i 40 pixel vengono processati, memorizzati ma non possono essere tutti elaborati, solo 32 alla volta.

Le rop's di Nvidia non sono come quelle di AMD (questo è complesso da spiegare) ma sono per interi da 8 bit e riempimento dello z-buffer (le unità preposte a svolgere il color ops sono in grado di svolgere anche il color ops).
Le Rop's AMD sono ottimizzate per il blending ed operazioni MSAA per questo generalmente sono in minor quantità, ma necessitano di una banda molto ampia per poter lavorare bene, tanto che la 7970 è uscita a 384bit per non limitare il lavoro delle rop's.

Nvidia riempie lo z-buffer alla massima velocità (AMD avrebbe bisogno di due cicli ma è da MSAA.), ed i dati dello z-buffer sono utilizzati per calcolare la distanza degli oggetti dall'osservatore e quindi, per le operazioni di rimozione dei poligoni nascosti.
Quindi nvidia ha bisogno di tante rop's per fare ciò, ma bastano alcuni texel per pixel per vedere il fillrate pressochè dimezzarsi.
Solo con i sintetici come beyond che calcolano il fill rate pure a 8 bit, puoi calcolarti i valori teorici stimati per clock/rop's.


Per concludere, se devi campionare un MSAA8x, AMD batterebbe una Nvidia con il doppio delle rop's, spesso anche di altre fasce.
 
:ciaociao:
Provo a darvi una mano.
Le rop's sono 48 (almeno per collegamento)
1 GPC è collegato a 64 bit da 16 rop's e 512kb l2.
Un canale da 32 bit, richiede 8 rop's collegate a 256kb per 1gb.
Lo SMM di nvidia è composto da 4 warp, ogni warp, ha il suo scheduler e due dispacht che si occupano sopratutto di load store ed sfu.
Ogni scheduler invia 32 cuda, 8 LDS ed 8 SFU.
Le SFU, operazioni trascendentali, sono 8 per 4 warp, necessitano di 4 cicli di clock e sfornano un pixel ogni due SFU per un totale di 4 pixel.

10 SMM possono sfornare 40 pixel, purtroppo il rasterizzatore non è esteso a 20 pixel ma a 16 come maxwell, di conseguenza i 40 pixel vengono processati, memorizzati ma non possono essere tutti elaborati, solo 32 alla volta.

Le rop's di Nvidia non sono come quelle di AMD (questo è complesso da spiegare) ma sono per interi da 8 bit e riempimento dello z-buffer (le unità preposte a svolgere il color ops sono in grado di svolgere anche il color ops).
Le Rop's AMD sono ottimizzate per il blending ed operazioni MSAA per questo generalmente sono in minor quantità, ma necessitano di una banda molto ampia per poter lavorare bene, tanto che la 7970 è uscita a 384bit per non limitare il lavoro delle rop's.

Nvidia riempie lo z-buffer alla massima velocità (AMD avrebbe bisogno di due cicli ma è da MSAA.), ed i dati dello z-buffer sono utilizzati per calcolare la distanza degli oggetti dall'osservatore e quindi, per le operazioni di rimozione dei poligoni nascosti.
Quindi nvidia ha bisogno di tante rop's per fare ciò, ma bastano alcuni texel per pixel per vedere il fillrate pressochè dimezzarsi.
Solo con i sintetici come beyond che calcolano il fill rate pure a 8 bit, puoi calcolarti i valori teorici stimati per clock/rop's.


Per concludere, se devi campionare un MSAA8x, AMD batterebbe una Nvidia con il doppio delle rop's, spesso anche di altre fasce.

Grandissimo come sempre:party:

Mike quando hai tempo, puoi dare un tuo parere sula nuova titan x, o meglio secondo te con il tempo i 3840cc li vedremo?
Secondo me questa titan x non sarà il massiml del.massimo su pascal..
C'è il thread titan x, sarei curioso di sapere cosa ne pensi
 
essendo la 1060 già "tirata" e già di suo abbastanza silenziosa e che scalda poco, cosa cambia quindi tra una custom tipo la palit dual e invece la strix? Ovviamente a parte le frequenza del clock che regalano qualche fps, poi?
Confermate che si cade in piedi anche con quella di qualità inferiore?
 
essendo la 1060 già "tirata" e già di suo abbastanza silenziosa e che scalda poco, cosa cambia quindi tra una custom tipo la palit dual e invece la strix? Ovviamente a parte le frequenza del clock che regalano qualche fps, poi?
Confermate che si cade in piedi anche con quella di qualità inferiore?
si certo,paghi il Brand..
la strix e piena di led rgb..backplace ecc..
la scheda è quella..le prestazioni pure..
ed una palit su tao si trova 275euro..mica male

Inviato dal mio SM-N920C utilizzando Tapatalk
 
si certo,paghi il Brand..
la strix e piena di led rgb..backplace ecc..
la scheda è quella..le prestazioni pure..
ed una palit su tao si trova 275euro..mica male

Inviato dal mio SM-N920C utilizzando Tapatalk

No non è paghi il brand, paghi la qualità costruttiva, ok la palit ha un buon dissi, e la 1060 ha un tdp medio/basso, ma la strix ha un bel pcb, quello della palit dovrebbe essere reference, molto più scarno.
 
Pubblicità
Pubblicità
Indietro
Top