Aspettando Nvidia Pascal

  • Autore discussione Autore discussione Utente cancellato 159815
  • Data d'inizio Data d'inizio
Pubblicità
Stato
Discussione chiusa ad ulteriori risposte.
Ahahaha Vabbè...allora...
Cmq per il full chip GP 104 siamo sicuri che almeno la x80ti ce l'avrà?

Tu l'hai presa usata quella che è appena partita?

- - - Updated - - -

qua così dice...

Nono io usato non prendo mai nulla, troppo pignolo :asd: vendo e basta..
anche se in questo campo i migliori affari si fanno sui prodotti usati, venduti dagli inscimmiati.:asd: consapevole di questo.

Il gp104 equipaggerà la x80 che sarebbe il successore di gm204 full (gtx 980) da quella tabella hanno messo gp104 full successore di gm200 (gtx 980ti/titanx) imho non è proprio cosi, visto che il vero successore sarà il chippone gp100/102..

Probabile che questo gp104 andrà forte e darà un bel boost ricoprendo cosi la fascia prestazionale di gtx 980ti ad oggi, ma solo per le mere prestazioni, guardato come chip è chiaro che non ci troviamo di fronte alla vera punta di diamante di casa Verde..

Insomma non è il chip che spingerà pascal al massimo, il vero "BIG'' su mercato consumer è ancora un mistero
 
Ultima modifica da un moderatore:
Nono io usato non prendo mai nulla, troppo pignolo :asd: vendo e basta..
anche se in questo campo i migliori affari si fanno sui prodotti usati, venduti dagli inscimmiati.:asd: consapevole di questo.

Il gp104 equipaggerà la x80 che sarebbe il successore di gm204 full (gtx 980) da quella tabella hanno messo gp104 full successore di gm200 (gtx 980ti/titanx) imho non è proprio cosi, visto che il vero successore sarà il chippone gp100/102..

Probabile che questo gp104 andrà forte e darà un bel boost ricoprendo cosi la fascia prestazionale di gtx 980ti ad oggi, ma solo per le mere prestazioni, guardato come chip è chiaro che non ci troviamo di fronte alla vera punta di diamante di casa Verde..

Insomma non è il chip che spingerà pascal al massimo, il vero "BIG'' su mercato consumer è ancora un mistero


Ci sono due strade percorribili. Levare completamente la DP e creare un chip da oltre 4000 cuda con 8 GPC, oppure migliorare la predisposizione interna degli SM che passerebbero da 96 elementi a 64 totali, pur non modificando nessun registro per cuda, visto che i cuda FP64 vengono utilizzati solo quando è richiesta una precisione infinitesimale di una determinata elaborazione.

es. fluidodinamica, modelli matematici, calcolo scientifico ma non hanno alcuna rilevanza in game.

Cambiare l'accesso per SMM, cambierebbe nulla lato pratico in quanto le rop non sono più legate al rasterizzatore ma sono indipendenti ed accedono a 2/4 operazioni di color pixel.
Esempio con Kepler:
La 780 ha accesso a 48 rop fisiche ma i 4 raster le permettono di accedere a solo 32 rop (come la 680/770) e 40 per 780ti.

Aumentando il numero per GPC, aumenti anche la cache l2 e la l1 istruzioni, cosa che non avverrebbe modificando i soli GPC, tanto l'accesso rops e TMU sarebbe simile.

Per ora GP100/102 potrebbe essere lanciato con 3584cc, levati i 4 ridondanti, e magari subire una leggera decurtazione per vendere le Titan con pieno accesso ai calcoli DP ed FP32.

Il fattore che mi fa pensare ad un'ipotetico GP102 è nvlink, visto che i 4 canali dovrebbero essere riservati alle sole pro/tesla/titan/quadro e che in questo caso riguarderebbe anche la x80ti (opzione che sembra smentita per le comuni gaming, anche se la Titan va intesa sempre come geforce.


Da vedere ancora come saranno predisposti i geometry engine, già i 24g.tris della 980ti sono tanti, con 1 geometry per SM si arriverebbe a qualcosa di mostruoso lato geometrico.
 
Ci sono due strade percorribili. Levare completamente la DP e creare un chip da oltre 4000 cuda con 8 GPC, oppure migliorare la predisposizione interna degli SM che passerebbero da 96 elementi a 64 totali, pur non modificando nessun registro per cuda, visto che i cuda FP64 vengono utilizzati solo quando è richiesta una precisione infinitesimale di una determinata elaborazione.

es. fluidodinamica, modelli matematici, calcolo scientifico ma non hanno alcuna rilevanza in game.

Cambiare l'accesso per SMM, cambierebbe nulla lato pratico in quanto le rop non sono più legate al rasterizzatore ma sono indipendenti ed accedono a 2/4 operazioni di color pixel.
Esempio con Kepler:
La 780 ha accesso a 48 rop fisiche ma i 4 raster le permettono di accedere a solo 32 rop (come la 680/770) e 40 per 780ti.

Aumentando il numero per GPC, aumenti anche la cache l2 e la l1 istruzioni, cosa che non avverrebbe modificando i soli GPC, tanto l'accesso rops e TMU sarebbe simile.

Per ora GP100/102 potrebbe essere lanciato con 3584cc, levati i 4 ridondanti, e magari subire una leggera decurtazione per vendere le Titan con pieno accesso ai calcoli DP ed FP32.

Il fattore che mi fa pensare ad un'ipotetico GP102 è nvlink, visto che i 4 canali dovrebbero essere riservati alle sole pro/tesla/titan/quadro e che in questo caso riguarderebbe anche la x80ti (opzione che sembra smentita per le comuni gaming, anche se la Titan va intesa sempre come geforce.


Da vedere ancora come saranno predisposti i geometry engine, già i 24g.tris della 980ti sono tanti, con 1 geometry per SM si arriverebbe a qualcosa di mostruoso lato geometrico.

La prima opzione sarebbe tipo maxwell, visto che le unità dp sono inesistenti e si punta tutto a fp32.

8gpc sarebbe una cosa mostruosa, e ci starebbero visto che x80 è data su gp104 con 4gpc e ~300mm2 dove leveranno sicuramente le unità dp, quindi su 610mm2 ci potrebbero stare tenendo conto che il gp100 è mostruoso lato fp64 ha la metà dei core fp32.. il rapporto è l'esatta metà.. 3840+1920.. quindi si potrebbe puntare tutto su fp32 e creare un mostro anche laserando.. visto che per creare una cosa del genere non credo che le rese sarebbero altissime

io questo gp100 continuo a non vederlo su consumer, richiederebbe anche cambiare l'interfaccia, tesla utilizza NVlink, per renderlo compatibile ai noi comuni mortali dovrebbero cambiare


Hai parlato di geometry engine, dove nvidia già ad oggi va fortissimo con maxwell

Nvidia punta molto sulle geometrie dove amd è estremamente indietro, visto che si parla Di asynchronous compute dove amd è in vantaggio visto che dispone degli engine in hardware (ACE) pensi che ci sarà uno sbilanciamento nei giochi? o meglio amd sarà in grado di compensare le lacune di nvidia sotto questo punto di vista?

Ad oggi amd le prende di brutto sulle geometrie, con polaris hanno annunciato un nuovo geometry processor, probabile che recupereranno terreno sotto questo punto di vista..
 
Ultima modifica da un moderatore:
Nono io usato non prendo mai nulla, troppo pignolo :asd: vendo e basta..
anche se in questo campo i migliori affari si fanno sui prodotti usati, venduti dagli inscimmiati.:asd: consapevole di questo.

Il gp104 equipaggerà la x80 che sarebbe il successore di gm204 full (gtx 980) da quella tabella hanno messo gp104 full successore di gm200 (gtx 980ti/titanx) imho non è proprio cosi, visto che il vero successore sarà il chippone gp100/102..

Probabile che questo gp104 andrà forte e darà un bel boost ricoprendo cosi la fascia prestazionale di gtx 980ti ad oggi, ma solo per le mere prestazioni, guardato come chip è chiaro che non ci troviamo di fronte alla vera punta di diamante di casa Verde..

Insomma non è il chip che spingerà pascal al massimo, il vero "BIG'' su mercato consumer è ancora un mistero
Il vero big sono i nostri soldi che vanno via...
:asd:
 
La prima opzione sarebbe tipo maxwell, visto che le unità dp sono inesistenti e si punta tutto a fp32.

8gpc sarebbe una cosa mostruosa, e ci starebbero visto che x80 è data su gp104 con 4gpc e ~300mm2 dove leveranno sicuramente le unità dp, quindi su 610mm2 ci potrebbero stare tenendo conto che il gp100 è mostruoso lato fp64 ha la metà dei core fp32.. il rapporto è l'esatta metà.. 3840+1920.. quindi si potrebbe puntare tutto su fp32 e creare un mostro anche laserando.. visto che per creare una cosa del genere non credo che le rese sarebbero altissime

io questo gp100 continuo a non vederlo su consumer, richiederebbe anche cambiare l'interfaccia, tesla utilizza NVlink, per renderlo compatibile ai noi comuni mortali dovrebbero cambiare


Hai parlato di geometry engine, dove nvidia già ad oggi va fortissimo con maxwell

Nvidia punta molto sulle geometrie dove amd è estremamente indietro, visto che si parla Di asynchronous compute dove amd è in vantaggio visto che dispone degli engine in hardware (ACE) pensi che ci sarà uno sbilanciamento nei giochi? o meglio amd sarà in grado di compensare le lacune di nvidia sotto questo punto di vista?

Ad oggi amd le prende di brutto sulle geometrie, con polaris hanno annunciato un nuovo geometry processor, probabile che recupereranno terreno sotto questo punto di vista..


Maxwell ha sballato (consentimi il termine) molti, perchè è stato un chip completamente full fp32, diversamente da Kepler. Kepler GK110 era un chip con SMX maggiorati da 256 elementi di cui 192 destinati alla FP32 e 64 destinati alla FP64, quindi un chip full a ben 3820cuda, dove 2880cc erano FP64.
Se maxwell avesse avuto unità DP, il chip non avrebbe avuto molto senso lato gaming, visto che il rapporto anche di 1/4 permetteva di avere 2304cc FP32 e 768fp64.
Questo avrebbe cambiato molte cose.

Kepler ad oggi va male, ma la predisposizione interna può non essere ben percepita. Maxwell effettua 4 chiamate da 32, ogni "blocco" ha 8 FPU e 8 load store, Kepler invec eè disposto a 6x32, quindi il rapporto è di 6 SFU/load store e maxwell se chiama solo 4 unità di calcolo, 64 su kepler dormono.
Infatti ora Pascal ha adottato una sorta di GCN versione, dove si fa in modo di chiamare solo 64 thread e questo alla lunga svantaggerà Maxwell e renderà sempre più obsoleto Kepler (dove il driver deve chiamare 6 unità contemporaneamente.

Maxwell e Pascal integrano un sistema di code differente rispetto ad AMD, e non è detto che vedremmo mai ACE su Nvidia. Nvidia è scalare non vettoriale come AMD, dove gli shader spesso si ritrovano dei bucchi e gli ACE permettono di sviare questo in buona parte.
Con i giochi tripla AAA, vediamo come il tutto verrà implementato, è presto ora per stimare certe cose.


Nvidia geometricamente è molto più potente. Un'esempio banalissimo è l'unigine heaven, dove Nvidia ha un rapporto nettamente superiore ad AMD, tra triangoli disegnati e cancellati (culled). Fattore che permette anche a Kepler di essere molto potente, visto che il rapporto è quasi simile a gm204 ma la prima ha una banda ben superiore.
AMD ha una buona banda ma il rapporto tra triangoli disegnati e cancellati di una fury x è attualmente inferiore a quello di una 960.

Questo è un'aspetto che AMD dovrà necessariamente colmare, magari creando più gruppi di CU e rasterizzatori, altrimenti con Pascal il rapporto sarà sempre superiore.
 
Maxwell ha sballato (consentimi il termine) molti, perchè è stato un chip completamente full fp32, diversamente da Kepler. Kepler GK110 era un chip con SMX maggiorati da 256 elementi di cui 192 destinati alla FP32 e 64 destinati alla FP64, quindi un chip full a ben 3820cuda, dove 2880cc erano FP64.
Se maxwell avesse avuto unità DP, il chip non avrebbe avuto molto senso lato gaming, visto che il rapporto anche di 1/4 permetteva di avere 2304cc FP32 e 768fp64.
Questo avrebbe cambiato molte cose.

Kepler ad oggi va male, ma la predisposizione interna può non essere ben percepita. Maxwell effettua 4 chiamate da 32, ogni "blocco" ha 8 FPU e 8 load store, Kepler invec eè disposto a 6x32, quindi il rapporto è di 6 SFU/load store e maxwell se chiama solo 4 unità di calcolo, 64 su kepler dormono.
Infatti ora Pascal ha adottato una sorta di GCN versione, dove si fa in modo di chiamare solo 64 thread e questo alla lunga svantaggerà Maxwell e renderà sempre più obsoleto Kepler (dove il driver deve chiamare 6 unità contemporaneamente.

Maxwell e Pascal integrano un sistema di code differente rispetto ad AMD, e non è detto che vedremmo mai ACE su Nvidia. Nvidia è scalare non vettoriale come AMD, dove gli shader spesso si ritrovano dei bucchi e gli ACE permettono di sviare questo in buona parte.
Con i giochi tripla AAA, vediamo come il tutto verrà implementato, è presto ora per stimare certe cose.


Nvidia geometricamente è molto più potente. Un'esempio banalissimo è l'unigine heaven, dove Nvidia ha un rapporto nettamente superiore ad AMD, tra triangoli disegnati e cancellati (culled). Fattore che permette anche a Kepler di essere molto potente, visto che il rapporto è quasi simile a gm204 ma la prima ha una banda ben superiore.
AMD ha una buona banda ma il rapporto tra triangoli disegnati e cancellati di una fury x è attualmente inferiore a quello di una 960.

Questo è un'aspetto che AMD dovrà necessariamente colmare, magari creando più gruppi di CU e rasterizzatori, altrimenti con Pascal il rapporto sarà sempre superiore.
Già ma sono stati costretti altrimenti con i 28nm, non avrebbero potuto dare quel +45% da 780ti, alla fine in gaming come tu ben sai quello che contano sono i core fp32, quindi 3072/96 is the way..
il rapporto orribile di 1/32 fp64 era d'obbligo.. il gm200 è enorme 601mm2 secondo solo al più grosso GP100, sui 28nm hanno dato il massimo, anche fiji è stato castrato da questo punto di vista, quindi un problema comune per limiti di pp..

Si ho notato (già dal lancio) che su heaven la fury x fa punteggi da 970 OC, nella tessellation non c'è storia, qui anche gk110 è molto forte 780ti pari a 980 e gtx 780 in linea con gtx 970..
se parliamo di valley però la gtx 780 le suona alla 970, superano i 3000 punti in oc, fanno score da gtx 980, quindi come hai detto tu kepler gk110 non ha nulla da invidiare a gm204 da questo punto di vista, ovviamente sono chip di diversa fascia, ma anche gk110 è abbstanza potente, certo gm200 vola, infatti è incredibile in oc su heaven con il classico preset si sta tra i 105/110 fps.. pazzesco

- - - Updated - - -

secondo me hanno fatto il giro dei forum e vedendo la quantità di inscimmiati, anticipano il lancio :D
madonna non vedo l'ora, le fanno sudare queste schede:lol:
 
Ultima modifica da un moderatore:
Stato
Discussione chiusa ad ulteriori risposte.
Pubblicità
Pubblicità
Indietro
Top