GCN 2.0, Polaris la stella di casa Amd.

techfede · 23 Maggio 2016

zanflank ha detto:
Perché? Era quello che ci si aspettava

E' da capire come siano fatti quei bench (e se siano reali), ma stock vs stock non me le sarei aspettate sotto, sebbene di poco. Bisognerà vedere anche quanto prendono in oc, ma qua bisogna proprio aspettare i bench.

zanflank · 23 Maggio 2016

lucusta ha detto:
io uso una APU!

:asd:

329$-650$ to VR ready

Vega 650$
Polaris 2304 329$

sta cosa mi puzza... non si era parlato di 249$ per una gpu vr?

N3RO_RE · 23 Maggio 2016

lucusta ha detto:
no, nero..
Exclusive: AMD Radeon R9 480 based on Polaris 10 | VideoCardz.com
leggendo qui mi son reso conto che quello che vediamo e', dal basso:
LE (2048)
PRO(2304)
ma l'ultimo e' indicato, su 3dmark, come un CF, e probabilmente e' il CF di queste due insieme (che, per abberrazione, vede la piu' grande come la piu' piccola, e percio' fa' un CF di 2x2048... i conti tornano facendo 1.6x il valore piu' piccolo).

2560 ancora non c'e' li'...

porcaccia la miseria! sono le 7 di sera.. sto' qui a cazzarare co' sti' gochetti, e domani ho un esame... e so' talmente cotto dalla giornata che sti' numeri mi stanno ballando dentro la capoccia!

vabe', comunque....

rifacciamo 4 conti:
il piccolo e' il 2048, ma sta' proprio alto di frequenza... per stare cosi' vicino a 390x... la mia scala del potenziale lo pone a 1333mhz.
l'intermedio e' 2304, ma per stare cosi' vicino a fiji pro sta' in boost, a 1450-1500mhz (contro un setting normale di 1333mhz)
quello piu' alto e' una sbullaccata da non prendere in considerazione... non si fa' un CF con 2 schede diverse!

il 2560, con un clock di 1500mhz, dovrebbe farmi 24200, lo stesso valore della stock 1080 a 1607mhz... quella che si vede li', come potenziale, mi viene essere la FE a 1850mhz.
quindi a default, se questo e' a 1333mhz, farebbe 21600, se 1266mhz farebbe 20400... da una 980Ti ad una TitanX.

ed ora? indicano quella scheda (C7) come una 480... io per una serie x80 non ci spenderei piu' di 280 euro (la 380 sta' a 230 e quando e' uscita costava 280)...
bhe'... a 330-350 finiti fa' il botto. la 1070 fara' quanto una fury... a 479$ (quanto una fury, in euro e tassata!)...

I 2560 SP li vengono supposti da Whycry, che qualcosa la sa, tutto qui.

lucusta · 23 Maggio 2016

techfede ha detto:
E' da capire come siano fatti quei bench (e se siano reali), ma stock vs stock non me le sarei aspettate sotto, sebbene di poco. Bisognerà vedere anche quanto prendono in oc, ma qua bisogna proprio aspettare i bench.

la 1080 la devi considerare a 1850, che e' la frequenza a cui gira la FE prima di scaldarsi (20 minuti con la ventola al 50%), poi incomincia il "limitatore" e incomincia a rimbalzare anche a 1350... alla fine ha un valor medio che e' piu' o meno come la frequenza base: 1600mhz...
la 1080 e' una bellissima sòla cucinata in salsa rosa, ma sempre sòla alla fine e'.
al massimo puoi considerare una stock a 1733 di boost, ma in quelle condizioni fa' 25900, come quel CF mostrato (che sara' 2x2048)... cosi', almeno per un oretta, non ti da' problemi.
ipotizzzando una 1070 a pari frequenza (1733mhz), che fa' il 70%, questa si posizionerebbe a..18150, contro 18060 del C7...
tu credi per quale motivo AMD sta' ritardando al massimo l'uscita di polaris (anche agli AIB)?
perche' non ha la scheda, fatta vedere funzionare a gennaio, o perche' semplicemente vuole settare il bios alle prestazioni di 1070 (che ancora non si sa' come va')?

c'era un leak di 1070 a 1407mhz... messa a quelle frequenze va' tra' 980 e 970... impossibile che la presentino cosi' bassa (ha lo stesso die di 1080, e quel chip ha un bel costo).

GoLDii3 · 23 Maggio 2016

lucusta ha detto:
son bei numeretti, ma... no.... 350 non ce li spendo per una serie x80...almeno almeno 70 euro di meno come street price immediato.... di piu' e' approfittarsene.

quella scheda a 280 euro fa' passare di botto il 50% del mercato da nvidia a AMD, e ci troviamo a 75% contro 25%..
sarebbe nuovo mnopolio... non va' bene nemmeno cosi'...
facciamo 320?, cosi' si fa' un fifty/fifty?

Guarda che queste son fatte a 14 nm,l'ultima volta che AMD ha cambiato litografia la 7870 ossia la prossima 480 costava 350 dollari ed era veloce quanto la top di gamma precedente...cosa che con i benchmark postati accade di nuovo.

P10 senza un gocciolo di ottimizazzione driver sta vicino alla Fury.

Pretendere che costino come l'attuale 380/380x non fa nessun senso alcuno dato che l'architettura della 380x se la portano avanti dal 2011 con la 7950/7970.

lucusta · 23 Maggio 2016

zanflank ha detto:
sta cosa mi puzza... non si era parlato di 249$ per una gpu vr?

VR QHD.
il VR FHD lo lasciano per i portatili e le console.

PS:

come volevasi dimostrare, ergo la tesi....

quindi scusami se ho sbagliato... quel 27 e rotti lo devi considerare a 1866, poi lo scali a 1607mhz...
ed e' la FE in mano alle redazioni: i migliori chip del lotto (per un paper lanch).

sòla di scheda... chissa' quanti polli ci fregheranno!

Builder · 23 Maggio 2016

lucusta ha detto:
VR QHD.
il VR FHD lo lasciano per i portatili e le console.

PS:

come volevasi dimostrare, ergo la tesi....

quindi scusami se ho sbagliato... quel 27 e rotti lo devi considerare a 1866, poi lo scali a 1607mhz...
ed e' la FE in mano alle redazioni: i migliori chip del lotto (per un paper lanch).

sòla di scheda... chissa' quanti polli ci fregheranno!

Le tue analisi mi piacciono e sono molto istruttivo. Però non ti consiglio di andare nel trend Pascal a dire che la 1080 è una sòla, vorresti preso per ridicolo e per uno che non capisce niente.

Linodr995 · 23 Maggio 2016

Scusami, vedo che sei un appassionato in questo campo, perchè reputi la 1080 una sòla? Da quello che ho capito è la scheda più prestante in circolazione. Solo per curiosità xD, grazie.

Builder · 23 Maggio 2016

Linodr995 ha detto:
Scusami, vedo che sei un appassionato in questo campo, perchè reputi la 1080 una sòla? Da quello che ho capito è la scheda più prestante in circolazione. Solo per curiosità xD, grazie.

Da quello che ho potuto osservare....risulta tanto potente grazie soprattutto per via delle alte frequenze a cui opera...parlo da profano ma questo è quello che deduco

Linodr995 · 23 Maggio 2016

Builder ha detto:
Da quello che ho potuto osservare....risulta tanto potente grazie soprattutto per via delle alte frequenze a cui opera...parlo da profano ma questo è quello che deduco

Grazie per la risposta, comunque mi riferivo a @lucusta che si è prodigato in analisi approfondite e mi ha incuriosito, mentre scrivevo la risposta hai inserito la tua e non me ne sono accorto xD.

techfede · 23 Maggio 2016

lucusta ha detto:
ed e' la FE in mano alle redazioni: i migliori chip del lotto (per un paper lanch).

sòla di scheda... chissa' quanti polli ci fregheranno!

Si però tu stai parlando della FE, non sappiamo cosa possa fare quel chip con un buon pcb di qualità e un buon dissipatore.
Che quella scheda, così come è stata presentata, sia una presa in giro siamo d'accordo, ma sembra anche che sia il contorno a limitarne la potenza.

Inviato dal mio ONE E1003 utilizzando Tapatalk

Il nabbo di turno · 23 Maggio 2016

Builder ha detto:
Da quello che ho potuto osservare....risulta tanto potente grazie soprattutto per via delle alte frequenze a cui opera...parlo da profano ma questo è quello che deduco

Io aspetterei delle custom serie per giudicarla, quel pcb da falegnameria non mi convince molto.

lucusta · 23 Maggio 2016

ci vado ogni giorno... mi diverte un sacco prendere in giro quelli che ci credono!

ricorda: io ho una APU, e probabilmente avro' smesso di giocare al PC quando sei nato... ;)
vado per i 9 lustri.

Builder · 23 Maggio 2016

Linodr995 ha detto:
Grazie per la risposta, comunque mi riferivo a @lucusta che si è prodigato in analisi approfondite e mi ha incuriosito, mentre scrivevo la risposta hai inserito la tua e non me ne sono accorto xD.

Ho sbagliato di citare, dovevo citare lucusta. Sicuramente ti darà una risposta valida alla tua domanda.

- - - Updated - - -

Il Nabbo di sopra ha detto:
Io aspetterei delle custom serie per giudicarla, quel pcb da falegnameria non mi convince molto.

Le conclusioni finali si faranno certamente con le custom che avranno il vantaggio di tirare ancor più su le frequenze e a maggior ragione la frequenza farà il risultato migliore nei punteggi.secondo me una buona architettura deve dare buoni risultati già a basse frequenze (rossa o verde che sia) e tutto ciò che si guadagna aumentando le frequenze ben venga.

lucusta · 23 Maggio 2016

e' una questione di architettura.
per creare un mondo 3D ci vuole un'architettura capace di risolverti una matrice a 3 dimensioni, tale che puoi fare il cambiamento di base e quindi conoscere come orientare e cuvare le texture.
per risolvere una matrice con 3 vettori devi effettuare 16 passaggi di calcolo, quindi ti ci vuole una pipeline (un processo di computazione) a 16 stadi finiti.
Maxwell l'aveva.
fiji no...
fiji si affidava ad un'architettura superscalare, con tanti core, ma di soli 8 stadi pipeline, e pur avendo 4096 core, risulta piu' lento della 980 TI, che ne conta solo 2880.
attento, qui e' il difficile:
di per se uno stadio lo superi in un clock operativo, quindi 16 stadi = 16 clock = 1 processo completo; 8 stadi = 8 clock = 1/2 processo.... e che ci fai con solo 1/2 processo? nulla...
allora usa altri 4 clock per prendere e metterlo in coda ad un altro (ma anche allo stesso ) core per finire il lavoro... quindi il lavoro diventa 8+4+8=20 clock, o meglio 12+8.
la situazione era questa.
quanto lavoro facevano i due?
2880/16=180
4096/12/2=170.6 (perche' la prima meta' ti costa 12 clock, ma devi fare anche la 2° passata per terminare il lavoro)
a questo punto... quanto lavoro possono fare per la frequenza che hanno?
180*1050mhz=189.000
170.6*1050=179.200
guarda i benchmark:
20507 contro 19315 (rapporto 0.942)
179.200/189.000 (rapporto 0.948)

questo era MAxwell in DX11

ora le DX11 sono alla frutta. non possono piu' tirare la carretta, perche' con al massimo 2 thread, su un multicore da 3 ghz, vai come se avessi un dual core da 3ghz...
la legge di moore e' morta, se consideri solo la frequenza, mentre e' ancora sostenibile se consideri la frequenza per il numero dei core.
il prossimo processore mainstream intel avra' 8 core ma clockera' al massimo a 3.5ghz.

e questo che cambia?
bhe'... Maxwell aveva il piccolo problema che buttava dentro la pipeline e solo alla fine poteva storare il dato... non era interrompibile...
con l'AC aveva i suoi problemi.
fiji invece poteva fare come gli pareva... aveva un registro a stadio, quindi il calcolo si poteva interrompere, storare, e riprendere da dove si era interrotto, ad esignza della situazione... pero' aveva pipeline corte.

quindi che cosa e' successo:

nvidia si ritrova su TSMC, con un PP a 16nm che va' bene per i core A7 e gia' strabbuzza gli occhi con i chip A9 di apple... consente maggior densita', ma non come il 14nm messo appunto da AMD/GF/Samsung, e non con le stesse rese... con i chip grandi non va' tanto bene.
allora, capito l'andazzo, mette una pezza a Maxwell su AC, introducendo uno stadio intermedio alla pipeline per aggiungere il registro... non lo fa' su tutti gli stadi perche' tra' 16 e 14nm ci passa il 30% di superficie a pari densita' normalizzata (ossia, per un miliardo di transistor a 14nm, con lo stesso spazio relativo dagli altri, ti ci vuole il 30% in piu' di superficie)... gli ci vuole troppa roba per farlo, anche perche' e' abbituata a fare solo 3 chip, quelli PRO, e a disabilitare la parte PRO (che continua ad esserci, ma e' silente), e poi disabilitare vari moduli del processore per fare la sua gamma.
quindi, se ci lasci la roba da PRO, se gia' devi essere il 30% piu' grosso, se le rese son pure scarsine... sai che facciamo? visto che di silicio ne usiamo di piu', e che parte di questo sta' "spento" e non scalda piu' di tanto (perche' la roba disabilitata clocka lo stesso, ma non avendo passaggio, scalda poco), noi mettiamo sta' pezza a Maxwell per le DX12 con un solo stadio aggiuntivo (ma perche' non metterlo accanto e lasciarne solo 16? No, che dobbiamo poi rifare lo stadio per intero... invece ne facciamo solo uno che "prendi dato, clona, metti in reg e metti in pipeline", non tocchiamo gli altri, che vanno bene)... poi?.. a si.. poi, visto che siamo un po' piu' larghi.. spariamo la frequenza e recuperiamo le prestazioni...
hei capo, ma e' rischioso!
non abbiamo alternativa, senno' ci tocca proggettare una maschera a chip... e quanto ci costa (e quanto ci stiamo!).
quindi nasce Pascal, che non e' tanto piu' piccolo di Maxwell, adotta nuove e fantastiche tecnologie (aka: misero reg in piu'), tali che in VR ti da' il doppio....
ehm.. signori, no... in VR puo' garantire il doppio solo se diciamo ai programmatori che devono fare in modo che il giocatore non pieghi la testa da un lato, con un occhio piu' alto e uno piu' basso...
e perche' mai?!?
he capo, ci ha fatto mettere solo un reg?
con quello possiamo spostare mezza matrice e rifare l'immagine da un'altra prospettiva, ma solo se il tizio rimane con gli occhi paralleli all'orizzonte, perche' se piega di lato la testa non possiamo semplificare la matrice a sole 2 dimensioni ed una vincolata... ne abbiamo tutte e tre, con tutti e tre i gradi di liberta' che sono necessari... e cosi' non ci facciamo nulla.... il nostro SMP fantastico per il multimonitor, sugli occhialetti 3D deve funzionare allo stesso modo: visuale con un asse vincolato, ossia quello orizzontale.

ok, ma a prestazioni? come siamo messi?

e, bhe'... prima, con 2880 cuda a 1050mhz facevano 189000 work, ora ne abbiamo potuti mettere solo 2560, ma possiamo spingerci a 1866 ad aria per almeno 20 minuti!
solo che ora eseguiamo 16/17 dei work di prima, perche' siamo piu' lunghi di pipeline, percio' siamo a...2560/17*1866=281.000 work!
fantastico, abbiamo migliorato!
e bhe'... per i primi 20 minuti siamo al ( 281.000/189.000=1.48...) 50% superiore a 980Ti! ossia 980Ti vale il 67.3% della nuova scheda!
ma solo per 20 minuti...
come 20?
e si... il die e' piccolo... ci buttiamo dentro 180W (anzi.. le volevo dire... abbiamo deciso di non mettere l'altro 6 pin di alimentazione, perche' senno' tutti a giocare con l'overclock e bruciano un sacco di schede... poi si fanno una brutta fama...)... si, si.. avete fatto bene...
insomma, quanto va'?
tolto l'overclock?
facciamo 241.000 work, il 33.8% in piu' di Ti... una Ti vale il 75% della nostra nuova scheda... Ma solo dopo 20 minuti!
e c'e' un problemino...il bus e' piccolo, e in 4K, anche con le 2.5ghz, non ce la fa' piu' di tanto...
quindi?
quindi in 4k siamo proprio al limite...la ristrettezza di banda ci fa' perdere il vantaggio dell'overclock...
vabe'... rimedieremo con la prossima.. ora fammi fare 2 conticini e fammi preparare un bel discorsetto..

dall'altra parte?
i 14nm?
vanno bene.
le HMB2?
non ce le fanno fino a settembre.
la matrice?
l'abbiamo messa a 16 stadi con reg.
le DDR ci possono andare bene?
mettiamo quelle dell'anno scorso.
e le DDRx?
le usiamo sulle X.
e il VR?
possono pure saltare come pinguini fuori dall'acqua, la matrice regge tutto.
bene...
e i consumi?
stiamo aspettando gli altri... se loro alzano, noi alziamo, se loro abbassano, noi abbassiamo; comunque siamo il 30% in meno... sempre.
bene, bene...
quanto dobbiamo aspettare?
il computex.
eh... ma sono 6 mesi...
faciamo un tresette?

..ma Jim? ha finito il lavoro?
si.
dove sta'?
mha.. e' salito su una macchina, e se ne e' andato.
non e' passato manco a salutarmi!?!?
lui e' cosi'...

tresette?

oggi cazzeggio... scusate.

- - - Updated - - -

fa' 2300mhz a tirargli il collo sotto liquido e a mandargli 260W su 314mm^2...

680: 294mm^2 195w
770: 294mm^2 230W
980: 398mm^2 165W
anche sparata al massimo arrivava a 220-230W

un chip puo' sopportare al massimo 0.75-0.8W mm^2.
314*0.75=235
314*0.80=250
questo e' il range operativo prima di bruciarlo...

180W*2300/1607=258W, e senza alzare il vcore...
logico, qui e' la somma di memoria e chip (e circuiteria), ma quel chip non sale a piu' di 2300 su un normale sampler...(se lo raffreddi a liquido).

GCN 2.0, Polaris la stella di casa Amd.

techfede

Utente Attivo

zanflank

N3RO_RE

lucusta

GoLDii3

lucusta

Builder

Utente Attivo

Linodr995

Utente Attivo

Builder

Utente Attivo

Linodr995

Utente Attivo

techfede

Utente Attivo

Il nabbo di turno

lucusta

Builder

Utente Attivo

lucusta