ma non potrebbe essere il famigerato gp104-150?
per la 1080Ti forse, per la titan si parla di GP100.
Nvidia ha sempre usato la sua tecnologia implementando i chip PRO nel mercato Consumer, disabilitando le parti non espressamente necessarie (ed evitando di usare le consumer come pro), e nemmeno nei chip base hanno mai esulato questa regola.
fanno dei moduli e li scalano in quantita' per aumentare le prestazioni (come fanno tutti).
quindi se danno la Titan per 3840 CUDA, e' un GP100 da 610mm^2 e 512b ddr o 4096b HBM2 (ricordando che GP100 e' in pratica un GP104x2).
conviene per nvidia usare lo stesso chip per una 1080 Ti?
difficile stabilirlo cosi'...
se io avessi molti chip fallati, tali che solo il 50% di quelli che produco siano buoni (perche', per aumentare le rese, gia' considero buoni quelli che sono la 25 percentile, ossia anche quelli che hanno il 25% dei CUDA danneggiati), potrei decidere di ulitizzare il restante 50% per produrre da quei chip un nuovo modello che disabilita un'altro 12.5% dei CUDA (siano questi funzionanti o meno... tanto gia' almeno il 25% del totale e' danneggiato e non possono essere GP100); quindi, invece di buttarli, uso questi.
percio' decido di usare questa strategia solo se i numeri dei chip da buttare (quelli irrimediabilmente non funzionanti perche' i danni prendono parti uniche ed essenziali del chip) siano tanti, ma che il restante numero sia sufficiente a garantirmi i numeri di vendita della lineup che ho programmato.
in parole povere se su 100 chip 20 ne devo buttare perche' hanno compromesso il bus dati o la caches, ma degli 80 che restano almeno 60 sono buoni nelle parti essenziali e per il 67.5% dei CUDA tali da garantirmi i numeri per la produzione di un modello intermedio, con 20 che mi garantiscono almeno il 75% dei cuda funzionanti, lo faccio.
il vero problema e' che per fare 20 chip GP100 devo produrne 100 e buttarne comunque 20.
brutta resa.
se avessi un processo che mi garantisce almeno il 75% dei chip ottimi per il target, non adotterei questa stramba strategia, perche' silicio e lavorazione hanno un costo.
il GP102 cosi' dichirato, a 3456 CUDA, anche usandolo per la linea PRO e quindi facendo avanzare un sacco di transistor, in una linea produttiva ottimale sarebbe di soli 412mm^2, ossia per ogni GP100 ne farei 3.
quindi se separo le linee per fare 20chip buoni GP100 dovrei farne 26-27 e buttarne 6 o 7, mentre per fare 60 GP100 ne dovrei fare 80, con 20 fallati, ma quegli 80 occuperebbero solo lo spazio di 53-54 chip GP100.
se volevo lo stesso numero di chip da un solo processo, ossia quello di GP100 dovrei produrre almeno 60 chip funzionanti come GP102 e almeno 20 come GP100, ossia 80 chip. quindi dovrei sperare che in 100 chip ce ne siano almeno 80 buoni (che in effetti non e' piu' il target di resa della nostra ipotesi iniziale, posto a 75%);
ammettendo che ci riesca comunque, sto' pero' facendo 100 GP100... nell'altro modo, separando le linee avrei usato lo spazio di quei 100 chip per fare 25 chip GP100 buoni e 75 GP102 buoni, ossia un totale di 100 chip buoni, non solo 80, ed ho pure fallato la resa, perche' dovro' ottenere 80/100 e non solo 75/100.
quindi se sono costretto ad usare questa strategia e far uscire GP102 come cut di GP100, e' perche' la mia resa non supera il 60% su un percentile del 37.5%, quindi e' decisamente una brutta resa per fare chip cosi' grossi.
lo stesso discorso vale per l'ipotetico uso di GP104 per produrre GP106...
insomma il processo a 16nm di TSMC e' realmente pessimo per fare chip cosi' grossi.
Enorme la differenza di livello tra 1080 e 1080ti!
Inviato dal mio Redmi Note 3 utilizzando Tapatalk
+25% prestazionale, come e' consuetudine per questa classe, rapportanto CUDA e fequenze.
probabilmente quel chip difficilmente riuscira' a smaltire bene il calore prodotto in boost costante (conta che GP100 PRO gira a soli 1300mhz), quindi si assottigliera' al +17%.
quando ci saranno tutti i chip in produzione, con il prezzo finale e le statistiche di diffusione, si potra' stimare l'efficienza del processo 16nm, ma a prima occhiata non sembra granche', e gia' lo si nota dall'uso di GP104 sia per 1080 che 1070...
e' vero che prima si e' gia' fatto, ma qui ci sono molti piu' vincoli perche' molti piu' transistor da fare...
stai ottenendo le prestazioni di un chip da 398mm^2 (980) con uno da 314mm^2 (1070)... un guadagno del 25%, anche se con numeri di diffusione differenti.... ma non mi sembra un bell'andare.