Eh una grossa perdita effettivamente se consideriamo che parliamo di tre giochi su oltre centomila esistenti solo su steam... O fai 600 run su Alan wake 2 solo per il Path tracing?
Il punto non è questo, il punto è che ormai valutare una scheda solo in performance raster è un metodo obsoleto e poco attinente alla realtà per utilizzare un eufemismo.
La rispiego per l'ennesima volta, a nvidia della performance raster non interessa proprio, ma questo l'ha fatto capire già a partire dal 2018 con le Rtx 2080ti, basta guardare come negli anni non sia aumentato esponenzialmente il valore di pixel fillrate, per via del fatto che la rasterizzazione x gpc è sempre a 16 pixel.
Un gpc può elaborare fino a 16 pixel (rop's) e questo valore se guardo nel corso degli anni è rimasto immutato dai tempi di maxwell.
Quindi il back-end della scheda è rimasto debole, le rop's sono aumentate per via dell'aumento del numero di GPC, ed il pixellfill è la moltiplicazione della frequenze del core per il numero rop's.
Le rop's principalmente venivano sforzate quando si applicavano filtri AA pesanti, tipo MSAA 4x/8X , difatti i chip di punta come (esempio) 980ti/1080ti staccavano di brutto i vecchi chip xxx04 sulle xx80 appena si aumentava il computo, oggi MSAA non esiste più praticamente, la strada è inversa, si tent adi alleggerire il computo con il DLSS, non di appesantirlo.
Come dicevo se guardo indietro mi accorgo che:
Kepler
8 pixel/rop's x gpc,
maxwell 16 rop's per gpc, fino ad oggi che abbiamo
sempre 16 pixel con le 5000.
In 10 anni non hanno portato i pixel a 32, come mai?
Il chip GB202 della 5090 ha 12 gpc (con all'interno 8tpc con 256cc ciascuno) ma essendo un cut perde un GPC quindi 11 e vengono disabilitati alcuni tpc, per questo perde 16 pixel, quindi la conta scende a 176 rop's.
La 5080 ha 7 GPC full, quindi se moltiplichi per 16 le rop's sono 112.
Se nel tempo nvidia avesse puntato alla rasterizzazione, molto probabilmente avrebbe aumentato il blocco dei pixel/rop's portandolo a 32 (il doppio) portando cosi 5090 a 352 rop's e 5080' a 224, con tutt'altre prestazioni a livello geometrico e quindi elevare quelle che oggi sono le performance generali.
Questo ovviamente comporta limiti di spazio nel die, e se già con la 5090 sei a 750mm2 (limite del reticolato sui wafer odierni) non puoi minimamente pensare di ingrandire ancora più l'architettura prendendo ulteriore spazio e ingrandendo i GPC, quindi devi scegliere, o metti RT core e Tensor o continui a fare chip alla vecchia maniera, solo full fp32 (stile maxwell-pascal).
Abbiamo visto come perdere solo poche rop's abbia comportato anche cali di performance del -10%, i famosi chip fallati del D1.
Se confronti 5080 112 rops e 5090 176 rop's noterai che il rapporto CUDA/rop's è a favore della 5080 avendo la metà dei cuda, ed è anche per questo motivo che la 5090 pur avendo 2x di CUDA e oltre +80% di BW non riesce a scalare, ed è sbagliatissimo contare i cuda come fanno molti senza guardare le altre specs, infatti, di certo non fa 2x sulla 5080, ma si ferma a fare +50%, visto che moltiplica le specifiche di 2x su cuda e bus ma non moltiplica di certo la geometria.
Quindi, non sarà più cosi, le performance arriveranno con il contagocce, nvidia non è intenzionata a sprecare silicio mettendo specs esagerate, ingrandendo i DIE, ormai darà tutto via tech sotto le xx90, le ammiraglie continueranno ad avere boost elevati.