pribolo
Utente Èlite
- Messaggi
- 38,481
- Reazioni
- 13,888
- Punteggio
- 253
beh oddio, dire che BD ha le pipe lunghe è stata una forzatura e questa cosa si legge ancora oggi, i problemi dell'architettura bulldozer sono ben altri e non è di certo FO4 (anche perché dai datapath leaked di Zen pare che abbia lo stesso FO4, quindi stessa lunghezza pipe): il sistema delle cache vecchio di 10 anni, la cache-uop assente (ti fa saltare degli stadi sulla pipe), la carenza cronica del predittore (perdi interi cicli a ricaricare la pipe) ed un power-gating pessimo (clock dinamico scarso nel turbo e aumento del consumo generale). il 32nm, pessimo, dopotutto ha mancato l'obiettivo solo nella componente TDP 125 vs 220 del FX9590 a 4.7/5 ghz.
https://en.wikipedia.org/wiki/Comparison_of_CPU_microarchitectures questa tabella da un idea
BD ha la pipe sui 20-22 stadi, il P4 (Prescott) ce l'aveva sui 30-32 stadi, mentre da sandy in avanti sui 14-16 stadi, e si diceva che il target di frequenza a medio-fine ciclo dovevano essere i 10ghz (si sono fermati a 4 circa) e non i 5 ghz di BD (ci sono arrivati con lo scotto del TDP), oltretutto non abbiamo visto un XV su silicio simile ad intel ed a parer mio sarebbe stata un buona architettura con cui tamponare, inferiore ad Intel sicuramente, ma comunque avrebbe creato un minimo di competizione.
Sì probabilmente era un po' una forzatura quelle delle pipeline lunghe, anche se c'è da dire che alla fine avere le pipeline troppo lunghe o cache e predittore scarsi alla fine hanno più o meno lo stesso risultato: la CPU stalla in attesa dei dati e l'IPC scende. E alla fine questo è il punto che accomuna entrambe le architetture, imho: IPC scarso e di conseguenza target di frequenza ottimistici (mooolto di più quello dei prescott ovviamente :lol:).