sono emerse alcune informazioni interessanti sull'architettura delle GPU NVIDIA di prossima generazione, nome in codice Blackwell, che dovrebbero arrivare sul mercato nelle RTX5000; e pare che il colosso di Santa Clara abbia in serbo alcune novità piuttosto interessanti, che dovrebbero garantire un
guadagno prestazionale tra le 2 e le 2,6 volte rispetto alla generazione precedente - tra i più elevati, se non il più elevato di sempre, nella storia di NVIDIA. Secondo indiscrezioni risalenti a fine anno scorso, i primi prototipi sarebbero già stati realizzati e in fase di test approfonditi.
Sembra che NVIDIA abbia approntato un
nuovo design per gli Stream Multiprocessor (SM) e che per le GPU più prestigiose, probabilmente solo per server, AI e supercomputer, adotterà un approccio a chiplet MCM (Multi-Chip Modules) invece di quello monolitico visto finora (e che tornerà anche nelle RTX 50 gaming, magari con qualche eccezione illustre nella fascia più alta). Da notare che AMD è già passata ai chiplet con le attuali Readon 7000, ma gli ingegneri NVIDIA si sarebbero dichiarati fiduciosi di essere in grado di primeggiare a livello prestazionale anche nella generazione successiva mantenendo il design monolitico (sottolineiamo di nuovo: sempre solo in ambito gaming/consumer).
Le GPU Blackwell dovrebbero essere realizzate su
processo produttivo TSMC a 3 nm, personalizzato appositamente per NVIDIA, e dovrebbero montare memorie video GDDR7. Le novità a livello di architettura dovrebbero essere significative al di là dei nuovi SM - si parla in particolare di bus superveloci per il collegamento tra i vari SM e una nuova tecnologia di eliminazione del rumore di fondo. Per i modelli gaming incrementeranno anche le frequenze operative, oltre i 3 GHz; naturalmente l’interfaccia sarà PCIe Gen 5. Le schede si concentreranno sempre di più nelle prestazioni di ray tracing e path tracing - implicando quindi un balzo in avanti significativo anche per i core RT.
La fonte ha anche qualche dettaglio tecnico più preciso su due GPU - la GB102 per il gaming e la GB100 per i server. Schematizzando:
GB102
- Target: consumer/gaming
- Design: monolitico
- SM: 144
- Cache L2: 96 MB
- Bus: 384 bit
- Memorie: GDDR7
- Interfaccia: PCIe Gen 5 x16
GB100
- Target: server
- Design: MCM
- SM: 256
- Cache L2: 128 MB
- Bus: 512 GB
- Memorie: HMB3