Google ha annunciato che Trillium, la propria TPU di sesta generazione presentata all’inizio di quest’anno, è ora disponibile su larga scala per i clienti Google Cloud.

Il colosso di Mountain View ha sfruttato queste TPU per addestrare Gemini 2.0, il nuovo modello di intelligenza artificiale presentato ufficialmente nella serata di ieri, e ora sta mettendo a disposizione di aziende e startup la medesima infrastruttura. Scopriamo tutti i dettagli.

Trillium, ecco la TPU Made by Google di sesta generazione

Come anticipato in apertura, Google ha annunciato la disponibilità generale di Trillium, la propria TPU di sesta generazione presentata all’inizio dell’anno e sfruttata per addestrare il modello 2.0 di Gemini, il più efficiente mai realizzato dal colosso di Mountain View.

Le TPU Trillium rappresentano componenti fondamentali dell’AI Hypercomputer di Google Cloud, un supercomputer che offre un sistema integrato di hardware e software ottimizzato per le applicazioni di intelligenza artificiale.

Con questa mossa, unita ad alcuni miglioramenti apportati al software (ottimizzazioni al compilatore XLA, implementazioni di framework quali JAX, PyTorch e Tensorflow), Google ha voluto offrire il miglior rapporto costo/prestazioni per l’addestramento, la messa a punto e la fornitura di un servizio che sfrutta l’intelligenza artificiale.

L’AI Hypercomputer mette a disposizione oltre centomila chip Trillium all’interno di un singolo “fabric”, collegati tra loro attraverso una rete Jupiter con larghezza di banda bidirezionale a 13 Petabit al secondo, in grado di gestire i compiti di addestramento più complessi in maniera distribuita, per accelerare i tempi.

I miglioramenti rispetto alla precedente generazione

Rispetto alla precedente generazione di TPU, la nuova Trillium di sesta generazione un sacco di miglioramenti:

miglioramento superiore al 400% nelle prestazioni di addestramento

nelle fino al 300% in più di throughput di inferenza

in più di miglioramento del 67% sul fronte dell’ efficienza energetica

sul fronte dell’ aumento del 470% nelle prestazioni di calcolo di picco (per chip)

nelle (per chip) raddoppio della capacità di memoria HBM (memoria a larghezza di banda elevata)

della (memoria a larghezza di banda elevata) raddoppio della larghezza di banda ICI (interconnessione interchip)

della (interconnessione interchip) 250% in più di prestazioni di addestramento per dollaro

in più di 140% in più di prestazioni di inferenza per dollaro.



Questi miglioramenti, come suggerito da Google, consentono alle TPU Trillium di dare il meglio di sé in un’ampia gamma di carichi di lavoro legati all’intelligenza artificiale, fornendo tantissimi vantaggi, sia in termini di pura potenza, che in termini di rapporto potenza/costo (e quindi efficienza).

“Trillium rappresenta un significativo passo avanti nell’infrastruttura AI di Google Cloud, offrendo incredibili prestazioni, scalabilità ed efficienza per un’ampia gamma di carichi di lavoro di intelligenza artificiale. Con la sua capacità di scalare a centinaia di migliaia di chip utilizzando software co-progettato di livello mondiale, Trillium ti consente di ottenere risultati più rapidi e offrire soluzioni di intelligenza artificiale superiori. Inoltre, l’eccezionale rapporto prezzo-prestazioni di Trillium lo rende una scelta conveniente per le organizzazioni che cercano di massimizzare il valore dei loro investimenti in intelligenza artificiale. Mentre il panorama dell’IA continua a evolversi, Trillium si pone come una testimonianza dell’impegno di Google Cloud nel fornire un’infrastruttura all’avanguardia che consenta alle aziende di sbloccare il pieno potenziale dell’IA.”

Quello che vi abbiamo riportato è un riassunto di massima sulle potenzialità della sesta denerazione delle TPU Trillium di Google: qualora siate interessati a maggiori informazioni, vi lasciamo al video dell’annuncio (qui sotto) e vi rimandiamo al post pubblicato sul blog di Google Cloud.