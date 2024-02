Come probabilmente avrete notato, i giorni scorsi Google ha lanciato l’app ufficiale di Gemini sul Google Play Store, utilizzabile in lingua italiana in modo “ufficioso”. Mentre il chatbot sta prendendo sempre più piede al posto di Google Assistant, la casa di Mountain View prosegue lo sviluppo e annuncia quest’oggi Gemini 1.5, un modello con prestazioni migliorate in vari ambiti: andiamo a scoprire i dettagli.

Google Gemini 1.5 è ufficiale con tanti miglioramenti importanti

A distanza di un paio di mesi dal lancio iniziale, Google DeepMind annuncia oggi Gemini 1.5, l’ultimo modello che offre prestazioni notevolmente migliorate, con una svolta nella comprensione del contesto nelle varie modalità. Per chi non sapesse di che si tratti, Gemini è un chatbot basato sull’intelligenza artificiale generativa e sull’apprendimento automatico creato sul modello linguistico LaMDA (Language Model for Dialogue Applications), e costituisce un diretto “rivale” di ChatGPT.

La casa di Mountain View sta rilasciando Gemini 1.5 Pro, un modello di medie dimensioni ulteriormente ottimizzato per adattarsi a un’ampia gamma di attività che funziona in modo simile all’attuale Gemini 1.0 Ultra, ossia il modello più grande. In base a quanto riportato, la versione 1.5 Pro ha superato la 1.0 Pro nell’87% dei test benchmark. La nuova release risulta costruita su una nuova e innovativa versione dell’architettura Mixture-of-Experts (MoE) ed è più efficiente da formare e utilizzare. Grazie a quest’ultima, può eseguire solo una parte del modello complessivo quando si invia una richiesta, anziché elaborare l’intero modello per tutto il tempo.

Come dichiarato dallo stesso CEO Sundar Pichai, Gemini 1.5 ha un’enorme finestra di contesto e può dunque gestire query molto più grandi e visualizzare molte più informazioni contemporaneamente. Di che numeri parliamo? La nuova finestra standard passa da 32.000 a 128.000 token (gli stessi di ChatGPT 4 di Open AI), ma a partire da oggi un gruppo limitato di sviluppatori e clienti aziendali più provarlo con una finestra di 1 milione di token. In un linguaggio più semplice, si tratta dell’equivalente di circa 10 o 11 ore di video, decine di migliaia di righe di codice. Già ora 1.5 Pro può elaborare una quantità gigantesca di informazioni in una volta sola, tra cui un’ora di video, 11 ore di audio, basi di codice con oltre 30.000 righe di codice o oltre 700.000 parole. Pensate che i ricercatori Google stanno anche testando una finestra di contesto ancora più grande (10 milioni di token).

Per farci meglio comprendere la portata di questi miglioramenti, Google ci fa qualche esempio. Gemini 1.5 Pro può analizzare, classificare e riepilogare senza problemi grandi quantità di contenuti all’interno di un determinato prompt. Ad esempio, quando vengono fornite le trascrizioni di 402 pagine della missione Apollo 11 sulla Luna, è possibile ragionare su conversazioni, eventi e dettagli trovati all’interno del documento.

Google ci mostra un altro esempio con l’analisi di un film muto di 44 minuti di Buster Keaton: Gemini 1.5 Pro ha saputo analizzare vari dettagli ed eventi all’interno della pellicola, scovando il momento esatto di una determinata azione e trascrivendo alcuni particolari con successo.

In questo terzo video, Google ci mostra come la nuova versione di Gemini possa eseguire attività di risoluzione dei problemi più rilevanti su blocchi di codice più lunghi. Quando viene ricevuto un prompt con più di 100.000 righe di codice, può ragionare meglio tra esempi, suggerimenti di modifiche che potrebbero essere utili e spiegazioni del funzionamento di diverse parti del codice stesso.

A partire da oggi, 15 febbraio 2024, è disponibile tramite AI Studio e Vertex AI un’anteprima limitata di Gemini 1.5 Pro pensata per sviluppatori e clienti aziendali. Per ulteriori informazioni sulle novità presentate da Google potete seguire questo link, mentre questo è l’indirizzo giusto per saperne di più dal punto di vista tecnico. Vi ricordiamo che Google Gemini è disponibile in italiano tramite il sito ufficiale e tramite l’app sul Play Store, ma quest’ultima non risulta ancora scaricabile in Italia a livello ufficiale. Probabilmente dovremo attendere ancora qualche giorno per averla, ma nel frattempo vi lasciamo comunque il badge per dare un’occhiata.

