Google ha annunciato tantissime novità che ruotano attorno a Gemini, il proprio modello di intelligenza artificiale che, con la nuova versione 2.0, si appresta ad entrare nell’era degli “agenti AI”.
Andiamo quindi a scoprire tutte le novità annunciate dal colosso di Mountain View, intenzionato a fare molto sul serio per avvicinarsi all’intelligenza artificiale generale, il Sacro Graal di tutte le realtà che si occupano di intelligenza artificiale.
Indice:
Google ha presentato Gemini 2.0
Tramite un lungo post sul blog ufficiale The Keyword che si apre con una nota di Sundar Pichai, CEO di Google e Alphabet, il colosso di Mountain View ha presentato tantissime novità a tema intelligenza artificiale.
La più interessante è l’annuncio della famiglia di modelli IA di seconda generazione, ovvero Gemini 2.0, che si concretizza, da subito, con l’arrivo di una prima versione sperimentale già messa a disposizione di tutti.
“Nell’ultimo anno abbiamo continuato a compiere incredibili progressi nel campo dell’intelligenza artificiale. Oggi rilasciamo il primo modello della famiglia di modelli Gemini 2.0, una versione sperimentale di Gemini 2.0 Flash. È il nostro modello di riferimento con bassa latenza e prestazioni migliorate all’avanguardia della nostra tecnologia, su scala.”
Gemini 2.0 Flash
Gemini 2.0 Flash è la nuova versione del modello di intelligenza artificiale del colosso di Mountain View, erede della “vecchia” versione 1.5 Flash (disponibile ancora oggi) rispetto a cui guadagna prestazioni migliori senza che peggiorino i tempi di risposta. Stando ai dati forniti da Google, la versione 2.0 Flash fa meglio, nei principali benchmark, persino del modello 1.5 Pro.
Oltre a supportare gli input multimodali (immagini, video e audio) il nuovo modello supporta anche gli output multimodali: è in grado di generare in maniera “nativa” immagini mescolate con testo e audio multilingue per la sintesi vocale (d’altronde era già emerso che Gemini Live sarebbe presto diventato bilingue).
Gemini 2.0 Flash è già disponibile nella versione Web
Dopo un periodo di test interni e con sviluppatori fidati (che avrebbero fornito ottimi feedback), Google ha deciso di rilasciare da subito il nuovo Gemini 2.0 Flash agli sviluppatori (tramite una API dedicata presente in Google AI Studio e Vertex AI), mettendo a loro disposizione le prime funzionalità di nuova generazione (inclusa una nuova API chiamata Multimodal Live che consente di sfruttare varie potenzialità del modello, anche combinate, in tempo reale).
Al netto degli sviluppatori, per gli utenti consumer (sia agli abbonati ad Advanced che agli utenti standard) il modello Gemini Flash 2.0 è disponibile da oggi in versione sperimentale ma solo nella versione Web del chatbot (come potete osservare dalla immagine sottostante).
Nei prossimi mesi, il nuovo modello sarà disponibile anche nell’app mobile del chatbot mentre, secondo quanto dichiarato da Google, le potenzialità di Gemini 2.0 verranno estese ad altri prodotti dell’ecosistema già a partire dalle prime fasi del 2025.
Google entra nell’era degli agenti IA: tutte le altre novità
Grazie a nuove funzionalità come il ragionamento multimodale e la comprensione di un contesto intricato, Gemini 2.0 Flash apre le porte a una nuova generazione di agenti AI in grado di assistere le persone nello svolgimento di compiti complessi. L’obiettivo dichiarato è quello di raggiungere l’intelligenza artificiale generale (AGI).
Google sta sperimentando queste possibilità con svariati prototipi (alcuni sono ancora in fase iniziale, altri sono noti da tempo), e continua a raccogliere feedback dai vari tester per migliorare le tecnologie al fine di renderle disponibili per un pubblico più ampio in futuro. Ecco un breve riassunto di ognuno di questi prototipi:
- Project Astra (assistente IA universale): presentato ufficialmente al Google I/O 2024, è stato migliorato grazie all’integrazione con Gemini 2.0. Le principali novità sono dialoghi migliorati, nuovi strumenti di interazione, memoria migliorata e latenza ridotgta.
- Project Mariner (interazione utente-agente nel browser): è un prototipo avanzato di ricerca che ruota attorno a Gemini 2.0, gettando le basi per nuovi metodi di interazione utente-agente direttamente all’interno del browser. Questo prototipo è in grado di comprendere gli elementi presenti sulla schermata del browser, operando solo sulla schermata attiva (previa autorizzazione dell’utente).
- Jules (agente IA per sviluppatori): è un nuovo agente IA “sperimentale” che vuole assistere gli sviluppatori durante il loro lavoro su GitHub. Esso è in grado di analizzare un problema di programmazione, proporre una soluzione e rappresentarla. Google ha pubblicato un post dedicato a Jules sul blog per gli sviluppatori.
- Gemini 2.0 for games: partendo da Genie 2, un modello IA in grado di creare infiniti mondi 3D giocabili a partire da una singola immagine, Google ha sfruttato Gemini 2.0 per creare agenti che possano aiutare gli utenti a navigare il mondo virtuale del videogioco, ragionare su cosa circonda il videogiocatore e offrire suggerimenti in tempo reale.
Qualora desideriate maggiori informazioni su tutto ciò che Google ha annunciato riguardo Gemini 2.0 e i prossimi passi verso l’intelligenza artificiale generale, vi rimandiamo nuovamente al post pubblicato da poche ore sul blog The Keyword.
“Gli annunci di oggi aprono un nuovo capitolo per il modello Gemini. Con l’introduzione di Gemini 2.0 Flash e una serie di prototipi di ricerca che esplorano il potenziale degli agenti, celebriamo un momento chiave nell’evoluzione di Gemini. Inoltre, non vediamo l’ora di proseguire in sicurezza l’esplorazione delle possibilità che ci porteranno sempre più vicini all’AGI.”
Le altre novità di Gemini annunciate in settimana
Oltre all’annuncio della seconda versione del modello basato sull’intelligenza artificiale, in settimana il colosso di Mountain View ha rilasciato due nuovi aggiornamenti.
Il primo, datato 9 dicembre 2024, si rivolge principalmente ai clienti Google Workspace:
Altri Gem predefiniti disponibili per i clienti Google Workspace
- Cosa: siamo felici di annunciare il lancio di nuovi Gem predefiniti, inizialmente disponibili in inglese, progettati per consentire agli abbonati a Gemini in Google Workspace di accedere a competenze basate sull’AI in diversi caso d’uso lavorativi. L’elenco dei Gem predefiniti include: Consulente per assunzioni, Creatore di copy, Ideatore pitch di vendita, Analista del sentiment e Specialista comunicativo.
- Perché: gli utenti aziendali hanno bisogno di una soluzione AI con una migliore comprensione dei principali risultati aziendali e un focus su formule, metriche e profili dei ruoli professionali. Questi Gem forniscono funzionalità avanzate per consentire di affrontare attività complesse e semplificare il flusso di lavoro.
Il secondo, datato 11 dicembre 2024, annuncia l’arrivo di Deep Research per gli abbonati Advanced:
Accesso prioritario con Gemini Advanced: risparmia ore di lavoro grazie al tuo assistente di ricerca personale
- Cosa: Deep Research di Gemini è il tuo assistente di ricerca personale che ti aiuta a trovare rapidamente informazioni su qualsiasi argomento. Il sistema suddivide il tuo prompt in una serie di domande di ricerca pertinenti, analizza automaticamente i siti al posto tuo per trovare informazioni utili e crea report completi di più pagine su qualsiasi argomento, il tutto in pochi minuti. I tuoi report vengono presentati in un visualizzatore immersivo che puoi perfezionare con Gemini e persino aprire in Documenti Google. Stiamo iniziando a renderlo disponibile in inglese con Gemini Advanced, incluso nel piano Google One AI Premium. Provalo oggi stesso selezionando “Gemini 1.5 Pro con Deep Research” dal menu a discesa del modello Gemini Advanced.
- Perché: risparmia ore di lavoro con Deep Research, il metodo più avanzato per effettuare ricerche con Gemini. Invece di passare ore a fare ricerche, lascia che Gemini faccia il lavoro per te e dedicati tranquillamente a tutto il resto.
Come scaricare o aggiornare l’assistente IA di Google
Gemini è disponibile ufficialmente in Italia sia come Web App (al sito https://gemini.google.com/app) che come “app” per dispositivi Android (è sempre parte di app Google, alla pari di Google Assistant), con la pagina dell’app sul Google Play Store che è raggiungibile tramite il badge sottostante.
Al netto del collegamento alla funzionalità è bene verificare che sul vostro dispositivo sia installata la più recente versione di App Google che, come detto, è il vero “contenitore” dell’assistente basato sull’intelligenza artificiale del colosso di Mountain View: per farlo, basterà effettuare un tap sul badge sottostante e, ancora, su “Aggiorna” nel caso in cui venisse segnalata la presenza di un aggiornamento.