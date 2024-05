L’evento inaugurale del Google I/O 2024 ha avuto un solo grande protagonista, attorno al quale è ruotata tutta la serata: Google Gemini. Non c’è servizio o applicazione di Google che non abbia ricevuto corposi aggiornamenti per includere nuove funzioni pronte a sfruttare l’intelligenza artificiale generativa, con vantaggi che andranno dimostrati nel tempo.

Gemini si appresta a portare nuove funzioni su Google Workspace, con un nuovo pannello laterale, introduce un nuovo modello ancora più veloce del precedente, offre prestazioni ancora più personalizzate grazie alla possibilità di creare una propria versione, chiamata Gems, migliorando anche la famiglia Gemma con due nuovi modelli. Facciamo dunque un po’ di ordine e chiarezza con un riepilogo delle novità presentate nella serata di ieri.

Gemini Advanced

Google Gemini stato pensato per diventare un vero e proprio assistente personale, in grado di aiutare l’utente a portare a termine anche le operazioni più complesse, realizzando parte del lavoro “sporco”. Il Google I/O 2024 è stata l’occasione per annunciare l’arrivo di Gemini 1.5 Pro, il modello più performante, su Gemini Advanced, il servizio a cui si sono iscritti oltre un milione di utenti negli ultimi tre mesi.

Grazie a una nuova finestra contestuale, portata a un milione di token (il valore più altro tra le chatbot commerciali attualmente disponibili), Gemini Advanced è ora in grado di gestire documenti di grandi dimensioni, fino a 1.500 pagine, o di realizzare riassunti di centinaia di mail. A breve l’IA sarà in grado di gestire un’ora di contenuti video e oltre 30.000 linee di codice, diventando ancora più utile per altre categorie di lavoratori.

Gemini Advanced permette ora di caricare file tramite Google Drive, o direttamente dal proprio dispositivo, così da ricevere rapidamente una risposta relativa a documenti particolarmente complessi, come i dettagli relativi agli animali domestici in un contratto di affitto, o comparare gli argomenti chiave in ricerche scientifiche. Presto Gemini Advanced sarà anche in grado di analizzare i dati ricevuti, creando delle visualizzazioni e diagrammi al volo, così da rendere più chiare le analisi effettuate.

Gemini 1.5 Pro sarà disponibile per gli abbonati di Gemini Advanced in oltre 150 Paesi, con il supporto per oltre 35 lingue.

Nel corso dei prossimi mesi Google rilascerà, sempre per gli utenti di Gemini Advanced, la funzione Live, una nuova esperienza di conversazione mobile che rende ancora più semplici e intuitivi i dialoghi con Gemini. potrete scegliere la voce che vi risponderà e interrompere l’IA nel mezzo di un spiegazione, per porre domande chiarificatrici o per controbattere, proprio come accade in una normale discussione.

Potrete utilizzare Live per prepararvi a un colloqui di lavoro o nell’esposizione di una relazione, ed entro fine anno potrete utilizzare anche la videocamera, per discutere con l’IA dell’ambiente che vi circonda.

Con Gemini Advanced diventa più semplice organizzare la vacanza perfetta, senza perdere tempo nella fase di pianificazione di ogni dettaglio. Volete passare il weekend in campagna ma volete essere sicuri di trovare un ristorante che serva carne alla griglia e di poter visitare eventuali musei nella zona? Basta chiederlo all’IA di Google che in base alle informazioni ricevute e alle prenotazioni già effettuate, sarà in grado di creare un itinerario personalizzato in grado di soddisfare tutti i requisiti, adattandosi ad eventuali cambiamenti o aggiunte dell’ultima ora.

E per chi vuole un’esperienza d’uso realmente su misura, sta per arrivare Gem, una versione personalizzata di Gemini. Vi basterà descrivere cosa dovrà fare Gem e come dovrà rispondervi per avere un partner durante la stesura di codice, un aiuto cuoco in cucina o un compagno di allenamenti, con la possibilità di creare quanti assistenti personalizzati vogliate.

Gemini arriverà molto presto anche in altre applicazioni e servizi Google a partire da YouTube Music, che sarà seguito da Calendario, Tasks e Google Keep, permettendo numerose interazioni tra i vari servizi.

Maggiore produttività su Workspace

Sono già oltre un milione gli utenti di Google Workspace che hanno utilizzato l’IA generativa per velocizzare il proprio lavoro e ricevere suggerimenti, ma il Google I/O 2024 porta parecchie novità in questo ambito, grazie soprattutto all’arrivo, nel pannello laterale, di Gemini 1.5 Pro .

Gli utenti di Gmail, Documenti, Drive, Presentazioni e Fogli si sono da tempo abituati alla presenza di Gemini nel pannello laterale, ma da oggi le cose diventano ancora più interessanti. La nuova versione dell’IA consente di ottenere risposte a una maggiore varietà di quesiti, permettendo di avere rapidamente un riassunto delle proprie discussioni e suggerimenti su come procedere.

Grazie alla finestra contestuale di maggiori dimensioni, Gemini può sfruttare un set di dati più ampio, così da semplificare, ad esempio, la gestione delle mail. Un particolare cliente vi tartassa di richieste e proposte ogni settimana? Ora Gemini è in grado di evidenziare i contenuti più importanti suggerendovi le azioni da intraprendere. Volete condividere i dati dell’albergo con gli amici che verranno in vacanza con voi ma non ricordate dove avete salvato la conferma della prenotazione? Vi basterà digitare una “@” nel pannello laterale di Gmail, trovare il documento corretto su Drive, chiedere a Gemini i dettagli della prenotazione e incollare l risultato in una mail indirizzata ai compagni di viaggio.

Al momento la funzione è attiva per gli utenti di Workspace Labs e Gemini for Workspace Alpha, mentre dal prossimo mese il rollout raggiungerà una piattaforma più ampia.

Numerose anche le novità dedicate espressamente a Gmail, in particolare per la versione mobile che si arricchisce di tre funzionalità che vi faranno risparmiare parecchio tempo. Trovate tutti i dettagli nel nostro articolo dedicato.

Gemini Flash e altre novità

A distanza di qualche mese dal lancio di Gemini 1.5 Pro, Google si è resa conto che per alcune applicazioni è necessario un modello più snello, con una minore latenza e una maggiore efficienza. Nasce così Gemini Flash, in grado di gestire una finestra contestuale da 1 milione di token come la versione Pro, ma che eccelle in alcune funzioni.

Il nuovo modello è infatti molto performante per quanto riguarda la creazione di riassunti, le chat, l’estrazione di dati da documenti e tabelle particolarmente lunghi e nella realizzazione di sottotitoli per video e immagini. Tutto questo è stato reso possibile grazie a un processo di “distillazione” che ha trasferito le conoscenze e le skill da un modello più largo verso uno snello e maggiormente efficiente, prendendo solo le informazioni essenziali.

Dopo il lancio di Gemini 1.5 Pro, Google ha continuato a sviluppare la propria IA, che ora è in grado di gestire fino a 2 milioni di token anche se la funzione è disponibile solo per gli sviluppatori che utilizzano l’API Gemini e per gli utenti di Google Cloud. Gemini è diventato capace di comprendere istruzioni ancora più complesse e può gestire meglio video e audio caricati in Google AI Studio.

Gemini Nano, l’IA presente nei Pixel, sfrutta la multimodalità per apprendere il comportamento degli utenti non solo tramite testo ma anche tramite i suoni, le immagini e i discorsi che vengono fatti, ampliando quindi le capacità di comprensione e adattamento.

Nuovi modelli Gemma

Chiudiamo questa ampia carrellata con due novità legate a Gemma, la gamma di modelli di IA pensati in particolar modo per i ricercatori. Arriva PaliGemma, il primo modello ottimizzato per la realizzazione di didascalie nelle immagini, ma anche per gestire domande e risposte relative a contenuti visuali.

Gemma2 invece sarà disponibile da giugno e risponde alle richieste di sviluppatori e ricercatori, io quali volevano poter utilizzare un modello più ampio che potesse però rimanere in dimensioni semplici da poter essere gestite. Il modello 27B è la risposta a questa domanda, visto che è in grado di superare modelli che hanno il doppio delle dimensioni e può utilizzare GPU e TPU per il proprio funzionamento.

Gli sviluppatori possono inoltre sfruttare due nuove funzionalità API, per estrarre frame da un video e per chiamare più funzioni in parallelo, così da ottenere più risposte contemporaneamente. A giugno inoltre Gemini 1.5 Pro riceverà il context caching, per caricare file e documenti una sola volta, molto utile per ridurre il costo delle richieste con contenuti ripetuti con un numero elevato di token in ingresso.

E per tutti gli sviluppatori c’è una nuova competizione (qui trovate tutti i dettagli) che mette alla prova la creatività sfidandoli a realizzare nuove applicazioni basate sui modelli Gemini. In palio c’è una DeLorean elettrica personalizzata, niente male davvero.