Google si sta impegnando e sta investendo molto per migliorare Gemini e le sue funzionalità, e in queste ore arriva un’interessante notizia che certifica i passi avanti fatti in questi anni: Gemini 2.5 Deep Think ha ottenuto una prestazione da medaglia d’oro nella programmazione competitiva.
Gemini 2.5 Deep Think ha offerto prestazioni da medaglia d’oro all’ICPC di Baku
Dopo l’ottima prestazione ottenuta durante l’estate alle Olimpiadi internazionali di matematica, Gemini 2.5 Deep Think ha partecipato all’International Collegiate Programming Contest (ICPC), ossia la più antica, grande e prestigiosa competizione di programmazione algoritmica a livello universitario. Ne hanno preso parte quasi 3000 università di 103 Paesi, con l’intento di arrivare alla fase finale di Baku.
Come forse saprete, Gemini Deep Think è una funzionalità sperimentale che permette al modello di ragionare in modo più approfondito e iterativo, esplorando più soluzioni e approcci contemporaneamente prima di arrivare alla risposta migliore. È ottimizzata per compiti complessi come la matematica, la scienza e lo sviluppo di codice.
I partecipanti alla finale della competizione hanno dovuto affrontare 12 problemi di programmazione in 5 ore di tempo, e la classifica si è basata sul tempo impiegato per risolverli, con punti rilasciati solo in caso di soluzioni perfette. Solo 4 squadre (su 139) hanno ottenuto la medaglia d’oro finale, con un Gemini 2.5 Deep Think in grado di risolvere 10 problemi su 12 (in diretta da remoto, pur seguendo le regole della competizione sotto la guida degli organizzatori).
“L’ICPC si è sempre impegnato a stabilire i più alti standard nella risoluzione dei problemi“, ha commentato il Dr. Bill Poucher, ICPC Global Executive Director. “L’ingresso di Gemini in questo ambito e il raggiungimento di risultati da medaglia d’oro segnano un momento chiave nella definizione degli strumenti di intelligenza artificiale e degli standard accademici necessari per la prossima generazione. Congratulazioni a Google DeepMind; questo lavoro ci aiuterà ad alimentare una rinascita digitale a beneficio di tutti“.
L’IA di Gemini è riuscita a risolvere 8 problemi in appena 45 minuti, e altri due in circa tre ore. Questo le avrebbe consentito di piazzarsi al secondo posto generale, se confrontata con i team partecipanti. L’attenzione si è focalizzata in particolare sul problema C, che è stato risolto da Gemini in circa 30 minuti: la parte interessante è che nessun altro team umano in gara è riuscito a venirne a capo.
Il problema richiedeva di trovare una soluzione per distribuire un liquido attraverso una rete di condotti interconnessi a un insieme di serbatoi, con l’obiettivo di trovare una configurazione di questi condotti che riempisse tutti i serbatoi il più rapidamente possibile. Le configurazioni possibili sono infinite, poiché ogni condotto può essere aperto, chiuso o anche parzialmente aperto, rendendo molto difficile la ricerca della configurazione ottimale.
L’intelligenza artificiale è riuscita a trovare una soluzione efficace con una bella intuizione, come spiegato direttamente da Google DeepMind:
“Ha inizialmente ipotizzato che ogni serbatoio avesse un “valore di priorità” che rappresentava quanto ciascun serbatoio dovesse essere favorito rispetto agli altri. Dato un insieme di valori di priorità, la migliore configurazione dei condotti può essere trovata utilizzando un algoritmo di programmazione dinamica. Gemini ha scoperto che, applicando il teorema minimax, il problema originale può essere affrontato trovando i valori di priorità che rendono il flusso risultante più vincolato. Sfruttando la relazione tra valori di priorità e flussi ottimali, ha utilizzato ricerche ternarie annidate per trovare rapidamente i valori di priorità ottimali nello spazio delle soluzioni convesso e ha risolto il problema C“.
Google ha attribuito il merito di questo successo a una serie di innovazioni nelle tecniche di pre-addestramento e post-addestramento, a nuove tecniche di apprendimento per rinforzo, ragionamento multi-step e pensiero parallelo. Queste innovazioni hanno aiutato Gemini a esplorare diversi modi di risolvere problemi complessi, verificare le soluzioni e ripetere continuamente prima di rispondere.
“Per esempio“, ha spiegato Google, “durante il corso di apprendimento per rinforzo, abbiamo addestrato Gemini a ragionare e generare codice per alcuni dei problemi più difficili che i programmatori abbiano mai affrontato, per imparare dal feedback sui risultati e sviluppare i propri approcci. Per affrontare un problema, più agenti Gemini propongono ciascuno le proprie soluzioni, utilizzano terminali per eseguire codice e test e quindi iterano le soluzioni sulla base di tutti i tentativi“.
Gli studi interni svolti da Big G dimostrano che una versione simile di Gemini 2.5 Deep Think può offrire prestazioni da medaglia d’oro anche nelle finali ICPC del 2023 e del 2024, ottenendo risultati pari a quelli dei 20 migliori programmatori competitivi al mondo.
Secondo Google, assistenti di programmazione AI molto più intelligenti potrebbero aiutare gli sviluppatori ad affrontare sfide ingegneristiche sempre più complesse: le soluzioni ad alcuni dei problemi più difficili e irrisolvibili potrebbero presto essere a portata di mano utilizzando l’IA come strumento collaborativo. Gli utenti dotati di abbonamento Google AI Ultra possono già utilizzare una versione “leggera” di Gemini 2.5 Deep Think nell’app Gemini. Per chi non lo sapesse, il costo di questo abbonamento è di 274,99 euro al mese (139,99 euro per i primi 3 mesi).