Conosciamo ormai tutti diversi strumenti mossi dall’intelligenza artificiale, tra questi figura anche Google Gemini, il chatbot IA del colosso di Mountain View; lo strumento riceve costantemente le attenzioni dell’azienda beneficiando di costanti miglioramenti, nonché dell’integrazione in altri servizi e prodotti.
Negli ultimi tempi, tanto per fare qualche esempio, abbiamo visto come l’azienda abbia reso disponibile per gli abbonati Advanced lo strumento Veo 2, indiscrezioni su come in futuro il tasto di accensione dei dispositivi Android consentirà agli utenti di accedere direttamente a Gemini e Gemini Live, ma abbiamo anche visto come la funzionalità di creazione video possa a breve diventare disponibile per tutti gratuitamente, o ancora come Google abbia reso disponibili per tutti le funzioni Project Astra.
Oggi invece, grazie a quanto individuato dal cacciatore di codici assembledebug, diamo uno sguardo più approfondito ad una funzionalità in fase di sviluppo già intravista.
Segui Google Italia su Telegram, ricevi news e offerte per primo
Ecco come Gemini analizzerà i vostri video
A pochi mesi dal lancio ufficiale, Google Gemini continua ad arricchirsi di nuove funzionalità, alcune già disponibili pubblicamente, altre ancora in fase di test e individuabili solo per vie traverse. Proprio da una recente analisi del codice della versione 16.15.38.sa.arm64 beta dell’app Gemini per Android, arriva una novità che potrebbe cambiare radicalmente il modo in cui gli utenti interagiscono con l’assistente IA di Google: la possibilità di caricare e analizzare video direttamente all’interno del chatbot.
Stando a quanto riportato, Gemini è stato in grado di analizzare tre videoclip differenti, fornendo risposte coerenti e, in almeno un caso, individuando con precisione la posizione mostrata nel filmato sulla base di dettagli come l’architettura degli edifici e altri indizi contestuali; una dimostrazione concreta del fatto che il modello multimodale di Google sta diventando sempre più raffinato, capace non solo di interpretare testi e immagini, ma anche di comprendere contenuti dinamici e complessi come i video.
Oltre all’analisi automatica, gli utenti possono digitare una domanda specifica da abbinare al video caricato, ottenendo così una risposta mirata: un approccio interattivo che apre la strada a numerose applicazioni pratiche, come ad esempio il riepilogo automatico di una videoconferenza, l’assistenza tecnica a partire da una registrazione dello schermo, oppure la generazione di contenuti riassuntivi per social o documentazione.
Ovviamente, al momento esistono delle limitazioni tecniche, ogni video caricato (sia singolo che in combinazione) non può superare i cinque minuti di durata; superato questo limite, Gemini avviserà l’utente dell’impossibilità di elaborare il contenuto, mantenendo quindi un controllo rigoroso sulla quantità di dati gestibili per singola sessione.
Non è la prima volta che si parla della funzione di analisi video all’interno di Gemini: già nelle scorse settimane erano emerse alcune stringhe di codice che lasciavano intendere lo sviluppo di questa feature; tuttavia, è solo in questi ultimi giorni che la funzione è stata attivata e testata concretamente, con risultati promettenti.
Inoltre, sono state trovate ulteriori tracce che suggeriscono il supporto al caricamento multiplo di video, funzionalità che se confermata potrebbe amplificare ulteriormente le possibilità d’uso, rendendo Gemini uno strumento ancora più potente e versatile in ambito produttivo, scolastico e aziendale.
La presenza attiva (anche se ancora non ufficialmente rilasciata) della funzione e il fatto che sia già tecnicamente operativa, lascia presagire che un annuncio formale da parte di Google possa essere imminente, e quale miglior palcoscenico se non il Google I/O 2025 rappresenta il momento ideale per svelare novità in ambito IA, Android e servizi cloud? Gli indizi ci sono tutti, Google sembra voler trasformare Gemini in un assistente IA veramente multimodale, capace di supportare testi, immagini, audio e ora anche contenuti video, aprendo a scenari d’uso fino a poco tempo fa relegati alla fantascienza.
Gli utenti dovranno ancora pazientare qualche settimana per avere conferme ufficiali, ma una cosa è certa, Gemini sta evolvendo rapidamente e la funzione di analisi video potrebbe rappresentare il prossimo passo concreto verso una nuova generazione di assistenti IA sempre più smart, proattivi e personalizzabili.
- Google ha avviato il rollout dell’opzione “Chiedi a Gemini” per il testo selezionato
- Google vi farà risparmiare per usare Gemini Advanced con un abbonamento annuale
- Nell’app di Gemini debutta il modello “2.5 Flash (experimental)” con ragionamento
- Google sta preparando l’integrazione di Gemini anche in Android Automotive