Google continua a spingere sull’evoluzione della propria intelligenza artificiale conversazionale, lanciando in queste ore una funzionalità particolarmente attesa da molti utenti: il caricamento e l’analisi dei video direttamente all’interno dell’app Gemini. Una novità che si affianca alla già disponibile possibilità di caricare immagini e documenti nei prompt, ampliando ulteriormente il ventaglio di contenuti che gli utenti possono utilizzare per interagire con il modello.
Motorola edge 60, 8/256 GB
50+50+10MP, 6.67'' pOLED 120Hz, Batteria 5200mAh, ricarica 68W, Android 15
Come funziona il caricamento e l’analisi dei video nell’app Gemini
Come anticipato da Google, e verificato in prima persona da alcuni utenti, è ora possibile selezionare un video dalla galleria o dal gestore file attraverso il tradizionale menù + che consente di allegare contenuti multimediali a una conversazione con Gemini; una volta caricato il video l’interfaccia di riproduzione integrata consente di rivederlo in tempo reale, con la possibilità di porre domande contestuali alla clip stessa.
Un esempio pratico? Nel test riportato è stato chiesto a che ora un determinato contenuto venisse visualizzato su un Nest Hub, mentre in un’altra conversazione Gemini è stato in grado di descrivere in dettaglio una scena boschiva autunnale, individuando non solo gli elementi visivi principali (come il sentiero coperto di foglie, i colori stagionali, l’atmosfera pacifica), ma anche le sfumature emotive e sensoriali legate al contesto, un chiaro esempio delle capacità multimodali del modello.



Così come avvenuto per molte delle recenti novità di Gemini, anche il caricamento video è in rollout graduale e non risulta ancora disponibile per tutti; la funzionalità dovrebbe essere disponibile sia per gli account gratuiti che a pagamento, sia su Android (con la versione Beta 16.23 dell’app Google al momento) che su iOS, ed è supportata dalle varianti Gemini 2.5 Flash e 2.5 Pro.
Tuttavia, non è ancora arrivata sulla versione web, dove il tentativo di caricare un video restituisce l’errore Tipo di file non supportato; gli utenti interessanti dovranno quindi pazientare ancora un po’ prima di poter sfruttare questa funzionalità da desktop.
Questa dunque è la situazione allo stato attuale ma, stando a quanto individuato da assembledebug, sembra che Google si già al lavoro per consentire il caricamento diretto dei video registrati con l’opzione Fotocamera dell’app Gemini, come già accade per le immagini.
Come potete notare dal video condiviso, l’interfaccia della fotocamera di Gemini permetterà presto agli utenti di passare facilmente dallo scatto di foto alla registrazione di video da allegare al loro prompt; questa funzione non è ancora disponibile, nemmeno per gli utenti che stanno sperimentando il caricamento video in locale.
L’aggiunta del supporto ai video si inserisce all’interno di un processo di espansione progressiva delle capacità multimodali di Gemini che, come noto, è in grado di elaborare e comprendere testo, immagini, documenti e ora anche contenuti audiovisivi. Si tratta di una direzione chiara, che conferma l’intento di Google di rendere Gemini uno strumento sempre più completo e integrato, in grado di rispondere a una gamma crescente di richieste da parte degli utenti.
Un passo importante soprattutto considerando l’enorme quantità di contenuti video prodotti e condivisi ogni giorni; dall’analisi di registrazioni personali, fino alla comprensione di scene specifiche nei video informativi o promozionali, le potenzialità di questa funzione sono evidenti. La possibilità di porre domande su ciò che accade in un video caricato localmente, e non solo tramite link YouTube, apre nuovi scenari d’uso e potrebbe rivelarsi utile in moltissimi contesti, personali e professionali.