Sono passati pochi mesi dal lancio ufficiale di Gemini Live e il sistema che consente di avere conversazioni naturali e fluide con l’intelligenza artificiale di Google ha già conosciuto diverse rapide evoluzioni.

Mentre altre novità sono in arrivo, nel frattempo è possibile anticipare alcune funzionalità su cui il team di sviluppo di Google sta lavorando. Sono le funzionalità che consentiranno il caricamento dei file in Gemini Live e la possibilità di comunicare live con l’AI durante la riproduzione di un video e la lettura di un file PDF.

La modalità conversazionale di Gemini Live in azione su file, video e PDF

Nella versione beta 16.1.38 dell’app Google è stato possibile attivare le funzionalità “Parla in diretta del video” (“Talk Live about video”) e “Parla in diretta del PDF” (Talk Live about PDF).

Come lasciano intendere gli stessi nomi, con queste funzionalità sarà possibile avviare la modalità conversazionale in Gemini Live sia durante la riproduzione di un video che la lettura di un PDF senza uscire dalle rispettive app.

L’interazione con l’AI diventa in questo modo più fluida e veloce. Non è infatti necessario uscire da YouTube o dal lettore PDF per avviare Gemini e porgli una domanda, ma sarà possibile utilizzare l’interfaccia di Gemini Live al posto di quella tradizionale di Gemini.

L’altra novità, come anticipato, riguarda la possibilità di caricare i file. Gli utenti con un abbonamento a Gemini Advanced hanno già la possibilità di caricare file nell’interfaccia con l’intelligenza artificiale per chiedergli di estrarne i dati e ottenere risposte e informazioni preziose.

Ora Google sta esportando questa funzionalità anche su Gemini Live. Sempre nella versione beta 16.1.38 dell’app Google, infatti, è stata individuata questa funzionalità che una volta attivata consente di caricare i file su Gemini Advanced; quindi, selezionare il pulsante “Parla in diretta di questo” (Talk Live about this) e interagire con l’AI tramite l’interfaccia di Gemini Live che nel frattempo si è aperta.

L’inoltro del file precedentemente caricato su Gemini Advanced in Gemini Live consente di dialogare con l’intelligenza artificiale in maniera più colloquiale ottenendo risposte più pertinenti.

Inoltre al termine della conversazione l’AI fornirà la trascrizione delle domande poste a Gemini Live e delle relative risposte.

Queste innovazioni mirano a rendere l’interazione con Gemini Live più naturale ed efficiente, integrando l’assistente AI direttamente nelle attività quotidiane svolte degli utenti. Vedremo quando Google le distribuirà ufficialmente e se prevederanno ulteriori possibilità.