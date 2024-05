Ieri abbiamo visto una prova della funzione Ask this page di Google Gemini, mentre oggi diamo un primo sguardo ad Ask this video, una funzionalità simile che sfrutta l’intelligenza artificiale dell’assistente per rispondere a domande sui video. Come se la sarà cavata l’IA di Google questa volta? Andiamo subito a scoprirlo con qualche test su YouTube.

Come funziona Ask this video di Google Gemini: la prova

Lo scorso Google I/O la casa di Mountain View ha parlato parecchio di intelligenza artificiale, e tra le funzionalità annunciate c’era “Ask this video”, o “Chiedi a questo video”. Grazie alla comprensione del contesto, Gemini può rispondere non solo a domande sulla pagina visualizzata, come abbiamo visto ieri, ma anche su un video di YouTube: l’IA può analizzare il filmato e rispondere ai dubbi dell’utente, senza che questo necessiti di visualizzare l’intero video.

Come funziona questo “Ask this video” di Google Gemini? Grazie alle prove svolte dai colleghi di Android Authority possiamo dare un primo sguardo, in anticipo rispetto alla disponibilità effettiva.

La funzionalità IA in questione può rivelarsi molto utile quando si è alla ricerca di informazioni specifiche che potrebbero essere contenute in un video di YouTube: invece di continuare a scorrere e saltare in avanti alla loro ricerca, si potrà chiedere a Gemini in un istante. Per attivare le funzione basterà richiamare l’assistente mentre ci troviamo all’interno del filmato: grazie alla sua consapevolezza del contesto, mostrerà l’apposito comando “Ask this video”.

Nel primo esempio che possiamo vedere, viene chiesta a Gemini un’informazione sul video “Pixel 8a is here, but why?“: supponendo di voler conoscere il motivo di questo titolo, viene chiesto all’IA di specificare cosa ci sia che non va nello smartphone in questione. La risposta è stata corretta: l’assistente sembra aver centrato il punto della questione (peraltro trattato anche nella nostra recensione di Google Pixel 8a), riferendosi al fatto che al prezzo di listino il device pesti un po’ i piedi al fratello maggiore Pixel 8, risultando poco preferibile rispetto a quest’ultimo.

Nel successivo test, viene chiesto a Gemini di enunciare le differenze tra le cuffie Nothing Ear e Nothing Ear (a) all’interno di un video che tratta l’argomento. Anche qui l’IA sembra essersi comportata bene, elencando le principali differenze e sintetizzando le parti più importanti, pur tralasciando alcuni dettagli che potrebbero risultare rilevanti per alcuni. I risultati non sono perfetti, ma come dimostrano le due ulteriori prove su video riguardanti i tracker Chipolo e le modalità di ricarica con cavo, Gemini è già in grado di centrare il punto e rispondere in modo adeguato, seppur ovviamente sintetico.

Naturalmente non è ancora tutto perfetto, come del resto qualsiasi funzione legata all’intelligenza artificiale. In certi casi, Gemini prende in considerazione solo parte del filmato per rispondere, e senza il “giusto” contesto di una frase può arrivare a fornire informazioni parziali o non completamente corrette. Tornando al video di Google Pixel 8a, è stato chiesto se lo smartphone fosse potente e se esistesse un modello migliore: l’IA ha risposto che Pixel 8a è un telefono potente e migliore rispetto al predecessore Pixel 7a, e che rispetto a Pixel 8 pareggia sotto diversi aspetti; tuttavia, con questa risposta ha dimostrato di aver considerato solo la prima parte del video, dove vengono comparati proprio questi tre modelli.

Non ha fornito informazioni sbagliate in sé, però non ha analizzato il quadro completo: nella seconda parte del video viene detto che OnePlus 12R è uno smartphone più potente nella stessa fascia di prezzo, e per farlo arrivare a dire questo è stato necessario fare domande più specifiche (“c’è qualche altro telefono che batte Pixel 8a?“) che presuppongono la conoscenza del contenuto del video per intero; dato che si presume che questo non avvenga quando si utilizza questa funzione, parliamo di un limite che speriamo venga superato con successivi miglioramenti.

L’ultima prova da parte dei colleghi ha fatto andare un po’ fuori strada Google Gemini. All’interno di un video riguardante le watch face preferite per Pixel Watch e Galaxy Watch, viene chiesto all’IA quali sono i migliori quadranti analogici: la risposta è stata stavolta imprecisa e incompleta. Due di quelli consigliati (Sport XR e Material Stack) sono in realtà quadranti digitali, anche se all’interno del video viene esplicitamente detto solo per la prima, e l’IA si è scordata della watch face Typograph, che avrebbe dovuto citare dato che è analogica.

Insomma, la funzione Ask this video di Google Gemini sembra andare già piuttosto bene, ma appare migliorabile: in particolare dovrebbe riuscire ad analizzare in modo completo tutto il video, invece di “avere fretta” di rispondere. Siamo sicuri che con il passare del tempo Google ci lavorerà sopra, andando a perfezionare diversi aspetti e a colmare le lacune. Come per Ask this page, anche Ask this video non è ancora disponibile per gli utenti, quindi potrebbero ancora esserci miglioramenti prima del debutto ufficiale.