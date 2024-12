Nell’ultimo anno Google ha introdotto molti strumenti basati sull’intelligenza artificiale e uno dei più potenti è NotebookLM che riassume le fonti e organizzare le note.

Una delle funzionalità più interessanti di NotebookLM sono le panoramiche audio in stile podcast in cui due soggetti creati dall’IA discuteranno le informazioni presenti nei documenti che l’utente ha fornito come input. Ora sembra che questa funzionalità di NotebookLM potrebbe essere in arrivo su Google Gemini per Android.

Nel frattempo Google Assistant basato su Google Gemini sta iniziando a rispondere con una nuova voce.

Google Gemini potrebbe trasformare i PDF in podcast

Il codice dell’ultima versione beta dell’App Google ora contiene dei riferimenti alle panoramiche audio e al momento c’è anche una funzionalità incompleta che offre un’anteprima di come potrebbero funzionare.

Google Gemini dovrebbe iniziare a suggerire l’opzione per le panoramiche audio quando l’utente carica un documento appropriato come input. Se l’utente sceglierà questa opzione, Gemini inizierà a elaborare le informazioni contenute e probabilmente darà vita a un podcast similmente a NotebookLM. Per ora Gemini fornisce solo un riepilogo testuale.

Probabilmente sarà anche possibile scaricare il podcast, ma al momento non abbiamo idea di quando Google potrebbe implementare questa funzionalità.

Google Gemini sta iniziando a rispondere con una nuova voce

Ad agosto Google ha anticipato che avrebbe utilizzato Gemini per migliorare Google Assistant su smart speaker e smart display per fornire risposte migliori tramite una nuova voce. Ora questa novità sta iniziando a manifestarsi.

Alcuni utenti Nest segnalano che stanno udendo voci diverse a seconda del comando. La voce precedente impostata viene utilizzata per domande di base come “che tempo fa”, mentre la voce basata su Gemini è attiva per domande più colloquiali e quindi permette di avere una conversazione.

In futuro la funzionalità dovrebbe fornire risposte più complete, nuove voci più naturali che semplificano l’interazione con gli altoparlanti e i display e in generale una migliore comprensione.