OpenAI sta lavorando a un importante aggiornamento della modalità vocale di ChatGPT che potrebbe cambiare ancora l’esperienza degli utenti.
Secondo quanto emerso da un’analisi approfondita del codice dell’applicazione, infatti, la funzione vocale dell’assistente AI sta per abbandonare l’attuale interfaccia a schermo intero per integrarsi direttamente nelle conversazioni chat, permettendo così la visualizzazione di contenuti complessi durante le interazioni vocali.
DREAME L40 Ultra AE
Robot Aspirapolvere Lavapavimenti, 19.000 Pa, Pulizia moci con Acqua Calda a 75°C
Come funziona ora la modalità vocale
Ricordiamo che attualmente quando un utente attiva la modalità vocale su ChatGPT, si trova davanti a un’interfaccia completamente separata dal resto dell’applicazione.
La schermata occupa tutto lo spazio disponibile ed è accompagnata da un’animazione che indica l’attività dell’assistente. Per impostazione predefinita, non viene mostrato alcun testo, anche se gli utenti hanno la possibilità di attivare i sottotitoli per seguire la trascrizione in tempo reale della conversazione.
Il problema principale di questa configurazione è che, pur rendendo la conversazione più facile da seguire grazie alla trascrizione testuale l’interfaccia rimane limitata al solo testo. Non è dunque possibile visualizzare contenuti ulteriori, ma pur utili, come link cliccabili, mappe interattive, previsioni meteorologiche dettagliate o altri elementi grafici che potrebbero rendere l’interazione molto più efficace e completa.
Per accedere a questi contenuti, l’utente è costretto a interrompere la conversazione vocale e tornare all’interfaccia chat tradizionale, fermando così il flusso naturale dell’interazione.

Segui l'Intelligenza Artificiale su Telegram, ricevi news e offerte per primo
Come funziona la nuova integrazione nella chat
L’analisi del codice della versione 1.2025.294 di ChatGPT ha rivelato che OpenAI sta sviluppando una soluzione piuttosto interessante a questa limitazione. Invece di aprire una schermata separata, infatti, la nuova modalità vocale funzionerà direttamente all’interno dell’interfaccia di chat esistente. Il cambiamento, in apparenza piuttosto semplice, non manca di apportare alcune implicazioni piuttosto significative per l’esperienza utente.
Di fatto, quando l’utente toccherà l’icona della chat vocale, non verrà più spostato in una schermata a parte con animazioni. La conversazione vocale si avvierà direttamente nel contesto della chat in corso, mantenendo visibili tutti gli elementi dell’interfaccia conversazionale. Saranno disponibili pulsanti intuitivi per terminare la conversazione vocale e per attivare o disattivare il microfono, garantendo un controllo completo senza dover abbandonare il flusso della discussione.
I contenuti arricchiti subito disponibili
L’integrazione apre anche a possibilità completamente nuove per l’interazione vocale con ChatGPT. Gli utenti potranno finalmente vedere in tempo reale i contenuti complessi che l’assistente genera in risposta alle loro domande vocali. Se si chiede il meteo, apparirà una visualizzazione grafica delle previsioni. Se si domanda un indirizzo, verrà mostrata una mappa. Se ChatGPT fornisce riferimenti o fonti, i link saranno immediatamente cliccabili.
Evidentemente, una simile evoluzione rende la modalità vocale non più una funzionalità isolata e limitata, ma una vera alternativa completa alla chat testuale. Gli utenti che preferiscono comunicare a voce potranno farlo senza dover sacrificare la ricchezza di informazioni che caratterizza le risposte di ChatGPT, con la conseguenza che la continuità tra input vocale e output visivo dovrebbe migliorare in modo significativo l’accessibilità e l’usabilità dell’assistente AI.

La competizione diretta con Gemini Live
Non sfugge che questo aggiornamento sembra essere destinato ad arrivare in un momento particolare per OpenAI. Google ha infatti lanciato Gemini Live, la propria soluzione per le interazioni vocali con l’intelligenza artificiale, che sta guadagnando rapidamente popolarità tra gli utenti. La competizione nel settore degli assistenti AI vocali si sta intensificando, e le aziende stanno cercando di differenziarsi offrendo esperienze sempre più fluide e naturali.
Dinanzi a questo scenario OpenAI non può certo rimanere a guardare e, dunque, l’aggiornamento della modalità vocale sembra essere coerente in questo percorso. L’azienda sta inoltre lavorando a diverse altre funzionalità per l’app Android di ChatGPT: tra queste, ci sono messaggi diretti e chat di gruppo, che trasformerebbero ulteriormente l’applicazione da semplice interfaccia per un assistente AI a una vera piattaforma di comunicazione integrata.
Inoltre, l’impegno di OpenAI non si limita solo a ChatGPT. L’azienda ha recentemente lanciato ChatGPT Atlas, un browser web che vuole competere con i colossi del settore come Google Chrome aggiungendo nuove funzionalità sull’intelligenza artificiale.
Quando arriverà l’aggiornamento?
Al momento, queste modifiche alla modalità vocale non sono ancora disponibili pubblicamente. Sono state individuate e attivate anticipatamente attraverso l’analisi del codice dell’applicazione, ma non è stata comunicata una data ufficiale di rilascio. Considerando che il codice è già presente nell’app, è ragionevole aspettarsi che la funzionalità possa essere lanciata nelle prossime settimane o mesi.

