OpenAI sembra ormai essere vicina al lancio di quello che potrebbe rappresentare il più importante aggiornamento degli ultimi mesi per la modalità vocale di ChatGPT. Dopo aver concentrato gran parte degli sforzi sul miglioramento dei modelli testuali, culminati con l’arrivo di GPT-5.5, l’azienda guidata da Sam Altman sarebbe pronta a colmare il divario che ancora separa le conversazioni vocali dall’esperienza disponibile tramite chat scritta.
Le indiscrezioni emerse nelle ultime settimane, e rafforzate da nuovi riferimenti individuati sia nell’interfaccia web che nelle applicazioni mobili di ChatGPT, parlano infatti di un nuovo modello audio denominato provvisoriamente GPT-Bidi-1, una tecnologia che potrebbe cambiare in maniera significativa il modo in cui gli utenti interagiscono con l’assistente tramite la voce.
Segui TuttoAndroid su Google Discover
ChatGPT punta a rendere le conversazioni più naturali con il modello GPT-Bidi-1
Il nome stesso del modello fornisce un indizio sulla tecnologia alla base del progetto, “Bidi” farebbe infatti riferimento a un’architettura bidirezionale progettata per consentire all’assistente di ascoltare e parlare contemporaneamente, avvicinandosi maggiormente alle dinamiche di una conversazione umana.
A differenza dell’attuale modalità vocale avanzata, che tende a interrompere l’elaborazione quando l’utente prende la parola o modifica improvvisamente la richiesta, GPT-Bidi-1 sarebbe in grado di gestire interruzioni in tempo reale, adattandosi immediatamente ai cambi di contesto senza dover riavviare la risposta.
Nei primi test condivisi da alcuni utenti che avrebbero già ricevuto accesso alla nuova funzione, il sistema mostrerebbe un comportamento decisamente più naturale, durante una pausa della conversazione può fornire brevi segnali di ascolto come un semplice ok, mantenendo il contesto e senza interrompere il flusso del dialogo.
La capacità di reagire istantaneamente alle modifiche delle richieste rappresenterebbe uno dei principali punti di forza della nuova tecnologia; ad esempio, chiedendo a ChatGPT di contare fino a dieci e interrompendolo per invertire il conteggio, il modello sarebbe in grado di adattarsi immediatamente senza perdere il filo della conversazione.
Uno degli aspetti più interessanti riguarda la gestione della memoria contestuale, secondo quanto emerso GPT-Bidi-1 riuscirebbe a mantenere il filo del discorso per l’intera durata della conversazione, superando una delle limitazioni più evidenti degli attuali sistemi vocali.
Molti utenti hanno infatti notato come l’attuale modalità vocale possa talvolta perdere informazioni precedentemente condivise o mostrare difficoltà nel mantenere un contesto coerente durante conversazioni particolarmente lunghe. Con il nuovo modello, OpenAI sembrerebbe intenzionata a ridurre sensibilmente questo problema.
Anche la gestione delle pause dovrebbe migliorare, il sistema non interromperebbe più automaticamente la conversazione durante momenti di silenzio prolungato, offrendo un’esperienza più fluida e meno artificiale.
Le informazioni individuate all’interno dell’app suggeriscono inoltre che OpenAI stia lavorando a una nuova organizzazione della modalità vocale. Gli utenti potrebbero avere la possibilità di scegliere tra differenti livelli di elaborazione, identificati come Alto, Medio e Istantaneo, una struttura che richiama da vicino le opzioni già disponibili per alcuni modelli testuali; l’obbiettivo sarebbe quello di consentire agli utenti di bilanciare velocità di risposta e capacità di ragionamento in base alle proprie esigenze.
La nuova modalità vocale potrebbe inoltre convivere con quella avanzata attuale, permettendo di passare da una tecnologia all’altra senza una migrazione obbligatoria.
L’arrivo di GPT-Bidi-1 confermerebbe una direzione strategica ormai evidente, openAI ritiene infatti che la voce possa diventare il principale strumento di interazione con l’intelligenza artificiale nei prossimi anni, superando gradualmente il tradizionale utilizzo tramite tastiera.
Si tratta di una visione che si riflette anche nei recenti investimenti dell’azienda nel settore hardware e nelle tecnologie vocali, con l’obbiettivo di trasformare ChatGPT in un assistente sempre più naturale a presente nella vita quotidiana degli utenti.
Al momento OpenAI non ha ancora annunciato ufficialmente GPT-Bidi-1, ma i riferimenti sempre più numerosi individuati nelle applicazioni e i primi test pubblici suggeriscono che il debutto potrebbe essere molto vicino. Non è tuttavia chiaro se il rilascio inizierà già nei prossimi giorni oppure se gli utenti dovranno pazientare ancora un po’, soprattutto nei Paesi dell’Area Economica Europea, dove eventuali limitazioni normative potrebbero rallentare la distribuzione.
- ChatGPT potenzia la memoria e porta il sistema Dreaming anche agli utenti del piano gratuito
- ChatGPT per Android prepara tante novità per migliorare l’esperienza d’uso
- ChatGPT si prepara a rinnovare la condivisione delle conversazioni (e non solo)
- ChatGPT offre consulenza finanziaria personalizzata a chi collega il proprio conto bancario
