OpenAI sembra ormai essere vicina al lancio di quello che potrebbe rappresentare il più importante aggiornamento degli ultimi mesi per la modalità vocale di ChatGPT. Dopo aver concentrato gran parte degli sforzi sul miglioramento dei modelli testuali, culminati con l’arrivo di GPT-5.5, l’azienda guidata da Sam Altman sarebbe pronta a colmare il divario che ancora separa le conversazioni vocali dall’esperienza disponibile tramite chat scritta.

Le indiscrezioni emerse nelle ultime settimane, e rafforzate da nuovi riferimenti individuati sia nell’interfaccia web che nelle applicazioni mobili di ChatGPT, parlano infatti di un nuovo modello audio denominato provvisoriamente GPT-Bidi-1, una tecnologia che potrebbe cambiare in maniera significativa il modo in cui gli utenti interagiscono con l’assistente tramite la voce.

Segui TuttoAndroid su Google Discover

Offerta
-10%

Google Pixel 10 Pro XL

899€ invece di 999€
Offerta
-38%

roborock Qrevo S Pro Set

Offerta + coupon: TTANDROID5

369.99€ invece di 599.99€
Offerta
-34%

Samsung Galaxy S26 Ultra

985€ invece di 1499€
Offerta
-55%

OPPO Enco Buds3

18€ invece di 39.99€
Offerta
-19%

Tineco Floor ONE S7 Stretch Ultra

299€ invece di 369.99€
Offerta
-17%

vivo X300 Ultra 16GB / 1TB + BUNDLE

1999.9€ invece di 2399€
Offerta
-42%

ECOVACS DEEBOT T50 PRO OMNI Gen3

349€ invece di 599€
Offerta
-22%

Google Pixel 10 Pro, 256GB

699€ invece di 899€
Offerta
-25%

ECOVACS DEEBOT T90 PRO OMNI

599€ invece di 799€
Offerta
-42%

roborock Qrevo Curv 2 Flow

Offerta + clicca su applica coupon di 50 euro + coupon: TTANDROID5

519€ invece di 899€
Offerta
-28%

realme P4X 4G, 7500mAh

Offerta + coupon: P4X20OFF

179.99€ invece di 249.99€
Offerta
-28%

DREAME H15 Pro Heat

429€ invece di 599€

ChatGPT punta a rendere le conversazioni più naturali con il modello GPT-Bidi-1

Il nome stesso del modello fornisce un indizio sulla tecnologia alla base del progetto, “Bidi” farebbe infatti riferimento a un’architettura bidirezionale progettata per consentire all’assistente di ascoltare e parlare contemporaneamente, avvicinandosi maggiormente alle dinamiche di una conversazione umana.

A differenza dell’attuale modalità vocale avanzata, che tende a interrompere l’elaborazione quando l’utente prende la parola o modifica improvvisamente la richiesta, GPT-Bidi-1 sarebbe in grado di gestire interruzioni in tempo reale, adattandosi immediatamente ai cambi di contesto senza dover riavviare la risposta.

Nei primi test condivisi da alcuni utenti che avrebbero già ricevuto accesso alla nuova funzione, il sistema mostrerebbe un comportamento decisamente più naturale, durante una pausa della conversazione può fornire brevi segnali di ascolto come un semplice ok, mantenendo il contesto e senza interrompere il flusso del dialogo.

La capacità di reagire istantaneamente alle modifiche delle richieste rappresenterebbe uno dei principali punti di forza della nuova tecnologia; ad esempio, chiedendo a ChatGPT di contare fino a dieci e interrompendolo per invertire il conteggio, il modello sarebbe in grado di adattarsi immediatamente senza perdere il filo della conversazione.

Uno degli aspetti più interessanti riguarda la gestione della memoria contestuale, secondo quanto emerso GPT-Bidi-1 riuscirebbe a mantenere il filo del discorso per l’intera durata della conversazione, superando una delle limitazioni più evidenti degli attuali sistemi vocali.

Molti utenti hanno infatti notato come l’attuale modalità vocale possa talvolta perdere informazioni precedentemente condivise o mostrare difficoltà nel mantenere un contesto coerente durante conversazioni particolarmente lunghe. Con il nuovo modello, OpenAI sembrerebbe intenzionata a ridurre sensibilmente questo problema.

Anche la gestione delle pause dovrebbe migliorare, il sistema non interromperebbe più automaticamente la conversazione durante momenti di silenzio prolungato, offrendo un’esperienza più fluida e meno artificiale.

Le informazioni individuate all’interno dell’app suggeriscono inoltre che OpenAI stia lavorando a una nuova organizzazione della modalità vocale. Gli utenti potrebbero avere la possibilità di scegliere tra differenti livelli di elaborazione, identificati come Alto, Medio e Istantaneo, una struttura che richiama da vicino le opzioni già disponibili per alcuni modelli testuali; l’obbiettivo sarebbe quello di consentire agli utenti di bilanciare velocità di risposta e capacità di ragionamento in base alle proprie esigenze.

La nuova modalità vocale potrebbe inoltre convivere con quella avanzata attuale, permettendo di passare da una tecnologia all’altra senza una migrazione obbligatoria.

L’arrivo di GPT-Bidi-1 confermerebbe una direzione strategica ormai evidente, openAI ritiene infatti che la voce possa diventare il principale strumento di interazione con l’intelligenza artificiale nei prossimi anni, superando gradualmente il tradizionale utilizzo tramite tastiera.

Si tratta di una visione che si riflette anche nei recenti investimenti dell’azienda nel settore hardware e nelle tecnologie vocali, con l’obbiettivo di trasformare ChatGPT in un assistente sempre più naturale a presente nella vita quotidiana degli utenti.

Al momento OpenAI non ha ancora annunciato ufficialmente GPT-Bidi-1, ma i riferimenti sempre più numerosi individuati nelle applicazioni e i primi test pubblici suggeriscono che il debutto potrebbe essere molto vicino. Non è tuttavia chiaro se il rilascio inizierà già nei prossimi giorni oppure se gli utenti dovranno pazientare ancora un po’, soprattutto nei Paesi dell’Area Economica Europea, dove eventuali limitazioni normative potrebbero rallentare la distribuzione.