Gli assistenti digitali sui nostri smartphone diventano più smart mese dopo mese grazie all’intelligenza artificiale. C’è però un aspetto su cui devono ancora fare passi avanti significativi: la capacità di sostenere conversazioni naturali.

Chiunque abbia usato Gemini, l’assistente di Google, sa bene la frustrazione di essere interrotto nel bel mezzo di un comando vocale, a volte solo perché si è fatta una breve pausa per riflettere.

Offerta

Caricatore USB-C 100W UGREEN

GaN con Cavo Retrattile, Ricarica Rapida con 4 Porte, Compatibile con qualsiasi dispositivo

38.99€ invece di 59.99€
-35%

Il fastidioso problema delle pause durante i comandi vocali

In altri termini, è come se oggi Gemini fosse dotato di poca pazienza: l’assistente tende a interpretare qualsiasi pausa come la fine della richiesta. E questo significa che gli utenti devono formulare i loro comandi in un’unica sequenza ininterrotta, senza esitazioni o momenti di riflessione. L’unica eccezione a questa limitazione è rappresentata da Gemini Live o dalla modalità vocale di ChatGPT, che permettono conversazioni più fluide e naturali.

Il problema diventa particolarmente evidente quando si devono fare richieste complesse o articolate. Si immagini di voler chiedere all’assistente di organizzare qualcosa che richiede diversi dettagli: magari bisogna fermarsi un attimo a ricordare una data, o a formulare meglio un concetto.

Ebbene, con il sistema attuale, quella breve pausa verrebbe interpretata come la fine del comando, costringendo così l’utente a ricominciare da capo o a completare la richiesta in modo affrettato e poco preciso.

Segui Google Italia su Telegram, ricevi news e offerte per primo

Ecco la soluzione in arrivo: il blocco del microfono

Google ha deciso di affrontare questa limitazione e sta testando una nuova funzionalità che potrebbe migliorare l’esperienza d’uso di Gemini. Secondo quanto emerso dall’analisi della versione 16.42.61 dell’app Google, infatti, l’azienda di Mountain View sta sperimentando una nuova opzione per il microfono che ricorda molto il funzionamento delle note vocali su WhatsApp.

Il meccanismo prevede che gli utenti potranno tenere premuta l’icona del microfono nella casella di input di Gemini per bloccarlo in modalità di ascolto continuo. Una volta attivata questa funzione, il microfono rimarrà attivo per tutto il tempo necessario, permettendo di fare pause quando si vuole senza che l’assistente interrompa l’ascolto. Quando il microfono viene bloccato in questo modo, l’icona si trasforma in un pulsante di stop, che l’utente potrà premere quando avrà finito di parlare.

Se troverà effettivo spazio, la soluzione sarà un buon equilibrio tra praticità e controllo. Gemini non sarà mai completamente passivo nell’ascolto, ma potrà dare comunque agli utenti la possibilità di scegliere quando vogliono una conversazione più lunga e articolata. Diventa così una funzione particolarmente utile per quelle richieste complesse dove è naturale dover fare una pausa per pensare, senza la pressione di dover correre per finire il comando prima che l’assistente smetta di ascoltare.

Non è questo l’unico cambiamento in arrivo

Oltre alla funzionalità principale del blocco del microfono, Google sta testando anche alcuni aggiustamenti estetici all’interfaccia di Gemini. Cambiamenti che potrebbero sembrare meno significativi rispetto alla nuova opzione del microfono, ma fanno parte di un processo più ampio di raffinamento dell’esperienza utente.

Uno di questi è ad esempio legato al design della casella di input di Gemini. La nuova versione in test prevede che questa casella si espanda quando si inizia a digitare, in modo simile a quanto già avviene nell’interfaccia dedicata di Gemini su Android. Per il momento è difficile dire se questo piccolo aggiustamento sia parte di un piano per uniformare l’esperienza tra l’overlay fluttuante e l’interfaccia principale, o se si tratta semplicemente di un esperimento che potrebbe non vedere mai la luce pubblica.

Un altro elemento in fase di sviluppo è un pulsante fluttuante che permetterà di minimizzare o massimizzare l’overlay di Gemini Live: secondo i test più recenti, il pulsante potrà essere spostato e ancorato in diverse posizioni sullo schermo (sul lato sinistro o destro, in alto, al centro o in basso).

Quando arriveranno queste novità?

Come spesso accade con le funzionalità scoperte attraverso l’analisi del codice delle app, non c’è alcuna garanzia che tutto ciò che viene testato arrivi effettivamente agli utenti finali. Google potrebbe decidere di modificare queste funzionalità, rimandarle o addirittura abbandonarle del tutto se i test non dovessero dare risultati soddisfacenti.

Tuttavia, la funzionalità del blocco del microfono risponde a un’esigenza reale e concreta degli utenti, quella di poter interagire con l’assistente in modo più naturale e meno affrettato. Insomma, un miglioramento che sembra essere coerente con gli sforzi di Gemini di rendere l’esperienza più simile a una vera conversazione. Per questo motivo, c’è una buona probabilità che Google decida di portare avanti questo sviluppo fino al rilascio pubblico.