A pochi giorni dall’aggiornamento che ha reso più convincenti le voci di Google Cloud Text-to-Speech grazie a WaveNet, il colosso di Mountain View ha rilasciato un aggiornamento dell’API che fa l’operazione inversa.

Secondo Big G si tratta del più grande miglioramento disponibile per il client business di Cloud Speech-to-Text grazie alla tecnologia di riconoscimento della voce utilizzata da Google Assistant e da Ricerca Google. Ora è possibile effettuare trascrizioni di chiamate telefoniche, una funzione che sarà sicuramente utile agli operatori dei call center, ma anche il commento di una intera partita di basket con 4 diversi commentatori, interviste e il rumore della folla in sottofondo.

Google sta inoltre testando una nuova funzione, attualmente in versione beta, per aggiungere la punteggiatura alle traduzioni più lunghe, migliorando decisamente la leggibilità del testo. I risultati sono stati possibili grazie anche all’utilizzo di dati reali per istruire più rapidamente il sistema, garantendo una migliore qualità delle trascrizioni e una minor percentuale di errori.

Cambiamo argomento per segnalare che a patire dal 12 maggio non sarà più possibile utilizzare Google Foto Backup per eseguire il backup delle proprie immagini su Google Foto da desktop. Vi basterà comunque installare “Backup e Sincronizzazione”, che potete scaricare da questo indirizzo.