L’utilizzo di intelligenze artificiali nelle operazioni comuni della vita di tutti i giorni diventa sempre più frequente e per tale ragione tutti i più importanti colossi tecnologici sviluppano proprie soluzioni: una delle più avanzate si chiama Tacotron ed è stata sviluppata da Google.

Si tratta di una soluzione studiata per rendere le funzionalità text-to-speech sempre più piacevoli da utilizzare: pur non avendo ancora un registro di voce paragonabile a quella degli esseri umani, riesce tuttavia a gestire i cambiamenti di toni in base al contesto.

Tacotron, inoltre, è capace di interpretare le possibili varianti di una medesima parola e sorvolare su piccoli errori o refusi, è sensibile alla punteggiatura o alle maiuscole ed è in grado di dare la giusta enfasi alla frase, il tutto con una maggiore velocità rispetto alle soluzioni concorrenti.

Il materiale relativo a Tacotron (“white paper”) è disponibile su Github con alcuni esempi audio anche se il progetto, almeno per il momento, non è open-source.