Da quattro anni Google ha lanciato su Android il proprio metodo di riconoscimento della scrittura manuale, permettendo agli utenti di selezionarlo come alternativa alla classica tastiera. Attualmente Android è in grado di riconoscere quasi 200 lingue diverse, grazie a una evoluzione della tecnologia di riconoscimento.

Dopo aver pubblicato un documento decisamente complesso che spiega nel dettaglio le ricerche che hanno portato ai nuovi metodi di riconoscimento, Google ha deciso di spiegare in maniera decisamente semplificata cosa si nasconde dietro alla tecnologia di riconoscimento della scrittura.

Si parte da una sequenza di tocchi, che rappresentano le linee tracciate dall’utente sullo schermo per disegnare la parola. Gboard inizia normalizzando le coordinate dei punti per unificarle rispetto alle varie risoluzioni degli schermi, trasformandole successivamente la sequenza di punti in una sequenza di curve cubiche di Bézier, che vengono letteralmente date in pasto a una rete neurale ricorrente, appositamente istruita per riconoscere i caratteri.

Il modello utilizzato da Google crea diverse ipotesi per scomporre i segni in una sequenza di caratteri, per ottenere quella più plausibile. Nelle due immagini sottostanti è possibile vedere il processo di riconoscimento della parola “go”, trasformata in curve e successivamente in una matrice, analizzata successivamente dalla rete neurale.

I risultati forniti dalla rete neurale sono combinati con un modello di linguaggio che definisce alcune sequenze di caratteri per ogni lingua, scartando dunque le meno frequenti e premiando quelle di uso comune. Il risultato è quello di riconoscere il testo scritto con una precisione che aumenta fino al 40% rispetto alle tecniche utilizzate in precedenza.

La velocità di interpretazione è merito dei modelli realizzati per TensorFlow Lite che permettono a Gboard di ridurre al minimo la latenza nel riconoscimento dei caratteri, aumentando la correttezza delle previsioni. Alla fonte potete trovare l’articolo completo con ulteriori dettagli che abbiamo omesso per facilitare la lettura dell’articolo.