Google sta migliorando la sua Gboard con gli stessi strumenti di machine learning che utilizza per il riconoscimento vocale: questa tecnologia permette di migliorare in maniera esponenziale le prestazioni e la qualità dei risultati ottenuti.

Ma in che modo vengono realizzati questi miglioramenti? Cosa c’è dietro le predizioni di Gboard?

Concentriamoci sul modo in cui viene determinato un input nella tastiera di Google e nella matematica e i modelli che stanno dietro al riconoscimento delle parole:

Capita spesso di sbagliare quando digitiamo ed usiamo la funzione swipe; non sempre riusciamo a collegare le giuste lettere.

Quì entra in gioco l’intelligenza artificiale e la tecnologia di cui ci parla Google, che attraverso dei modelli predittivi ci permette di ottenere le giuste correzioni in base alle lettere che si trovano nella prossimità fisica dell’input.

Originariamente Gboard usava un sistema chiamato “modello Gaussian” che quantificava la probabilità di toccare le lettere vicine a quelle effettivamente volute; purtroppo non c’era modo di ottimizzare in modo corretto le metriche correlate alla migliore qualità di digitazione, per cui si è giunti alla sostituzione del modello Gaussian con un LSTM.

  • LSMT(Long short-term memory model) sta ad indicare una architettura ricorrente della rete neurale artificiale, usata dal colosso di Mountain View per Google Assistant e Google Traduttore. In poche parole, con questo sistema è possibile fare riferimento ai dati in molte fasi di analisi da più periodi di tempo. Per capire meglio è utile osservare le seguenti immagini:
    L’immagine a sinistra rappresenta i singoli punti dati dalla digitazione della parola “COULD” in Gboard, mentre quella a destra mostra la stessa parola inserita tramite swipe. In base ad un contesto temporale con input inseriti in diversi tempi, è possibile decifrare il percorso complessivo che porta effettivamente alla parola “COULD” tralasciando eventuali errori di digitazione.

Si aggiunge a tutto ciò anche un sistema di correzione via dizionario: in pratica, se scriviamo “ot”, Gboard controlla nel vocabolario relativo alla lingua (inglese in questo caso) e se non trova riscontri sostituisce l’input con “it” (che rappresenta un input quasi analogo ma con significato).

Gli sviluppatori sono poi in grado di sviluppare delle “catene logiche” per suggerire una parola successiva rispetto a quella che abbiamo digitato, come avrete modo di vedere in questa immagine che rappresenta le potenziali catene per le parole inglesi “I” “I’ve” e “If”:Sperando di esser riusciti a semplificare al massimo certi argomenti vi rimandiamo alla pubblicazione originale di Google, in modo da accedere ad una spiegazione corretta e dettagliata dei vari tecnicismi.