Se c’è un’azienda che crede fermamente e investe continuamente nell’intelligenza artificiale, quella è di certo Google: nei prossimi mesi, diversi prodotti del colosso di Mountain View potrebbero accogliere il potere dell’AI e tra questi potrebbe figurare anche l’apprezzatissima tastiera Gboard per dispositivi Android. Beninteso, al momento si tratta di semplici indiscrezioni, tuttavia sono già degne di menzione.

Tracce dalla beta: Imagen in arrivo su Gboard?

Le informazioni prese in esame in questa sede sono il frutto della solita operazione denominata APK Insight, che consiste nel decompilare ed analizzare i file APK delle versioni più recenti di app Android di interesse: in questo caso, si tratta di Gboard, con particolare riferimento alla più recente versione beta, la 12.7.05.507749191. Ebbene, lo studio di tale file APK ha visto emergere delle stringhe di codice facenti riferimento ad una “Imagen Keyboard”.

Tale novità dovrebbe trovare posto nella riga/pagina degli shortcut di Gboard, che già comprende tutta una serie di opzioni utili come GIF, Con una sola mano, Traduzione, Floating e non solo. Per intenderci, nella sua versione più recente il pannello in questione presenta l’aspetto mostrato nel seguente screenshot.

gboard shortcut

Negli ultimi tempi, il team di Gboard ha dedicato parecchie attenzioni al rinnovamento di questa porzione dell’app e, a quanto pare, lo sviluppo è ben lungi dall’aver raggiunto la sua fase di massima espressione: una futura aggiunta potrebbe chiamare in causa Imagen, un generatore di immagini basate su input testuali.

Annunciato lo scorso maggio, mentre tutta l’attenzione era rivolta a DALL-E 2, Imagen — a detta di Google — abbina un’approfondita comprensione del linguaggio ad un “grado di fotorealismo senza precedenti”. In un confronto benchmark condotto lo scorso anno e inclusivo di VQ-GAN+CLIP, Latent Diffusion Models e DALL-E 2, Google parla di una preferenza per Imagen da parte degli utenti umani sia in termini di qualità dei sample forniti che di abbinamento tra testo e immagini.

La nostra scoperta chiave è che modelli linguistici generici di grandi dimensioni  (e.g. T5), preaddestrati su corpora di solo testo, sono sorprendentemente efficaci nella codifica del testo per la sintesi di immagini: l’aumento delle dimensioni del modello linguistico in Imagen si traduce in un aumento notevole sia della fedeltà del campione che dell’allineamento immagine-testo, molto più che aumentando le dimensioni del modello di diffusione dell’immagine”.

Il colosso di Mountain View riferisce di una superiorità di Imagen anche con riguardo a relazioni spaziali, testi lunghi, parole non di uso comune e compiti particolarmente impegnativi.

Va detto che, allo stato attuale, Google non ha rilasciato codice né una demo pubblica che tenga conto dell’impatto sociale della novità. Sul finire dello scorso anno, si era soltanto detto che il lavoro di generazione di immagini da input testuali sarebbe eventualmente potuto confluire in AI Test Kitchen Season 2.

Senza dilungarsi troppo nell’esame di novità che al momento hanno ben poco di concreto, l’aggiunta di una Imagen Keyboard in Gboard potrebbe operare in maniera non troppo dissimile dalla simpatica e potente Emoji Kitchen di Google, la quale permette agli utenti di combinare delle emoji per dare vita a dei nuovi adesivi sfruttabili nelle conversazioni. Sulla scia di AI Test Kitchen, è lecito presumere che anche Imagen in Gboard si concentrerà soprattutto sulla creazione di risultati simpatici e di grande espressività. Del resto, già adesso Gboard permette agli utenti di creare degli adesivi basati sul testo digitato.

Come installare la versione più recente di Gboard per Android

Se siete tra i pochi a non avere ancora installato l’ottima tastiera Gboard di Google sul vostro dispositivo Android, non dovete fare altro che cliccare sul badge sottostante per scaricarne la versione più recente direttamente dal Google Play Store (la stessa pagina vi permetterà, se interessati a provare per primi le ultime novità, anche di aderire al programma beta).

Leggi anche: Il lancio raffazzonato di Bard non sarebbe piaciuto ai dipendenti di Google