Parlando di intelligenza artificiale integrata negli smartphone, il prossimo obiettivo di Google è chiaramente quello di trasformare Gemini in un vero e proprio “agente IA”, un’entità capace di avere il “polso della situazione”, di comprendere il contesto e risultare proattivo nel proporre soluzioni/suggerimenti che possano anticipare i bisogni dell’utente.

Allo stato attuale, Gemini (come tutti gli altri assistenti IA) necessita di una parola chiave (o un trigger, come la gesture o la pressione di un pulsante) di attivazione ma in futuro le cose potrebbero cambiare: recentemente è infatti emerso un brevetto che suggerisce l’attivazione “automatica” dell’assistente quando lo schermo dello smartphone rileverà la presenza del viso dell’utente, aspetto che potrebbe rendere più immediate le interazioni quotidiane.

Google: un nuovo brevetto suggerisce che le interazioni con Gemini saranno più immediate

Il blog Neume.io ha recentemente fatto trapelare i dettagli di un nuovo brevetto depositato da Google che suggerisce un nuovo modo per invocare l’assistente IA presente all’interno dello smartphone, superando il modo in cui operiamo attualmente: come anticipato in apertura, per invocare l’assistente dobbiamo sfruttare una gesture, effettuare la pressione di un pulsante o pronunciare una “hot word” (parola chiave come “Ehi Google”, nel caso di Google Asssitant prima e Gemini poi).

Secondo il brevetto, il processo di attivazione avverrà in maniera “passiva”, basandosi sul movimento dell’utente, e sfrutterà l’hardware già presente su uno smartphone (nello specifico, la griglia di sensori capacitivi che troviamo sullo schermo e che serve per rilevare il tocco delle dita attraverso rilevazioni di variazione del campo elettrico).

Al netto di questo scopo, questa “griglia di sensori” può rilevare la presenza di oggetti vicini senza che essi effettivamente tocchino lo schermo; ciò si verifica anche quando avviciniamo lo schermo dello smartphone al nostro viso (e alla bocca). Sarà lo smartphone stesso a elaborare lo schema specifico e ad attivare l’interazione con l’assistente quando rileverà la presenza del volto, eliminando la necessità di sfruttare uno dei trigger di attivazione (gesture, pressione di un tasto, parola chiave).

Sulla carta sembrano più i vantaggi che gli svantaggi ma l’implementazione non sembra essere dietro l’angolo

Stando al contenuto del brevetto, saltano subito all’occhio quelli che si configurano come i vantaggi di questo approccio: accesso più rapido alle potenzialità dell’assistente (col tempo potrebbe diventare qualcosa di automatico e familiare per gli utenti), nessun aumento dei consumi (il sistema non richiede l’implementazione di hardware aggiuntivo), capacità di migliorare nel tempo (grazie alla stessa IA, il sistema potrà imparare a riconoscere sempre meglio le abitudini dell’utente e adattarsi al modo in cui viene utilizzato per evitare attivazioni involontarie o nei momenti meno opportuni).

Tutto ciò è molto bello, certo, peccato che (al momento) si tratti di un semplice brevetto. Esso dimostra che dalle parti di Mountain View continuano costantemente a lavorare per trovare soluzioni che possano migliorare l’esperienza utente, anche e soprattutto nell’interazione con Gemini e tutti gli strumenti di intelligenza artificiale (siamo nel periodo storico del boom di queste potenzialità).

Non è assolutamente detto che ciò possa essere implementato in tempi brevi. Come si usa dire: “Tra il dire e il fare c’è di mezzo il mare“. Vedremo quanto ci vorrà affinché ciò diventi realtà, ammesso che lo diventi mai: spesso le aziende depositano brevetti solo per evitare che qualcun altro possa fregar loro l’idea.