OpenAI sta sperimentando un approccio inedito per consentire a ChatGPT di vedere lo schermo del tuo smartphone Android. L’obiettivo è lo stesso di sempre, ovvero permettere all’assistente di analizzare in tempo reale ciò che stai facendo sullo smartphone, ma con un metodo nuovo e potenziali vantaggi in termini di prestazioni e fluidità d’uso.

Segui TuttoAndroid su Google Discover

Offerta
-25%

ECOVACS DEEBOT T90 PRO OMNI

599€ invece di 799€
Offerta
-34%

Samsung Galaxy S26 Ultra

985€ invece di 1499€
Offerta
-42%

ECOVACS DEEBOT T50 PRO OMNI Gen3

349€ invece di 599€
Offerta
-28%

realme P4X 4G, 7500mAh

Offerta + coupon: P4X20OFF

179.99€ invece di 249.99€
Offerta
-26%

POCO X8 Pro, 6500mAh

294.4€ invece di 399.9€
Offerta
-10%

Google Pixel 10 Pro XL

899€ invece di 999€
Offerta
-21%

Google Pixel 10a

394.99€ invece di 499€
Offerta
-48%

roborock Qrevo Curv 2 Flow

Offerta + clicca su applica coupon di 50 euro + coupon: TTANDROID5

469€ invece di 899€
Offerta
-38%

roborock Qrevo S Pro Set

Offerta + coupon: TTANDROID5

369.99€ invece di 599.99€
Offerta
-17%

vivo X300 Ultra 16GB / 1TB + BUNDLE

1999.9€ invece di 2399€
Offerta
-20%

msi Modern 14, 16/512 GB

599€ invece di 749€
Offerta
-18%

ASUS Vivobook S16, OLED, 16GB/1TB

599€ invece di 730.47€
Offerta
-28%

DREAME H15 Pro Heat

429€ invece di 599€
Offerta
-19%

Tineco Floor ONE S7 Stretch Ultra

299€ invece di 369.99€

Come funziona oggi

Attualmente ChatGPT su Android si affida alle API MediaProjection per accedere ai contenuti dello schermo, lo stesso sistema utilizzato dalle applicazioni di screen recording o da chi proietta il proprio schermo su un display esterno.

Il problema è che questo metodo porta con sé una serie di scomodità: finestre di permesso che si sovrappongono, pop-up di avviso che interrompono il flusso di lavoro, e soprattutto un consumo elevato di risorse di sistema, dato che la registrazione avviene in modo continuo.

In altre parole, ci troviamo davanti a un’esperienza davvero macchinosa, che può rallentare sensibilmente il dispositivo.

Segui l'Intelligenza Artificiale su Telegram, ricevi news e offerte per primo

Accessibilità e Bubbles

Nella versione 1.2026.118 dell’app ChatGPT per Android, alcuni ricercatori hanno individuato una funzione in fase di sviluppo che sfrutta due strumenti ben diversi: le impostazioni di Accessibilità di Android e le cosiddette Bubbles, le bolle di notifica multitasking introdotte ufficialmente in Android 17, ma disponibili tramite API già da Android 11.

Con il nuovo approccio, al primo avvio della funzione l’utente viene guidato ad abilitare una voce chiamata ChatGPT screen help nelle impostazioni di Accessibilità del sistema. Vengono poi richiesti i permessi per le notifiche e per le bolle di conversazione, necessari affinché l’app rimanga attiva in background senza essere terminata dal sistema operativo. Ecco alcune schermate della novità al lavoro, tratte da Android Authority:

Come cambia l’esperienza utente

Una volta concessi i permessi, sullo schermo compare una bolla interattiva (del tutto simile a quelle delle chat di messaggistica) che rimane visibile sia nella schermata principale che all’interno di qualsiasi altra applicazione.

Toccando questa bolla, è possibile rivolgere domande specifiche a ChatGPT su ciò che appare in quel momento sullo schermo. L’assistente analizza il contesto visivo attuale in modo indipendente, senza attingere alla cronologia della conversazione in corso.

Il risultato di questo sistema è un vantaggio interessante rispetto al metodo attuale, ovvero il consumo ridotto di risorse. Non trattandosi di una registrazione continua, ma di un accesso mirato ai contenuti visivi, il carico sul processore e sulla memoria risulta sensibilmente inferiore, con conseguente maggiore fluidità generale del dispositivo anche durante l’utilizzo di ChatGPT.

Tuttavia, la scelta di appoggiarsi alle funzioni di Accessibilità non è certo priva di implicazioni. I permessi che vengono qui richiamati sono infatti tra i più approfonditi che un’app possa richiedere su Android, perché permettono di leggere testi, pulsanti e dettagli dell’interfaccia di qualsiasi applicazione aperta. Affidarli a un chatbot basato sull’intelligenza artificiale potrebbe preoccupare gli utenti più attenti alla privacy, che potrebbero chiedersi quali dati vengano effettivamente elaborati e in che modo.

Cosa possiamo aspettarci

Al momento non è chiaro come OpenAI intenda affrontare pubblicamente queste preoccupazioni, né quando la funzione verrà rilasciata ufficialmente. Tuttavia, è certo che la direzione intrapresa dalla società riflette una tendenza sempre più ampia nel settore, e cioè il fatto che i grandi modelli linguistici stanno progressivamente evolvendo da semplici chatbot ad assistenti contestuali, capaci di agire in modo autonomo all’interno dell’ambiente digitale dell’utente.

Vedremo nelle prossime settimane in che modo l’azienda riuscirà a farlo in modo abbastanza trasparente da guadagnarsi la fiducia di chi tiene al controllo dei propri dati.