Google corregge AI Overview, ma cosa insegna il caso delle risposte sui test del fegato?

Google ha deciso di rimuovere alcune risposte automatiche generate dall’intelligenza artificiale. La vicenda, che ha diversi risvolti interessanti, riguarda AI Overview, una delle novità più importanti introdotte da Google nel suo motore di ricerca negli ultimi mesi. Pensata per offrire agli utenti una risposta sintetica direttamente in cima ai risultati, l’IA ha però dimostrato di non essere all’altezza quando si tratta di temi delicati come la salute. Un’indagine giornalistica, infatti, ha evidenziato errori gravi nel modo in cui venivano fornite le informazioni per le ricerche sui test del fegato.

Indice:

Le risposte sbagliate dell’intelligenza artificiale
È davvero tutta colpa dell’AI?

Segui TuttoAndroid su Google Discover

Offerta

roborock Qrevo Curv 2 Flow

Offerta + clicca su applica coupon di 50 euro + coupon: TTANDROID5

519€ invece di 899€

-42%

Amazon

Le risposte sbagliate dell’intelligenza artificiale

A far scattare l’allarme è stata un’inchiesta del quotidiano britannico The Guardian, secondo cui l’intelligenza artificiale di Google suggeriva intervalli standard dei valori per i test epatici senza specificare che questi parametri possono variare sensibilmente in base all’età, al sesso e all’origine etnica della persona. Una semplificazione eccessiva che, secondo diversi esperti citati nel reportage, può portare a conseguenze anche gravi. Chi legge quelle informazioni senza un’adeguata preparazione medica, infatti, potrebbe pensare di essere in salute anche in presenza di segnali d’allarme, rinunciando così a un consulto medico.

In risposta alla segnalazione, Google ha rimosso AI Overview per alcune frasi chiave, come “quali sono i valori normali per i test del fegato”. Un portavoce del colosso di Mountain View ha dichiarato che l’intervento è avvenuto in linea con le politiche interne e che sono state apportate migliorie generali al sistema. L’intervento, però, non sembra aver risolto il problema, in quanto cambiando leggermente i termini utilizzati per la ricerca, per esempio scrivendo “LFT reference range” (l’intervallo di riferimento dei test di funzionalità epatica), l’intelligenza artificiale continua a generare lo stesso tipo di risposta semplificata che è stata rimossa nel caso dell’altra query.

Secondo Vanessa Hebditch della British Liver Trust, questa parziale correzione dimostra che i filtri messi in campo da Google non sono ancora sufficienti. Il fatto che basti modificare una parola per ottenere di nuovo contenuti rischiosi sottolinea i limiti dell’approccio attuale e di un’intelligenza artificiale forse non del tutto intelligente.

Non è la prima volta che AI Overview finisce sotto accusa. In passato, la funzione aveva suscitato critiche non solo per aver inventato delle risposte, ma anche per aver suggerito, per esempio, di aggiungere la colla alla pizza, episodio diventato virale ma che aveva già evidenziato come le risposte generate automaticamente potessero risultare non solo imprecise, ma anche assurde.

Il caso dei test epatici solleva una questione più ampia sul ruolo dell’intelligenza artificiale nella diffusione di contenuti sanitari online. A differenza di altri ambiti, la medicina richiede un’attenzione particolare al contesto, alla storia clinica individuale e a fattori che non possono essere ridotti a una risposta secca. La complessità delle valutazioni mediche non si presta facilmente a semplificazioni, e gli attuali modelli linguistici non sono ancora in grado di gestire con sicurezza questa responsabilità.

Questo episodio è significativo per più di una ragione. Innanzitutto, dimostra che non tutte le query vengono trattate allo stesso modo. Google ha scelto di intervenire soltanto su alcune ricerche, evidentemente considerate più sensibili o potenzialmente pericolose di altre. Questa selettività solleva interrogativi sul criterio con cui vengono stabilite le priorità ma riflette anche l’attenzione che la società moderna attribuisce all’ambito della salute fisica rispetto ad altri valori ed elementi che per alcuni potrebbero essere altrettanto (se non più) importanti e meritevoli della stessa tempestività d’intervento.

È altrettanto interessante che questo episodio che coinvolge Google sia emerso mentre OpenAI ha lanciato ChatGPT Health, la versione destinata proprio a comprendere meglio le informazioni mediche. Quello che emerge è l’attenzione verso il settore della salute sul quale i colossi tecnologici (anche nell’ambito dei dispositivi wearable) stanno investendo e puntando molto.

Segui Google su Telegram, ricevi news e offerte per primo

È davvero tutta colpa dell’AI?

Va, però, anche detto che gli errori di AI Overview non possono essere il capro espiatorio di un fenomeno che è probabilmente conseguenza anche di un certo analfabetismo digitale. In preda, come siamo, alla tendenza ad affidare tutto alla tecnologia, non riusciamo più a distinguere cosa può essere elaborato e valutato con un algoritmo e cosa no. Anche perché per interpretare un referto medico o un test di laboratorio facendo esclusivo riferimento ai valori numerici, non serve l’intelligenza artificiale. Si può adottare questo approccio anche solo con il motore di ricerca o con un manuale di medicina.

Se è vero che dall’intelligenza artificiale ci si aspetta di più, è altrettanto vero che un’evoluzione andrebbe prevista anche dal punto di vista della formazione nell’uso di queste tecnologie. Non molti mesi fa l’intervento del Garante per la Privacy ha posto l’attenzione sul rischio dell’uso scorretto dell’AI per i referti medici e se da un lato è giusto pretendere che Google e le altre big tech si assumano le loro responsabilità in termini di accuratezza e affidabilità, dall’altro non si può ignorare che l’utente ha un ruolo attivo nel modo in cui interpreta e utilizza queste tecnologie. Senza sminuire le criticità emerse dalle risposte di AI Overview, forse è il caso di guardare più la luna e non il dito.

Seguici su:Google Discover Google, come Fonte PreferitaFacebook YouTube Instagram TikTok