A metà del mese di novembre, Google ha presentato Gemini 3, il modello di intelligenza artificiale di nuova generazione con “volontà agentiche”, definito come il più potente, versatile, affidabile e sicuro. Se sul discorso “potenza” ci sono i benchmark a dare ragione al colosso di Mountain View, sui discorsi “affidabilità” e “sicurezza” emergono già le prime criticità.
Aim Intelligence, un team sudcoreano specializzato in sicurezza informatica che testa i sistemi di intelligenza artificiale in cerca dei loro punti deboli, ha dimostrato che per far breccia all’interno del modello Gemini 3 Pro, aggirando i suoi limiti etici, siano sufficienti cinque minuti.
Segui TuttoAndroid su Google Discover
Offerte Amazon Prime Day, scopri quando!
Iscrivi ad Amazon Prime per poter approfittare delle offerte Prime Day, i primi 30 giorni sono gratis!
Gemini è stato “violato” in appena cinque minuti
Come riportato dal quotidiano sudcoreano Maeil Business, i ricercatori del team di sicurezza informatica Aim Intelligence sono riusciti a violare il modello Gemini 3 Pro di Google in appena cinque minuti.
Una volta ottenute le “chiavi” del sistema e aggirati i limiti etici, i ricercatori hanno chiesto al modello di fornire istruzioni per la produzione del virus del vaiolo e il modello ha risposto rapidamente, fornendo passaggi dettagliati e tutto sommato replicabili.
Addirittura, alla richiesta di realizzare una presentazione satirica sulla propria debolezza dal punto di vista della sicurezza, il modello ha generato quanto richiesto, con una presentazione intitolata “Excused Stupid Gemini 3”.
Andando oltre, sfruttando gli strumenti di programmazione disponibili nel modello, il team ha chiesto di creare un sito Web con istruzioni per la produzione di gas tossici ed esplosivi artigianali. Anche in questo caso, si tratta di tematiche che il modello non dovrebbe affrontare. Il risultato, però, è stato ben diverso: ancora una volta, Gemini ha svolto il lavoro, ignorando i suoi stessi vincoli in termini di sicurezza.
Non è un problema solo del modello targato Google
Sebbene il protagonista di questo test sia Gemini, il problema sembra riguardare tutti i modelli più recenti che stanno diventando sempre più avanzati e con un ritmo di crescita sempre più serrato che le misure di sicurezza, semplicemente, non corrono abbastanza veloci.
I modelli più recenti non si limitano a rispondere ma “ragionano” e puntano ad eludere il rilevamento: Gemini 3, ad esempio, può sfruttare strategie di bypass e prompt di occultamento, riducendo ulteriormente l’efficacia delle misure di sicurezza.
Mettendo nel mix un pizzico di inaffidabilità sulle risposte fornite dai chatbot (e questa, assieme alle “allucinazioni” è una delle problematiche di più lungo corso delle IA che vivono quasi in una realtà “parallela”), la pericolosità aumente ulteriormente.
Il problema non è nell’interazione “normale” fatta delle persone comuni. Il problema si presenta quando è un malintenzionato a mettere le mani su strumenti così potenti che sono in grado di fare praticamente qualsiasi cosa, ignorando le norme di sicurezza e fornendo risposte che, al contrario, dovrebbero bloccare.
A questo punto Google avrà sicuramente molto da fare per mettere in sicurezza un modello che sembra essere più potente di GPT-5 ma poco solido in termini proprio di sicurezza/pericolosità. Alla fine, è come se Big G abbia messo un missile balistico nelle mani degli utenti, pronto a colpire se programmato nel giusto modo.
