Dopo settimane di test interni riservati ad una cerchia ristretta di sviluppatori, Google ha avviato il rollout dell’editing delle immagini basato sull’intelligenza artificiale direttamente all’interno dell’app Gemini; si tratta di una novità attesa da molti, che va ad arricchire in modo sostanziale le capacità multimodali dell’assistente potenziato dall’IA, offrendo agli utenti un livello di controllo e personalizzazione delle immagini senza precedenti, il tutto con la semplicità di una richiesta testuale in linguaggio naturale.

Segui Google Italia su Telegram, ricevi news e offerte per primo

Offerte Bomba!

Solo errori di prezzo o sconti incredibili ma verificati!

L’app Google Gemini può ora modificare le vostre immagini

La novità, che Google definisce come un sistema di “modifica intuitiva e multi-step“, consente agli utenti di interagire con le immagini in modo dinamico, caricandole manualmente oppure partendo da una generazione effettuata da Gemini. In entrambi i casi, sarà possibile chiedere modifiche successive, anche multiple, tramite prompt testuali, senza dover ricominciare da capo ogni volta.

Tra gli interventi supportati troviamo la modifica dello sfondo, la sostituzione o l’aggiunta di oggetti, il cambiamento di stile dell’immagine e ritocchi estetici personalizzati (come ad esempio la simulazione di un nuovo colore di capelli su una propria foto).

Uno degli aspetti più interessanti è la capacità del sistema di mantenere il contesto originale dell’immagine, evitando incoerenze tra le modifiche e il soggetto rappresentato; tanto per fare qualche esempio, si può chiedere di aggiungere un cappello a un cane e subito dopo trasformare lo sfondo da un prato erboso ad una spiaggia tropicale, ottenendo un risultato coerente e visivamente integrato.

Ma l’aggiornamento non si ferma alla sola modifica grafica, Google punta anche sull’arricchimento delle interazioni tra utente e assistente: grazie a Gemini, è ora possibile ottenere risposte testuali accompagnate da immagini generate o modificate al momento, ampliando così l’esperienza conversazionale.

Un esempio pratico? Si può chiedere a Gemini di scrivere una fiaba della buonanotte sui draghi, con tanto di illustrazioni originali da abbinare; oppure, per scopi più concreti, è possibile generare istruzioni visive dettagliate utili ad esempio in ambito educativo, tecnico o creativo.

Come sempre, quando di parla di generazione di immagini basata sull’IA, i temi della sicurezza e della trasparenza sono cruciali, Google ha confermato che tutte le immagini create o modificate attraverso l’editing nativo includeranno la filigrana digitale invisibile SynthID, sviluppata internamente per garantire la tracciabilità dei contenuti generati artificialmente.

Al contempo, l’azienda di Mountain View sta testando anche l’inserimento di una filigrana visibile costituita dalla siglia “AI” racchiusa in una pillola, solitamente posizionata nell’angolo in basso a destra delle immagini; una scelta che punta a una maggiore chiarezza per gli utenti finali, soprattutto in un contesto dove la distinzione tra contenuto reale e generato può risultare sempre più sfumata.

L’implementazione dell’editing nativo delle immagini è già partita e, come spesso accade, avverrà in modo graduale; secondo quando dichiarato dalla stessa Google, nelle prossime settimane la funzionalità verrà estesa ad un numero crescente di utenti, in oltre 45 lingue e nella maggior parte dei Paesi.

Una volta abilitata la funzione sarà disponibile direttamente all’interno dell’interfaccia di Gemini, con un prompt in linea che segnalerà la possibilità di iniziare la modifica; da quel momento, si potrà fare uso di uno qualsiasi dei modelli Gemini attualmente attivi, sfruttando appieno le potenzialità del nuovo sistema di editing multimodale.

Con questo aggiornamento, Google compie un altro passo decisivo verso la creazione di un assistente IA davvero multimodale, capace non solo di comprendere e generare linguaggio naturale, ma anche di interagire con elementi visivi in modo creativo e utile.

Si tratta di un’aggiunta che, senza dubbio, apre le porte a nuovi scenari di utilizzo sia per il pubblico consumer che per i creativi, gli educatori e i professionisti del settore digitale.

Non ci resta quindi che attendere e, nelle prossime settimane, potremmo vedere nuove evoluzioni di questa funzione, magari con l’arrivo di strumenti di editing ancora più avanzati o di nuove integrazioni nei servizi Google.