Dopo mesi di attesa Google ha finalmente annunciato la disponibilità di Imagen 4, l’ultima evoluzione della sua tecnologia di conversione testo-immagine, che promette di alzare ulteriormente l’asticella della qualità e della precisione; a partire da questa settimana sviluppatori e creativi potranno testare il nuovo modello sia attraverso l’API Gemini (in anteprima a pagamento), sia in Google AI Studio, dov’è previsto un utilizzo gratuito limitato.

Segui TuttoAndroid su Google Discover

Google lancia due modelli Imagen 4 per soddisfare ogni esigenza creativa

La famiglia Imagen 4 si compone di due versioni distinte, pensate per rispondere a scenari d’uso differenti:

  • Imagen 4 è il modello di riferimento per la maggior parte delle attività di generazione immagini, Google sottolinea che rispetto al precedente Imagen 3 si registrano miglioramenti significativi soprattutto nel rendering del testo all’interno delle immagini, uno degli aspetti più complessi per i generatori IA; il prezzo per ciascuna immagine prodotta con questo modello è fissato a 0,04 dollari
  • Imagen 4 Ultra invece rappresenta la funzione più avanzata e rigorosa, quando è fondamentale che l’output rispecchi in modo quasi letterale le istruzioni del prompt, questa versione garantisce un livello di allineamento superiore e risultati di precisione; in questo caso il prezzo sale a 0,06 dollari per immagine

Google ha precisato che nelle prossime settimane verranno introdotti ulteriori livelli di fatturazione, mentre fin da subito è possibile richiedere limiti tariffari più elevati per progetti con carichi più intensivi.

Uno dei principali punti di forza di Imagen 4 è proprio la capacità di integrare testi leggibili e dettagliati nelle immagini, una criticità che in passato aveva spesso limitato la diffusione dei modelli generativi in contesti editoriali e pubblicitari; nei materiali di anteprima Google ha mostrato esempi emblematici che evidenziano la versatilità del sistema, come un fumetto cosmico a tre vignette con didascalie e scritte sulla console di bordo, una cartolina d’epoca di Kyoto dai colori vivaci e dal gusto retrò, una fotografia realistica di una coppia in cima a una montagna all’alba, o ancora un elaborato scatto di moda su uno sfondo alieno.

Come sempre, l’obbiettivo è fornire uno strumento capace di adattarsi a ogni tipo di progetto, dalla grafica commerciale ai contenuti per i social, passando per l’illustrazione editoriale e la prototipazione di concept creativi.

Per garantire trasparenza a tracciabilità Google ha confermato che tutte le immagini generate con Imagen 4 includeranno la filigrana digitale SynthID, un marcatore non visibile che consente di identificare le creazioni IA senza alterare l’esperienza visiva; questo aspetto si inserisce in una più ampia strategia di responsabilità e tutela dell’autenticità dei contenuti, in un momento storico in cui la produzione generativa sta conoscendo una diffusione senza precedenti.

Gli sviluppatori interessati possono già accedere a Imagen 4 attraverso l’API Gemini, con costi in base al volume di immagini generate, oppure sperimentare in modo limitato e gratuito su Google AI Studio; bisognerà attendere per scoprire se il nuovo modello di Google potrà dare filo da torcere a concorrenti come DALL-E e Midjourney.