Google lancia Gemini 3.1 Flash Lite, il modello più veloce ed economico della serie

La famiglia Gemini 3 si arricchisce di un nuovo modello. Dopo Gemini 3.1 Pro (il modello per risolvere i compiti più complessi), Google ha annunciato Gemini 3.1 Flash Lite. Si tratta di un nuovo modello di intelligenza artificiale pensato per offrire prestazioni elevate ma costi operativi molto contenuti. Questo modello rappresenta la soluzione più veloce ed economica dell’intera famiglia Gemini di Google. Gemini 3.1 Flash Lite è stato progettato soprattutto per gestire applicazioni che richiedono un numero molto elevato di richieste e tempi di risposta rapidi, un ambito sempre più centrale per chi sviluppa servizi basati sull’intelligenza artificiale.

Segui TuttoAndroid su Google Discover

Offerta

roborock Qrevo Curv 2 Flow

Offerta + clicca su applica coupon di 50 euro + coupon: TTANDROID5

519€ invece di 899€

-42%

Amazon

Le novità di Gemini 3.1 Flash Lite

L’elemento più interessante di Gemini 3.1 Flash Lite riguarda proprio il costo di utilizzo. Google indica un prezzo di 0,25 dollari per un milione di token in ingresso e 1,50 dollari per un milione di token generati in uscita. Si tratta di cifre particolarmente basse rispetto ai modelli più grandi. L’aspetto significativo di questo modello è l’attenzione di Google nel rendere sostenibile l’utilizzo dell’intelligenza artificiale, soprattutto in tutti quegli scenari dove il numero di richieste può diventare molto elevato. Applicazioni come sistemi di moderazione dei contenuti, traduzioni automatiche su larga scala o classificazione dei dati devono infatti gestire enormi quantità di informazioni ogni giorno. E Gemini 3.1 Flash Lite nasce proprio per questo.

Oltre alla dimensione economica, con Gemini 3.1 Flash Lite Google punta anche sulla velocità. Secondo i benchmark citati dal colosso di Mountain View, Gemini 3.1 Flash Lite sarebbe più rapido rispetto a Gemini 2.5 Flash. Il tempo necessario per iniziare a generare la risposta risulta circa due volte e mezzo più veloce, mentre la velocità complessiva di produzione dell’output aumenta del 45%. Una latenza più bassa significa che il modello può essere utilizzato in applicazioni che richiedono risposte quasi immediate, come gli assistenti digitali, i sistemi di automazione o gli strumenti integrati nei servizi online.

https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/MMMU_v2.mp4?_=1

Nonostante il posizionamento economico, Google sottolinea che il nuovo modello mantiene prestazioni competitive anche nei test che misurano capacità di ragionamento e comprensione multimodale. Gemini 3.1 Flash Lite ha ottenuto un punteggio Elo di 1432 nella classifica Arena.ai Leaderboard e risultati elevati in benchmark come GPQA Diamond e MMMU Pro. In alcuni casi, secondo Google, le prestazioni risultano paragonabili o addirittura superiori a quelle di modelli Gemini più grandi appartenenti alle generazioni precedenti.

https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/CategoryGeneration_v4.mp4?_=2

Un’altra caratteristica interessante riguarda la possibilità di controllare il livello di elaborazione del modello. All’interno degli strumenti di sviluppo Google AI Studio e della piattaforma Vertex AI gli sviluppatori possono decidere quanto il sistema debba elaborare un compito prima di generare la risposta. Questo approccio consente di trovare un equilibrio tra velocità, qualità della risposta e costi di calcolo, un aspetto particolarmente importante quando si gestiscono flussi di lavoro con richieste molto frequenti.

Segui Google su Telegram, ricevi news e offerte per primo

Cosa può fare Gemini 3.1 Flash Lite

https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/WeatherDashboard_v5.mp4?_=3

Il modello è pensato per una vasta gamma di applicazioni. Oltre alla traduzione e alla moderazione dei contenuti, Gemini 3.1 Flash Lite può essere utilizzato per analizzare grandi archivi di codice, classificare immagini o generare interfacce e dashboard in modo automatico. Nel presentarlo, Google ha mostrato anche alcuni esempi pratici come la creazione di agenti software per servizi SaaS, la compilazione automatica di cataloghi per gli e-commerce con centinaia di prodotti o la generazione di dashboard meteorologiche aggiornate in tempo reale.

https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/SaasReport_v3.mp4?_=4

Alcune aziende stanno già sperimentando il modello nelle prime fasi di accesso anticipato. Secondo le prime testimonianze, il modello sarebbe in grado di mantenere una buona precisione anche con richieste articolate, pur restando molto efficiente dal punto di vista dei costi.

https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/Photo_sorter_Demo_v2_1_small.mp4?_=5

Gemini 3.1 Flash Lite è già disponibile in anteprima per gli sviluppatori tramite la Gemini API all’interno di Google AI Studio. Le aziende possono invece accedervi attraverso la piattaforma Vertex AI, dove il modello è integrato negli strumenti dedicati allo sviluppo di applicazioni basate sull’intelligenza artificiale.

Seguici su:Google Discover Google, come Fonte PreferitaFacebook YouTube Instagram TikTok