Google continua a rilasciare numerose novità legate a Gemini. Dopo le molte funzionalità annunciate al Google Cloud Next 25 di Las Vegas, che avevano già mostrato come l’intelligenza artificiale stia trasformando in profondità la suite Workspace, il colosso di Mountain View torna ad aggiornare il proprio ecosistema su due fronti distinti ma complementari. Da un lato, la distribuzione di Gemini Embedding 2 e dall’altro, il lancio di Workspace Intelligence, una nuova funzione pensata per gli ambienti professionali.

Segui TuttoAndroid su Google Discover

Offerta

roborock Qrevo Curv 2 Flow

Offerta + clicca su applica coupon di 50 euro + coupon: TTANDROID5

519€ invece di 899€
-42%

Gemini Embedding 2

gemini-2_embedding_keyword_blog_.width-1600.format-webp

Gemini Embedding 2 nasce con l’obiettivo di fornire a sviluppatori e aziende uno strumento di embedding multimodali nativo per costruire applicazioni più intelligenti. Durante la fase di anteprima erano già emersi prototipi interessanti, dai motori di ricerca per l’e-commerce agli strumenti di analisi video. Ora Google offre la stabilità e le ottimizzazioni necessarie per portare questi progetti in produzione, con la disponibilità generale del modello tramite Gemini API e Vertex AI.

Gemini Embedding 2 è il primo modello di embedding nativamente multimodale (capace di trattare testi, immagini, audio e video come un linguaggio unico) costruito su Gemini. Permette di mappare testo, immagini, video, audio e documenti in un unico spazio vettoriale condiviso, con supporto a oltre cento lingue. Questo significa che una ricerca testuale può restituire risultati video pertinenti anche in assenza di trascrizioni, o che immagini e testi possono essere confrontati direttamente senza passaggi intermedi. Il modello accetta input multimodali e genera vettori da 3.072 dimensioni, mappando semanticamente i contenuti in uno spazio unificato. Questo permette operazioni come la ricerca di un’immagine a partire da una descrizione testuale.

Il modello supporta fino a 8.192 token di contesto per il testo, fino a sei immagini per richiesta in formato PNG e JPEG, fino a 120 secondi di video in MP4 e MOV, audio nativo senza bisogno di trascrizioni intermedie, e documenti PDF fino a sei pagine. Incorpora anche la tecnica Matryoshka Representation Learning, che consente di ridurre le dimensioni dell’output per bilanciare qualità e costi di archiviazione.

Segui Google su Telegram, ricevi news e offerte per primo

Workspace Intelligence

La seconda novità riguarda un aggiornamento più orientato agli utenti professionali. Google ha annunciato Workspace Intelligence, una funzione che connette automaticamente e-mail, documenti, chat aziendali e app di terze parti (come Salesforce e Jira), permettendo a Gemini di rispondere a domande che coinvolgono più strumenti e di tenere conto del contesto specifico di ogni organizzazione. L’obiettivo dichiarato è quello di dotare Gemini di quella che viene descritta come una sorta di memoria istituzionale, ossia la capacità di comprendere la storia, il contesto dei progetti e il registro professionale tipici di una specifica realtà lavorativa.

Tra le funzioni concrete già annunciate c’è una nuova riga di comando in Google Chat, che consente di interagire direttamente con Gemini all’interno delle conversazioni con i colleghi. L’assistente è in grado di fornire un riepilogo giornaliero delle attività urgenti e di pianificare riunioni individuando autonomamente gli orari disponibili e inviando gli inviti. In Google Fogli sarà possibile creare tabelle complesse tramite istruzioni in linguaggio naturale, con Gemini che attinge ai contenuti delle e-mail e al web per inserire i dati. In Google Documenti e Presentazioni viene introdotta la possibilità di generare documenti completi con una singola istruzione. Basta infatti indicare a Gemini una cartella di progetto perché produca autonomamente una presentazione già strutturata e formattata secondo i modelli visivi in uso nell’organizzazione.

Workspace-Intelligence-gemini-in-docs-1000w-664h

Sul piano della sicurezza, Google segnala che i dati aziendali non vengono utilizzati per addestrare i modelli pubblici e che nessun contenuto risulta accessibile a terzi senza esplicita autorizzazione. È prevista la possibilità di cifratura lato client, con le chiavi di accesso nelle mani dell’organizzazione stessa. Il rilascio è previsto negli Stati Uniti, nell’Unione Europea e successivamente in India e Germania.