L’integrazione di Gemini all’interno delle automobili è soltanto all’inizio, ma Google sembra avere già le idee piuttosto chiare su quale potrebbe essere la prossima evoluzione del proprio assistente basato sull’intelligenza artificiale. Nel corso di una recente dimostrazione infatti, l’azienda ha mostrato una nuova funzionalità sperimentale che consentirà a Gemini di osservare temporaneamente ciò che si trova davanti all’auto attraverso la fotocamera frontale e rispondere alle domande degli occupanti in base a ciò che vede.
Si tratta di un’estensione delle capacità multimodali che molti utenti hanno già imparato a conoscere sugli smartphone Android grazie a Gemini Live, ma adattata all’esperienza di bordo. L’obbiettivo non è sostituire i tradizionali sistemi di navigazione, bensì offrire un assistente capace di comprendere il contesto circostante e fornire informazioni in tempo reale su edifici, monumenti, segnali stradali e molto altro.
Segui TuttoAndroid su Google Discover
Gemini sarà in grado di utilizzare la fotocamera frontale dell’auto
La dimostrazione è stata realizzata da Sameer Samat, presidente della divisione Android di Google, durante una conversazione con Logan Kilpatrick di Google AI Studio; per l’occasione è stata utilizzata una Volvo EX60, modello non ancora commercializzato che integra la piattaforma Google Built-in con Gemini.
Il funzionamento ricorda molto quello della modalità fotocamera di Gemini Live disponibile sui dispositivi Android, in questo caso però, invece di utilizzare la fotocamera dello smartphone, è quella frontale del veicolo a diventare gli occhi dell’assistente.
Secondo quanto spiegato da Samat, Gemini non osserva costantemente l’ambiente circostante, la fotocamera viene attivata esclusivamente quando l’utente richiama l’assistente e pone una domanda relativa a ciò che si trova davanti al veicolo; una volta elaborata la richiesta e fornita la risposta, il sistema interrompe nuovamente l’accesso al flusso video.
Si tratta di una precisazione importante, considerando che uno degli aspetti più delicati di una funzionalità di questo tipo riguarda inevitabilmente la tutela della privacy degli utenti.
Durante la dimostrazione Google ha mostrato alcune delle potenzialità offerte da questo nuovo approccio. Sameer Samat ha chiesto a Gemini di identificare alcuni punti di interesse presenti nei pressi del campus di Google a Mountain View e il modello è riuscito a riconoscere correttamente diversi elementi visibili attraverso il parabrezza, tra cui l’installazione artistica The Orb, il tetto solare Gradient Canopy e persino lo Shoreline Amphitheater, fornendo anche alcune informazioni sulla sua storia e sulle caratteristiche architettoniche.
L’assistente non si limita quindi a descrivere ciò che vede, ma sfrutta le conoscenze già acquisite dal modello Gemini per contestualizzare gli elementi presenti nell’inquadratura e offrire risposte più complete.
Nel corso della demo è stato possibile notare anche un leggero ritardo nell’elaborazione delle richieste. Prima di rispondere infatti, Gemini deve ricevere temporaneamente il flusso video proveniente dalla fotocamera del veicolo, analizzarlo e solo successivamente generare la risposta vocale; a differenza di quanto accade su smartphone con Gemini Live inoltre, sul display dell’infotainment non viene mostrata un’anteprima dell’immagine analizzata.
Per il momento Google non ha condiviso dettagli su un possibile rilascio pubblico della funzionalità né ha indicato quando potrà arrivare su altri veicoli dotati di Google Built-in. La dimostrazione lascia comunque intuire la direzione intrapresa dall’azienda, in futuro Gemini potrebbe diventare un vero assistente contestuale durante la guida, capace di rispondere a domande basandosi non soltanto sulla posizione GPS o sui dati di navigazione, ma anche su ciò che l’automobile sta realmente osservando in quel preciso momento.
Tra gli esempi citati da Sameer Samat figura anche uno scenario particolarmente interessante per chi viaggia all’estero: l’assistente potrebbe utilizzare la fotocamera dell’auto per interpretare cartelli e segnali stradali scritti in una lingua straniera, spiegandone il significato direttamente attraverso una risposta vocale.
Al momento si tratta ancora di una funzionalità sperimentale e Google ha confermato di essere al lavoro per capire quale sia il modo migliore per integrarla nell’esperienza di bordo. Se questa tecnologia dovesse arrivare sui futuri modelli dotati di Google Built-in, potrebbe però rappresentare uno dei passi più importanti nell’evoluzione di Gemini all’interno dell’automobile, trasformando l’assistente in un sistema capace non solo di ascoltare e parlare, ma anche di comprendere il mondo che circonda il veicolo.
- Google migliora Gemini Spark con più integrazioni e una funzione smart
- Si fa vedere anche Keep Live: ecco l’integrazione di Gemini Live in Google Keep
- Accesso alle chat recenti direttamente dall’overlay e tanto altro: le ultime su Gemini
- Google testa la ricerca vocale con Gemini nelle email con Gmail Live


