Google Gemini ora supporta il caricamento di file audio nell'app e sul web

Google continua ad ampliare le funzionalità di Gemini, e questa volta tocca all’audio. Dopo il supporto a immagini, documenti e video, il chatbot AI, ormai pilastro dell’ecosistema del colosso di Mountain View, introduce ora la possibilità di caricare file audio direttamente da smartphone o browser, una novità molto richiesta dagli utenti e che, inevitabilmente, apre la strada a nuovi casi d’uso.

Segui Google Italia su Telegram, ricevi news e offerte per primo

Offerta

Motorola edge 60, 8/256 GB

50+50+10MP, 6.67'' pOLED 120Hz, Batteria 5200mAh, ricarica 68W, Android 15

244.3€ invece di 379€

-36%

Amazon

Come funziona il caricamento di file audio in Gemini

La funzione è già disponibile su Android, iOS e web. Come potete notare dalle nostre schermate, basterà aprire il menu contrassegnato dal “+” e cliccare su “File” da mobile, oppure “Carica file” su desktop, e selezionare un file nei formati supportati (MP3, M4A, WAV, ecc.). Gemini sarà in grado di riconoscere il file audio e il suo contenuto senza problemi.

Google sottolinea che i limiti di lunghezza del file audio variano in base al piano sottoscritto:

Utenti free: fino a 10 minuti di audio per file.
Abbonati ai piani Pro e Ultra: fino a 3 ore di contenuti audio caricabili in un’unica soluzione.

Un aspetto interessante è che Gemini permette di gestire l’audio come qualsiasi altro file caricato: analisi, trascrizione automatica, riassunto e perfino estrazione di insight da conversazioni o registrazioni. Una funzione che si aggiunge al supporto già esistente per i video, con limiti differenti (5 minuti free, fino a 1 ora per abbonati, max 2 GB).

Non solo audio: tutti i limiti aggiornati per i file in Gemini

In occasione dell’annuncio di questa novità, Google ne ha approfittato per riepilogare anche le specifiche e i limiti per gli altri formati:

File generici: fino a 100 MB l’uno, con un massimo di 10 file per chat.
Video: max 5 minuti free, 1 ora Pro/Ultra, fino a 2 GB.
Cartelle di codice o repository GitHub: fino a 5.000 file, per un totale di 100 MB.
File ZIP: massimo 10 elementi per archivio.

In pratica, Gemini si conferma sempre di più come una piattaforma “aperta” a qualsiasi tipo di input, con vincoli flessibili per chi usa la versione gratuita e margini molto più ampi per chi sceglie gli abbonamenti.

La possibilità di caricare registrazioni vocali, interviste, lezioni o meeting rappresenta un salto in avanti nell’utilità concreta dell’app. Se fino a oggi Gemini era spesso visto come un assistente per testo, immagini e codice, ora diventa anche un trascrittore e analista di contenuti audio.

Google ha anche sottolineato che questa era la richiesta più popolare arrivata dagli utenti negli ultimi mesi: un segnale di quanto l’audio sia ormai centrale nella creazione e gestione dei contenuti sia ricreativi che professionali.

Gemini diventa sempre più un hub universale

Con l’arrivo del supporto agli audio, Gemini completa un tassello importante della sua strategia infatti adesso permette agli utenti di interagire con qualsiasi tipo di file senza uscire dall’app. Dunque, non solo più testi e prompt, ma anche documenti, immagini, video e ora file audio.

L’intento di quello è di trasformare Gemini da semplice chatbot a strumento di produttività e analisi universale di ogni tipo di file in grado di diventare un punto di riferimento per ogni tipo di utente.

Potrebbero interessarti: