Google ha appena annunciato l’introduzione dell’ennesima potenzialità per la generazione di contenuti multimediali nell’app di Gemini: dopo le Audio Overview, le immagini e i video, l’assistente guadagna la capacità di generare musica (per il momento in beta).

Questa potenzialità, che sapevamo essere in sviluppo già il mese scorso, ruota attorno a Lyria 3, la più recente (e avanzata) versione del modello di IA generativa per la generazione di musica targato Google DeepMind che migliora sensibilmente il modello precedente. Andiamo a scoprire tutti i dettagli.

Segui TuttoAndroid su Google Discover

Offerta

roborock Qrevo Curv 2 Flow

Offerta + clicca su applica coupon di 50 euro + coupon: TTANDROID5

519€ invece di 899€
-42%

Gemini impara a generare musica

Tramite un post dedicato sul blog The Keyword, Google ha annunciato l’implementazione di Lyria 3 nell’app di Gemini che si concretizza attraverso un nuovo strumento che consente di generare musica.

Dal lancio dell’app Gemini, abbiamo creato strumenti per incoraggiare l’espressione creativa attraverso immagini e video. Oggi, facciamo il passo successivo: la generazione di musica personalizzata. Lyria 3, l’ultimo modello di musica generativa di Google DeepMind, è disponibile oggi in versione beta nell’app Gemini. Basta descrivere un’idea o caricare una foto, come “un lento R&B comico su un calzino che trova la sua anima gemella” e in pochi secondi Gemini la tradurrà in una traccia accattivante e di alta qualità. Per spingere ulteriormente la creatività, puoi persino chiedere a Gemini di trarre ispirazione da qualcosa che carichi.

Disponibilità di questa potenzialità nell’app di Gemini

Lyria 3 è disponibile nell’app di Gemini per tutti gli utenti di età pari o superiore ai 18 anni con limitazione per quanto concerne le lingue (ad esempio manca l’italiano): attualmente sono supportate inglese, tedesco, spagnolo, francese, hindi, giapponese, coreano e portoghese. Google fa sapere che in futuro verrà implementato il supporto ad altre lingue.

Il nuovo strumento per generare musica è attualmente disponibile nella versione Web dell’app dell’assistente e arriverà nei prossimi giorni nella versione mobile dell’app.

La funzionalità è “freemium”, ovvero disponibile gratuitamente per tutti. Gli abbonati ai piani premium Google AI Plus, AI Pro e AI Ultra potranno usufruire di limiti più elevati (che crescono progressivamente a seconda dell’abbonamento sottoscritto).

Le potenzialità del modello Lyria 3

Google ha poi raccontato quali sono i tre modi in cui il modello Lyria 3 ha migliorato la qualità dell’audio dai modelli della gamma Lyria:

  1. Gli utenti non devono fornire i testi delle canzoni ma questi verranno generati automaticamente in base a quanto descritto nel prompt
  2. Gli utenti potranno controllare in maniera più fine lo stile, la voce e il tempo della traccia generata
  3. Le tracce generate risultano più realistiche e complesse dal punto di vista musicale.

Come sfruttare questa potenzialità nell’app di Gemini

Per sfruttare l’integrazione di Lyria 3 in Gemini è sufficiente accedere all’app Web dell’assistente (tramite questo link), cliccare sul pulsante per aprire il menù degli Strumenti e selezionare Crea musica (oppure selezionare lo stesso comando direttamente dai suggerimenti presenti sotto alla casella di immissione del prompt testuale).

A quel punto, comparirà il selettore della “traccia da remixare” (contiene svariati generi) e l’utente potrà descrivere liberamente la tipologia di canzone che desidera creare. Terminata la stesura del prompt, partirà il processo di generazione.

La generazione musicale con Lyria 3 è progettata per l’espressione originale, non per imitare artisti esistenti. Se il tuo suggerimento nomina un artista specifico, Gemini lo considererà come un’ispirazione creativa di ampio respiro e creerà una traccia che condivida uno stile o un’atmosfera simile. 

Una volta ultimato il processo di generazione, l’utente potrà ascoltare la traccia generata (lunga massimo 30 secondi), decidere di condividerla o scaricarla. Ogni traccia sarà affiancata da una copertina generata con Nano Banana.

C’è la verifica audio tramite SynthID

Google sottolinea come tutte le tracce audio generate nell’app di Gemini siano dotate del SynthID, la filigrana che identifica i contenuti generati dall’IA di Google.

Inoltre, l’app di Gemini guadagna la capacità di verificare l’audio, oltre alle immagini e i video, per riconoscere se un particolare contenuto sia stato generato con l’ausilio dell’IA generativa.

Per i creatori di contenuti, Lyria 3 sbarca su Dream Track di YouTube

Google ha annunciato, infine, che la versione di Lyria 3 integrata nello strumento Dream Track di YouTube, quella piattaforma sperimentale basata sull’IA generativa che consente ai creator di produrre brevi colonne sonore “originali” per i loro Shorts, è ora disponibile per i creatori di contenuti esterni agli Stati Uniti.