Tra le varie novità introdotte dal team di sviluppatori negli smartphone della serie Google Pixel con il Pixel Feature Drop di dicembre vi è anche la funzionalità Speaker Labels, grazie alla quale le potenzialità di Google Recorder sono decisamente aumentate.

Si tratta di una funzionalità che è in grado di riconoscere i diversi interlocutori e che, pertanto, potrebbe rivelarsi molto utile in tutta una serie di situazioni: l’app, infatti, in fase di trascrizione andrà a capo ogni volta che cambia la persona che parla e ciò consentirà agli utenti di seguire meglio la discussione, soprattutto nel caso in cui sia particolarmente lunga.

Ecco come funziona l’ultima novità di Google Recorder

Nelle scorse ore il team del colosso di Mountain View ha pubblicato un post sul blog ufficiale con il quale spiega il motivo per il quale ha introdotto questa funzionalità, che ha come obiettivo principale quello di aiutare gli utenti a capire subito “chi ha detto una determinata cosa”.

La funzionalità Speaker Labels è basata su Turn-to-Diarize, il nuovo sistema di diarizzazione degli interlocutori di Google e sfrutta contemporaneamente 3 componenti:

  • un modello di rilevamento della rotazione dell’interlocutore
  • un modello capace di identificare le caratteristiche della voce di ciascun interlocutore
  • un algoritmo che annota le parole dei vari interlocutori in modo altamente efficiente

Il team di Google ci ha tenuto a precisare che “Il nostro sistema di diarizzazione degli interlocutori sfrutta diversi modelli e algoritmi di apprendimento automatico altamente ottimizzati per consentire la diarizzazione di ore di audio in streaming in tempo reale con risorse computazionali limitate sui dispositivi mobile”.

Google ha reso noto che le registrazioni audio dall’app Google Recorder possono durare “fino a 18 ore” e che più audio significa una maggiore precisione della funzionalità Speaker Labels.

Al momento questa funzionalità è supportata dai Google Pixel 6, Pixel 6 Pro, Pixel 6a, Pixel 7 e Pixel 7 Pro ed è alimentata dai processori Google Tensor di prima e seconda generazione. Il colosso di Mountain View mira a renderla più efficiente dal punto di vista energetico (al momento se il device si surriscalda smette di funzionare) e a introdurre il supporto ad altre lingue.