Xiaomi ha appena svelato un importante passo avanti nel campo dell’intelligenza artificiale conversazionale con il lancio di MiDashengLM-7B, un modello linguistico avanzato progettato specificamente per migliorare l’interazione vocale attraverso l’intero set di dispositivi dell’azienda.

Offerta

Google Pixel 10 Pro XL, 512GB

Offerta + sconto automatico di 100€ al check-out (in fase di pagamento)

979€ invece di 1429€
-31%

Un approccio innovativo all’AI multimodale

Per comprendere quali siano le novità della soluzione di Xiaomi, si può cominciare indicando i motivi per cui la società ritiene che sia un significativo salto qualitativo nella comprensione del linguaggio naturale e nel riconoscimento audio.

In particolare, Xiaomi ricorda che MiDashengLM-7B è stato sviluppato internamente con l’obiettivo di ottimizzare le funzionalità vocali su tre fronti principali: i veicoli elettrici, i dispositivi mobili e la smart home. Ne deriva che si tratta di un modello particolarmente versatile, in grado di prestarsi fin da subito a numerose applicazioni dentro e fuori le quattro mura.

Non solo. Ciò che rende piuttosto interessante questo progetto è la filosofia open-source adottata da Xiaomi, una scelta inusuale per un’azienda quotata in Borsa. Evidentemente, la scelta di rendere pubblico il codice sorgente sta confermando la volontà dell’azienda di contribuire attivamente alla comunità di sviluppatori AI e di accelerare l’innovazione nel settore, senza compromettere il ruolo di rilievo già acquisito.

Segui Xiaomi Italia su Telegram, ricevi news e offerte per primo

Su quale architettura si basa il modello

Il modello si basa su un’architettura che combina la tecnologia proprietaria Xiaomi Dasheng con Qwen2.5-Omni-7B Thinker, fusione che ha consentito di creare un sistema oggi in grado di elaborare simultaneamente voce umana, suoni ambientali e contenuti musicali attraverso una strategia di addestramento unificata.

L’utilizzo di dataset pubblici per l’addestramento ha inoltre garantito la realizzazione di una base solida e diversificata, permettendo così al modello di raggiungere prestazioni eccezionali in termini di velocità di elaborazione e riduzione della latenza. Secondo Xiaomi, i miglioramenti si dovrebbero subito tradurre in un’esperienza utente più fluida e reattiva.

Risultati da record nei test di settore

I risultati ottenuti da MiDashengLM-7B nei benchmark pubblici sono di particolare rilievo: il modello, precisa Xiaomi, ha stabilito nuovi record in 22 diversi dataset di valutazione nell’ambito dell’AI multimodale, una performance che conferma la superiorità tecnica della soluzione dell’azienda cinese rispetto alle alternative attualmente disponibili sul mercato.

La capacità di elaborare parallelamente maggiori quantità di dati, unita alla riduzione significativa della latenza, contribuisce pertanto a posizionare Xiaomi come leader nel settore del riconoscimento audio basato su intelligenza artificiale.

Peraltro, nonostante il recente lancio la tecnologia Dasheng è già implementata in diversi prodotti Xiaomi. Nel settore automobilistico, i veicoli elettrici dell’azienda utilizzano il sistema per il riconoscimento di suoni specifici, come la rilevazione di graffi per il monitoraggio della sicurezza esterna del veicolo.

Nell’ambito della domotica, invece, il sistema è capace di interpretare gesti sonori comuni come battiti di mani o schiocchi di dita, permettendo un controllo intuitivo dei dispositivi smart home senza la necessità di comandi vocali espliciti.