Xiaomi è al primo posto nel mondo per il ragionamento audio dell’intelligenza artificiale

Xiaomi ha raggiunto una svolta nel campo dell’intelligenza artificiale e il suo team Big Model è all’avanguardia nella tecnologia di ragionamento audio. In un’impresa straordinaria che dimostra la crescente abilità dell’azienda nella ricerca di frontiera sull’intelligenza artificiale, l’ultimo modello di Xiaomi ha superato giganti del settore come OpenAI e Google in un importante parametro di comprensione audio.

Il team ha annunciato, tramite l’account ufficiale di Xiaomi Technology, di aver superato il famoso MMAU (Massive Multi-Task Audio Understanding and Reasoning). Il loro modello ha raggiunto un’accuratezza record del 64,5%, superando in modo significativo GPT-4o di OpenAI (57,3%) e Gemini 2.0 Flash di Google (55,6%).

Approccio rivoluzionario all’apprendimento per rinforzo

L’aspetto particolarmente degno di nota di questo risultato è la velocità con cui è stato realizzato. Seguendo l’esempio di DeepSeek-R1, i ricercatori di Xiaomi hanno esteso gli algoritmi di apprendimento per rinforzo a compiti di comprensione dell’audio multimodale e lo hanno realizzato nell’arco di una settimana.

Gli scienziati hanno applicato il metodo Group Relative Policy Optimization (GRPO) che consente ai modelli di intelligenza artificiale di apprendere in modo indipendente attraverso un meccanismo di “prova ed errore-ricompensa”. Questo meccanismo permette di creare capacità di ragionamento simili alla riflessione umana e alla verifica in più fasi.

Il dottor Zhang Wei, ricercatore capo del progetto, aggiunge: “L’apprendimento per rinforzo è particolarmente adatto a gestire un grande divario tra la generazione e la verifica dei risultati. Il ragionamento audio è proprio un compito di questo tipo, in cui il pensiero attivo crea risultati più efficienti rispetto alla memorizzazione di schemi”.

Molto di più del puro riconoscimento del suono

Le applicazioni di intelligenza artificiale oggi richiedono molto di più del semplice riconoscimento del suono. La scoperta di Xiaomi consente all’intelligenza artificiale di:

  • determinare potenziali guasti in un veicolo analizzando le registrazioni della cabina di guida
  • dedurre lo stato d’animo di un compositore ascoltando le esecuzioni musicali
  • Anticipare i rischi di collisione in luoghi affollati come le stazioni della metropolitana

Il set di test MMAU utilizza 10.000 clip audio, dal parlato ai suoni ambientali alla musica, con coppie di domande e risposte annotate dall’uomo per testare il modello su 27 abilità.

Sconvolgere gli approcci tradizionali all’intelligenza artificiale

Gli esperimenti di Xiaomi hanno prodotto alcuni risultati sorprendenti che sfidano la saggezza convenzionale dello sviluppo dell’intelligenza artificiale:

  • L’apprendimento per rinforzo ha superato in modo significativo l’apprendimento supervisionato su un set di dati di soli 38.000 elementi.
  • Il loro modello a 7B parametri ha dimostrato una capacità di ragionamento superiore nonostante sia molto più piccolo di altri modelli concorrenti con più di 100B parametri
  • Forzare il modello a generare processi di ragionamento espliciti ha infatti ridotto le prestazioni del 3,4%.

Sebbene l’accuratezza del 64,5% sia elevata, è comunque inferiore al benchmark dell’82,23% degli esperti umani, il che indica che c’è ancora molto margine di miglioramento.

Impegno Open-Source

Fedele alla filosofia di Xiaomi di innovazione per tutti, l’azienda ha reso open-source sia il codice di addestramento che i parametri del modello. Con questo atto di altruismo, l’azienda permette a sviluppatori e ricercatori di tutto il mondo di sviluppare la sua innovazione.

“Aprendo i nostri sforzi alla comunità globale dell’intelligenza artificiale, miriamo ad accelerare il processo verso una vera comprensione intelligente dell’audio”, ha dichiarato Lei Jun, fondatore e CEO di Xiaomi. “Questo è un ulteriore passo avanti nella nostra missione di rendere la tecnologia innovativa accessibile a tutti”.

Per chi è interessato a sperimentare questa tecnologia:

Questa scoperta arriva mentre Xiaomi sta introducendo funzioni di intelligenza artificiale in tutta la sua linea di prodotti, dagli smartphone ai prodotti IoT per la casa intelligente, e sta rendendo l’azienda un serio concorrente nell’arena globale della ricerca sull’intelligenza artificiale.

Fonte: IT Home

Play Store icon
HyperOS Downloader Easily check if your phone is eligible for HyperOS 2.0 update!
Download icon

Lascia un commento

Sondaggio
Which name did you like better, MIUI or HyperOS?