Un software di riconoscimento vocale capace di riconoscere le parole in una conversazione con un grado di accuratezza quasi umano: è il risultato ottenuto da Microsoft, che ha annunciato sul suo blog ufficiale il suo passo in avanti nello sviluppo di intelligenze artificiali.
Il risultato è raggiunto tramite il test di riconoscimento vocale Switchboard, che ha ottenuto il 5,9% di margine di errore, lo stesso che si ottiene dagli esseri umani, il punteggio più basso mai ottenuto da un sistema artificiale in questo test. Per raggiungere questo traguardo, il colosso di Redmond ha sfruttato una tecnologia che impiega modelli di linguaggio neurale che raggruppano parole simili tra loro.
I ricercatori dello studio lo definiscono un “traguardo storico” perché per la prima volta un sistema informatico riesce quasi ad eguagliare l’uomo nel riconoscimento vocale, un progresso che Microsoft utilizzerà per il suo assistente vocale Cortana, ma non solo. Questa nuova tecnologia sarà utile al perfezionamento di tutti i programmi o applicazioni di dettatura vocale: attualmente questi sistemi captano il suono della nostra voce come onde sonore gli algoritmi che li animano traducono questi suoni in parole legate tra loro da una sintassi.
Tuttavia Microsoft ha precisato che sono ancora lontani dalla perfezione, poiché gli algoritmi appena creati possono ancora confondersi in alcune occasioni, ad esempio se è presente un rumore di fondo in grado di interferire nella conversazione, proprio come gli esseri umani.
I ricercatori sono già all’opera per migliorare il software affinché sia in grado non soltanto di captare i comandi e le loro variazioni, ma di comprendere realmente il significato delle parole per poter eseguire specifici comandi senza il bisogno di ascoltare frasi formulate ad hoc.