Microsoftov tim koji se bavi prepoznavanjem govora dosegnuo je jedan vrlo simboličan cilj. Sada uz pomoć njihovog rješenja sustav jednako dobro sluša što ljudi govore kao i sami ljudi. Konkretno, njihov softver sada ima stupanj pogreške slušanja riječi od 5,9 posto što je jednako kao kod osoba koje se profesionalno bave bilježenjem izgovorenog teksta. Čak ni ti ljudi ne čuju sve, no rezultat od 94 posto zabilježenih riječi je, zapravo, jako dobar.

Jedan od članova Microsoftovog razvojnog tima Geoffrey Zweig na kompanijinom blog postu je istaknuo kako je ovaj rezultat kulminacija 20-godišnjeg rada i napora. Prepoznavanje govora doista jest zadatak kojeg mnogi pokušavaju riješiti već desetljećima i to bez prevelikog uspjeha. Microsoftovo postignuće su, nakon godina relativno slabog napredovanja, omogućile neuralne mreže i strojno učenje.

U objavljenom znanstvenom radu stoji kako je postignuti napredak rezultat opreznog rada i optimizacije neuralnih mreža te da razvijeni akustični modeli imaju mogućnost obuhvata velikog broja akustičkih konteksta. Tim je koristio Microsoftov open source Computational Network Toolkit, a zasad nije poznato kada će se naći u uporabi u komercijalnim proizvodima.

Ovo je uistinu jako velik napredak pošto računalni sustavi, primjerice, ne mogu razaznavati riječi poput nas u bučnoj okolini, a i s raznim naglascima nerijetko imaju većih poteškoća. Stoga treba čestitati Microsoftovom timu na ovom postignuću. Računala su od početka zamišljena kako bi bila učinkovitija od ljudi u određenim zadacima. Čini se kako sada na tu listu možemo dodati još jednu stvar u kojoj su nas sustigla.

Ictbusiness.info