Microsoftovo istraživanje otkriva bolje prepoznavanje govora od ljudi

$config[ads_kvadrat] not found

Эволюция звука запуска Windows

Эволюция звука запуска Windows
Anonim

Microsoft je postao prva tvrtka na svijetu koja je razvila softver za prepoznavanje govora koji je točniji od ljudi. U članku „Postizanje ljudskog pariteta u razgovoru u prepoznavanju govora“ objavljenom u ponedjeljak, softver je proizveo transkripte koji su sadržavali pola posto manje pogrešaka nego ljudski napori, što je nevjerojatno s obzirom na to koliko su ljudi dobri u razumijevanju govora. Proboj otvara vrata za nova A.I. pomoćnici koji su točniji nego ikada prije.

Impresivno je koliko je tehnologija stigla u tako kratkom vremenu. Nedavno je bilo prepoznavanje kompjuterskog govora čudna niša koja se činila beznadno udaljenom. Pogledajte ovu demonstraciju govornog softvera sustava Windows Vista iz 2006. godine:

Tim je koristio test Nacionalnog instituta za standarde i tehnologiju (NIST) 2000, koji je korišten u cijeloj industriji za mjerenje pouzdanosti transkripcije govora. Razgovor se odvija između dva sudionika preko telefona, prije okretanja, prije uspoređivanja rezultirajuće skripte i provjere pravopisa s rječnikom.

U dijelu centrale, gdje dva stranca prvi put govore, stopa ljudske pogreške je oko 5,9 posto, dok je na dijelu za poziv na kućnu adresu, gdje dvije osobe koje se poznaju, stopa pogreške iznosi oko 11,3 posto. Microsoftov softver postigao je oko 0,4 posto nižu stopu pogreške.

U kolovozu, učenik Joshua Browder uzeo je obloge iz svog DoNotPay chat-a, koji može pomoći beskućnicima da dobiju besplatne pravne savjete. U kombinaciji s napredovanjem prepoznavanja, lako je zamisliti budućnost u kojoj ljudi od virtualnog asistenta traže pomoć za stanovanje tako da redovito razgovaraju s računalom.

U ovoj fazi istraživači razmišljaju o tome kako prepoznavanje govora s pogonom na A.I. može dati pametnije odgovore. Sensay, gnjev koji otkriva A.I. iz laboratorija iza tvrtke Siri, koristi napredne mogućnosti prepoznavanja da bi otkrio osjećaj ljutnje ili zbunjenosti korisnika, mijenjajući svoje odgovore kako bi odgovarao situaciji. Uklanjanje barijere prepoznavanja glasa sklone pogreškama, stvara uzbudljive nove mogućnosti za virtualnu pomoć.

$config[ads_kvadrat] not found