Zašto A.I. Može se boriti za razumijevanje arapskog

$config[ads_kvadrat] not found

200 rečenica - Arapski jezik - Hrvatski

200 rečenica - Arapski jezik - Hrvatski
Anonim

U svijetu umjetne inteligencije podaci su kralj. Što više imate, vaši alati postaju bolji jer sustavi mogu "naučiti" više o tome što mogu očekivati. Ali ovisno o platformi, A.I. izvlači podatke, neki jezici mogu biti bolje zastupljeni od drugih, tvrdi Miriam Redi, znanstveni istraživač za Yahoo Labs.

"Na primjer, kao što je Flickr, odakle uzimamo naše podatke, neki su jezici vrlo malo zastupljeni", rekao je Redi, govoreći na londonskom samitu za duboko učenje u četvrtak. "Dakle, imamo engleski, milijune slika za engleski, ali imamo možda 100.000 za arapski."

Redijev tim radi na alatu koji može identificirati nevidljive elemente u slikama, kao što su kulturne vrijednosti i emocionalne konotacije. Alat analizira tekst koji je priložen javno dostupnim slikama na usluzi Flickr. Tijekom vremena, A.I. počinje shvaćati zašto netko može označiti sliku "sretna stranka" ili "nezgodan trenutak", ali te će ideje postati sve točnije jer alat analizira više slika.

"Nažalost, točnost detekcije sentimenta na slikama za arapske jezike obično je niža jer nemamo dovoljno podataka", rekao je Redi.

U jezicima koji su imali veće količine podataka, Redijev tim primijetio je nekoliko zanimljivih uzoraka. Romanski jezici poput francuskog i španjolskog izražavali su se na sličan način, dok je talijanski bio jedini jezik na kojem su korisnici identificirali slike s pojmom "utaja poreza".

Jezične barijere i dalje su nešto što je problem za A.I. istraživači. Svatko tko je koristio Google Prevoditelj zna da prebacivanje jezika nikad nije tako jednostavno kao što se čini. Međutim, novi događaji mijenjaju stvari, a Facebook najavljuje ovog ljeta da se približava snu o jednoj jezičnoj društvenoj mreži, koja automatski prevodi tekstove za korisnike.

Razvoj događaja u uklanjanju jezičnih barijera može pomoći u poticanju međunarodne komunikacije, ali za projekte kao što je Redi's, ne postoji stvarna zamjena za podatke o sentimentu koje generira čovjek.

$config[ads_kvadrat] not found