DeepMind A.I. Mostovi između robota i ljudskih glasova

$config[ads_kvadrat] not found

Google's DeepMind AI Just Taught Itself To Walk

Google's DeepMind AI Just Taught Itself To Walk
Anonim

Umjetna inteligencija samo je učinila da glasovi robota zvuče mnogo realističnije.

DeepMind, koji je ranije demonstrirao moć A.I. premlaćivanjem ljudskog igrača na Go u ožujku i rezanjem računa za napajanje za polovicu u srpnju, sada je fokusiran na sintezu govora.

Istraživačka skupina A.I, koja je dio Googleove matične tvrtke Alphabet, otkrila je jutros da je stvorila novu tehnologiju zvanu WaveNet koja se može koristiti za generiranje govora, glazbe i drugih zvukova točnije nego prije.

DeepMind objašnjava da se mnoge postojeće metode sinteze govora oslanjaju na "vrlo veliku bazu kratkih fragmenata govora koji se snimaju iz jednog zvučnika, a zatim rekombiniraju u obliku potpunih izraza." WaveNet, s druge strane, koristi "sirovi valni oblik audio signala". Da biste stvorili realističnije glasove i zvukove.

To znači da WaveNet radi s pojedinačnim zvukovima koji se stvaraju kada čovjek govori umjesto da koristi potpune slogove ili cijele riječi. Ti se zvukovi zatim pokreću kroz “računski skup” proces koji je DeepMind pronašao “bitan za generiranje složenog, realističnog zvuka” sa strojevima.

Rezultat svega tog dodatnog rada je 50-postotno poboljšanje sintetiziranog govora u američkom engleskom i kineskom mandarinskom jeziku. Evo primjera govora generiranog pomoću parametarskog teksta u govor, koji je danas uobičajen, a koristi ga DeepMind da bi pokazao kako nedostaje ova metoda sinteze govora:

Evo primjera iste rečenice koju generira WaveNet:

Kako tvrtke nastavljaju raditi na sučeljima na prirodnom jeziku, pružanje realističnijih odgovora postat će sve važnije. WaveNet može pomoći u rješavanju tog problema.

$config[ads_kvadrat] not found