Inovaţia va permite, în viitor, traducerea audio instantanee, chiar cu vocea celui care vorbeşte, astfel încât, teoretic, oricine va putea vorbi cu un chinez fără a şti niciun cuvânt chinezesc: tehnologia va face totul.
Noua tehnologie, dezvoltată de Microsoft, duce acurateţea şi viteza traducerii automate la un nivel impresionant.
Rick Rashid, directorul Microsoft Research, a prezentat recent sistemul la un eveniment desfăşurat la Tianjin, China, şi a uimit asistenţa arătând cum acesta nu numai că recunoaşte frazele rostite în engleză şi le afişează în scris, ci le şi poate traduce pe loc şi emite audio, în mandarină (un dialect chinezesc), făcându-le să sune ca şi cînd ar fi rostite de propria sa voce.
Deşi cercetările în domeniul recunoaşterii vocii de către computer durează de 60 de ani, până de curând chiar şi cele mai bune sisteme aveau rate de eroare de 20-25% în ceea ce priveşte recunoaşterea cuvintelor.
Dar Microsoft, în colaborare cu Universitatea din Toronto, Canada, a reuşit, în urmă cu doi ani, un mare progres.
Folosind o tehnologie numită a reţelelor neurale profunde, prin care computerele învaţă într-un mod inspirat din comportamentul creierului uman, cercetătorii au reuşit să determine sistemul să înţeleagă vorbirea cu o acurateţe remarcabilă. Rata erorilor a fost redusă cu peste 30% comparativ cu metodele precedente - însemnând că sistemul greşeşte acum doar un cuvânt din 7 sau 8.
După cum a explicat Rick Rashid, tehnologia funcţionează în două etape.
Întâi, sistemul recunoaşte cuvântul rostit în limba engleză şi găseşte echivalentul lui chinez. În a doua etapă, cea mai dificilă, sistemul trebuie să rearanjeze cuvintele pentru a corespunde ordinii în frază specifice dialectului mandarin; altfel, ar rezulta doar o înşirurire de cuvinte disparate, lipsită de sens.
Remarcabil este şi faptul că fraza este apoi redată imitând vocea utilizatorului; cercetătorii au creat acest sistem combinând datele rezultate din câteva ore de înregistrări audio ale unui vorbitor nativ de mandarină cu caracteristicile vocii lui Rick Rashid, obţinute tot din înregistrări audio (în limba engleză).
Deşi testul a fost făcut doar la un nivel limitat, noua tehnologie promite totuşi să schimbe profund modul în care vom comunica în viitor, ajutându-ne să depăşim mult mai uşor barierele ligvistice.
No comments:
Post a Comment