Izgubljeni u prevodu: Zašto Gugl prevodilac često joruba i druge jezike pogrešno prevodi

Wikimedia korisnička grupa Nigerija, oktobar 2018 via Wikimedia Commons CC.BY.2.0.

Engleski jezik dominira onlajn kao univerzalni jezik komunikacija od kako se pojavio internet. Od februara 2020, više od pola internet sajtova su na engleskom, prema WebTech3-u.

Ali sve više ljudi koji govore različite jezike koriste internet i to je dovelo do jezičke digitalne revolucije – mogućnosti direktnog prevođenja na engleski jezik sa različitih jezika pomoću jednog klika.

Mnoge tehnološke kompanije su u poslednje vreme uložile trud u uvođenje reči na internet koje nisu iz engleskog jezika, na taj način praveći put višejezičke digitalizacije. GoogleYoruba Names, Masakhane MTALC su primeri kompanija i startap-ova koje su probale da spoje tehnologiju sa ne-engleskim jezicima.

Krajem februara 2020, Gugl je objavio da će dodati pet novih jezika kao svoje Gugl prevodilac usluge, uključujući kiniarvanda, ujgur, tatarski, turkmen i odia, nakon pauze od 4 godine bez dodavanja novih jezika.

Čovek koji izgleda zbunjeno dok čita tekst sa interneta. Foto Oladimeji Ajegbile, izvor Pixels.

Ali da li ste ikada kliknuli da opciju za prevođenje i shvatili da je engleski prevod u najboljem slučaju samo prihvatljiv? A u najgorem, u potpunosti netačan.

Postoje mnoge kontroverze i poteškoće koje dovode u pitanje ovakav način rada i prevođenja.

Tviter nudi što je više moguće opciju prevođenja ioruba jezika na engleski preko Gugl prevodilaca, i uglavnom, rezultat nije toliko loš – možda je nekoliko reči netačno.

Razlog ovakvih aktivnosti su da tehničke kompanije uglavnom prikupljaju jezičke podatke za engleski prevod preko interneta. Ovakvi podaci se mogu koristiti za neke jezike, ali jezici kao joruba i igbo, dva glavna jezika u Nigeriji, su izazovni, zbog neadekvatnih ili nepreciznih akcenata koji naznačavaju tonove na ovim rečima.

Kao odgovor na to zašto je Guglu bilo potrebno četiri godine da doda pet novih jezika, predstavnik kompanije je objasnio:

 

 Google Translate learns from existing translations found on the web, and when languages don’t have an abundance of web content, it’s been difficult for our system to support them effectively. … However, due to recent advances in our machine learning technology, and active involvement from our Google Translate Community members, we’ve been able to add support for these languages.

Gugl prevodilac koristi prethodne prevode koji se nalaze na internetu i u slučaju da sadržaji nisu zastupljeni na traženom jeziku na internetu, to predstavlja problem za naš uređaj u smislu efikasne podrške.. Međutim zahvaljujući napredovanju naših tehnologija učenja u poslednje vreme i aktivnom učešću naših članova Gugl prevodioca, mi smo u mogućnosti da pomognemo u prevodima na tim jezicima.

Takođe, većina ljudi nisu vešti sa prevopisom ili spelovanjem u ovim jezicima. Kao rezultat, vode se kao dobri prevodi, jer ove greške nisu ozanačene kao neadekvatne.

Većina prevoda koje vrše mašine ispišu neke reči pogrešno, pogotovo reči koje su specifične za tu kulturu. Na primer, joruba reči ayaba i obabìnrin imaju samo značenje kada se koriste u duhu jezika. Većina mašina ih prevode oba kao “kraljica”. Ali, u izvornom značenju neophodno je istaći da su značenja ayaba i obabìnrin različiti: Ọbabìnrin ima značenje “kraljica” na engleskom dok je ayaba “žena kralja”.

Čak i sa ovim poteškoćama u prevođenju, tehnologija je dovela do napredka afričkih jezika u oblastima digitalizacije, tako što je podsticala pravljenje novih kovanica. Jezici u Africi su se obogatili pristizanjem novih tehničkih izraza, tipa pametni telefoni i tableti, kao nove reči koje su nastale sa namerom da se imenuju novi tehnički alati i koncepti. Na ovaj način se proširilo korišćenje i funkcionalnost ovih jezika.

Pojavljivanjem novih tehnologija, rečnik mnogih afričkih jezika je postao bogatiji. Na primer, joruba jezik ima neke izraze na koje je uticala tehnologija kao erọ amúlétutù (“klima uređaj”), erọ Ìbánisọ̀rọ̀ (“telefon”) i erọ Ìlọta (“brusilica”). Slično, igbo jezik sadrži reči tipa ekwè nti (“telefon”) and ugbọ̀ àlà (“vozilo”). Ove zajednice su dale naziv ovim rečima prema ulozi koju imaju.

Na predavanjima o emitovanju i reklamama na joruba jeziku, učenici uče da većina ljudi televizor naziva erọ Amóhùnmáwòrán. Ova kovanica stvara mnoga pitanja i polemike. Neki učenici smatraju da se video kamera i audio snimač mogu takođe nazivati erọ amóhùnmáwòrán po njihovim funkcionalnostima.

Ovi jezički izazovi u tehnologiji su korisni za jezike. Oni podstiču kritičko razmišljanje u smislu jezičkog i tehničkog napredka.

U 2019, Gugl  je otvorio prvi AI istraživački centar u Akri, Gana, sa ciljem da unapredi “Sposobnost Gugl prevodilac da preciznije prevedi afričke jezike”, prema CNN-u. Istraživač Mustafa Kise, koji na čelu Gugl AI u Africi, veruje da “kontinent sa više od 2000 dijalekata zaslužuje veću pažnju”, prema izveštaju CNN-a.

Mozila i BMZ su nedavno objavili kooperaciju sa ciljem da prošire govornu tehnologiju u afričkim jezicima. Ovakve inicijative će doprineti studiranju na jezicima afričkog govornog područija.

Započnite razgovor

Molimo Vas da se Prijavite se »

Pravila korišćenja

  • Svi komentari se pregledaju. Pošaljite komentar samo jednom jer bi u suprotnom mogao biti prepoznat kao spam.
  • Molimo Vas da se prema drugima odnosite sa poštovanjem. Komentari koji sadrže govor mržnje, nepristojne izreke i lične uvrede neće biti objavljeni.