Joan-etorriko itzulpen

Wikipedia, Entziklopedia askea

Joan-etorriko itzulpena itzulpen automatikoko softwarea erabiliz, hitz, esaldi edo testu bat beste hizkuntza batera itzuli (joaneko itzulpena) eta, ondoren, emaitza jatorrizko hizkuntzara itzultzeko prozesua (itzulerako itzulpena) da. Askotan, ezjakinek erabiltzen dute itzulpen automatikoko sistema bat balioztatzeko[1] edo testu bat itzulpen automatikoko softwarerako egokia den egiaztatzeko[2][3], helmugako hizkuntza ezagutzen ez dutenean. Lortutako testua jatorrizkoaren oso bestelakoa izan daitekeenez, joan-etorriko itzulpena entretenimendu-iturri ere izan daiteke[4][5].

Software kalitatea[aldatu | aldatu iturburu kodea]

Itzulpen automatikoko sistemen kalitatea alderatzeko, joan-etorriko itzulpenaz baliatu daiteke, emaitzan lortutako testua jatorrikoarekin konparatuz. Adibidez, joan-etorriko itzulpenaz baliatu ziren 2014ko ikerketa batean Google Translate tresnaren ingelesa eta arabieraren arteko itzulpenak aztertu eta haien ama-hizkuntza ingelesa ez den horientzat oso nahasgarria eta ezegokia izan daitekeela ondorioztatzeko [6]. Hala ere, iritzi kontrajarriak daude ea teknika hau egokia den ala ez erabakitzerako garaian.

Zergatik ez erabili softwarearen kalitatea neurtzeko.[aldatu | aldatu iturburu kodea]

Teknika honen arazoetako bat izan daiteke itzulpena egitean arazoren bat badago, ezinezkoa dela identifikatzea arazoa joaneko itzulpenean izan den, edo itzulikoan[2]. Gainera, posible da itzulpen on bat jasotzea, joaneko itzulpen txar batetik[2]. BLEU eta F-score metodoak erabiltzen zituen ikerketa batek doaneko 5 online itzulpen programa alderatu zituen, bai joaneko itzulpena bai etorrikoa konparatuz, eta ondorioztatu zen ez zegoela inongo korrelaziorik joaneko itzulpenaren kalitatearen eta etorriko itzulpenarenaren artean. Hau da, joaneko itzulpenak kalitate handikoa izatea ez zen beti egokitzen itzulerako kalitatezko itzulpen batekin. Ikerketaren egileak ondorioztatu zuen joan-etorriko itzulpena metodo ahula zela itzulpen automatikoko softwareen kalitatea aurreikusteko[2]. Aipatutako ondorio hau indartsuago berrestu zen beste ikerketa sakonago bati esker, ebaluazio automatikoko metodoak erabiliz oraingoan ere[1].

Zergatik erabili softwarearen kalitatea neurtzeko.[aldatu | aldatu iturburu kodea]

Beraz, erraza da frogatzea joan-etorriko itzulpenak ez duela funtzionatzen. Baina onartu behar da, halaber, batzuetan funtzionatzen duela dirudiela, eta nahiko parafrasia ulergarria sortzen duela, izan ere, askotan teknika honek teknizismoetan soilik ez du funtzionatzen[7]. Beste ikerketa batek, ebaluazio automatikoko metodoez gain itzulpenaren giza ebaluazioa ere zuenak, ondorioztatu zuen joan-etorriko itzulpenak itzulpen automatikoko sistemen kalitatea aurreikusteko gaitasuna izan dezakeela testu luzeetan, baina ez esaldiz esaldi oinarrituta[3].

Hala ere, esan beharra dago, itzulpen automatikoko sistema on batek hizkuntza bat beste batean bihurtu behar duela esaldiaren zentzuari eutsiz, eta hortaz, errendimendu oneko itzulpen-sistema pare bat emanda, esaldi baten esanahiak bere horretan iraun beharko luke, baita joan-etorriko itzulpen baten ondoren ere. Beraz, itzulpen automatikoko sistemek nahiko ongi funtzionatzen badute eta gizakiek sortutako erreferentziazko itzulpenik ez bada ematen, joan-etorriko itzulpena sistema ebaluatzeko erabiltzea aukera naturala da[8].

Testuaren egokitasuna itzulpen automatikorako[aldatu | aldatu iturburu kodea]

Joan-etorriko itzulpena testu bat itzulpen automatikorako egokia den ala ez ondorioztatzeko erabilgarria dela ere esaten da. Honako hau da ideia horren oinarri: joan-etorriko itzulpenaren emaitza jatorrizko testuaren antzekoa bada, orduan itzulpen automatikorako egokia da. Joan-etorriko itzulpena erabili ondoren testua ez bada zehatza, jatorrizko testua moldatzen joan daiteke, emaitza egoki bat lortu arte[9].

Egokitasun maila estimatzeko lau maila aurkezten ditu WMT-k[10]:

  • hitz-maila: hitz bat esaldi batean egokia den edo ez.
  • adierazpen-maila: adierazpen edo esamolde bat esaldi baten barruan ondo dagoen edo ez.
  • esaldi-maila: esaldia bera ere ebaluatua da, aldaketak behar dituen ehuneko zatiaren arabera.
  • dokumentu-maila: dokumentuak osotasunean duen balorazioa.

Joan-etorriko itzulpena itzulpen automatikoen kalitatea neurtzeko aplikazio bezala aztertzen zuen ikerketa batean, testuen itzulpen automatikorako egokitasuna aurreikusteko gaitasuna ere aztertu zuten. Ikerketa horretan ere ez zuten inolako korrelaziorik aurkitu joaneko itzulpenaren kalitatearen eta etorrikoaren kalitatearen artean[2]. Hala ere, giza ebaluazioa erabiltzen zuen ikerketa batek ondorioztatu zuen bazela korrelazioa joaneko itzulpenaren eta etorriko itzulpenaren kalitateen artean, eta korrelazio hau joaneko itzulpenaren kalitatea estimatzeko erabili zitekeela. Korrelazio hau erabiliz, joaneko itzulpenaren kalitatea zehaztu eta jatorrizko testua sinplifikatuz, joaneko itzulpenaren kalitatea hobetu daiteke[11].

Akatsak zuzentzeko teknika[aldatu | aldatu iturburu kodea]

Joan-etorriko itzulpena bigarren hizkuntza baten ikasketa prozesuan akatsak zuzentzeko teknika ere izan daiteke. Kasu honetan, hasierako itzulpena pertsona batek egina da, eta itzultzaile automatiko batek egiten duena bigarren itzulpena da, baina lagungarria izan daiteke akatsak zuzentzeko garaian. Hala ere, joaneko itzulpena ez da izango oso egokia itzulpen automatikoko testu batentzako, izan ere, honelako tresnak sarrerako hizkuntza-maila handi bat dutenentzako eginda daude[12], eta horregatik, ez da aukera egokia izaten joan-etorriko itzulpena aplikatzea[12].

Hala ere, aipatu bezala, aurreko kasuan sarrerako itzulitako testua pertsona batek sortzen du, eta hori ez da guztiz joan-etorriko itzulpena. Baina posible da teknika hau aplikatuz hizkuntza bateko akats gramatikalak automatikoki zuzentzea. Metodo honen arabera[13], hizkuntza bateko testu bat beste bi hizkuntzatara itzuli eta ondoren hasierako hizkuntzara itzuli ondoren, emaitza bakoitza gramatikalki aztertuko du sistemak eta puntuazio bat emango dio. Testu-sekuentzia hautagaien aniztasunak aukera gramatikal alternatiboak ditu lehen testu-sekuentziarako. Hona hemen metodo honen jarraibideak[13]:

  1. Lehen hizkuntzan dagoen testu sekuentzia bat itzulpen automatikoko sistema bat erabiliz bigarren hizkuntzara itzuli.
  2. Lehen hizkuntzan dagoen testu sekuentzia bat itzulpen automatikoko sistema bat erabiliz hirugarren hizkuntzara itzuli.
  3. Emaitza bakoitza berriz lehen hizkuntzara itzuli.
  4. Emaitza guztiak aztertu eta baloratu.

Baliabide gutxiko hizkuntzetako itzulpen-sistemetan[aldatu | aldatu iturburu kodea]

Itzulpen automatikoko sistemek itzulpen-arauak entrenamendu-datuetatik hartzen dituztenez, haien errendimendua, neurri handi batean, datuen araberakoa da. Oro har, entrenamendu-datuak zenbat eta handiagoak izan, orduan eta hobeak izango dira itzulpen-sistemak[14], baina hori ez dute hizkuntza askok. Entrenamendu elebiduneko datu-multzoko milioika hitzetatik abiatuta ikasten dute itzulpen neuronaletako sistemek, baina oso garestia da giza itzulpenak erabiltzearen prozesua, eta denbora asko behar du. Hortaz, artikulu batzuetan joan-etorriko itzulpena baliabide gutxiko itzulpen automatikoko software elebidunerako joaneko eta itzulerako entrenamendu-ikuspegi bat deskribatzen da. Baliabide gutxiko hizkuntzak, baliabideetan txiroak diren hizkuntza moduan ere deituak, nazioartean duten garrantziaren arabera teknologia eta datu-multzo gutxien dituztenak dira. Baliabide gutxiko hizkuntzen arazorik handiena baliabide nahikoak lortzeko zailtasun izugarria da[15].

Joan-etorriko itzulpena osatzen duten eginbeharrek (joaneko itzulpena eta itzulerako itzulpena) begizta bat osatu dezakete behin eta berriro egin ezkero, eta biek informazioaren atzeraelikadura bat eragiten dute, eta aldi berean itzulpen automatikoko sistemak entrenatzeko aukera ematen dute. Hain zuzen, modu honetan, datu elebakarrak ahalik eta modu eraginkorrenean erabiltzen dira, bai jatorrizko hizkuntzarako, bai helmugako hizkuntzarako. Ikuspegi honi esker, datu elebakarrek datu elebidunen antzeko balioa dute, eta horrek testu elebidunaren beharra pixkanaka murrizten laguntzen du entrenamendu-fasean. Oro har, itzulpen neuronaletako sistemen joan-etorriko prozedura honela deskribatzen da[15]:

  1. Lehenengo itzulpen-sistemak X hizkuntza ulertzen du eta mezu bat bidaltzen du hizkuntza horretan beste itzulpen-sistemara. Bigarren itzulpen-sistemak Y hizkuntza ulertzen du. Mezua egiaztatu ondoren, jakinarazpen bat bidaltzen du lehenengo itzulpen-sistemara.
  2. Lehenengo itzulpen-sistemak bigarrenaren mezua jasotzen duenean, mezua egiaztatu eta jakinarazpena bidaltzen du bigarren itzulpen-sistemara.
  3. Feedback hori jaso ondoren, bi itzulpen-sistemek bien errendimendua ezagutzen dute eta, feedback horren ondorioz, beharrezko aldaketak egiten dituzte.

Joan-etorriko itzulpena euskaran[aldatu | aldatu iturburu kodea]

Euskarazko itzulpen automatikoko tresnak berriak dira, orain dela urte batzuk soilik kaleratu ziren lehen bertsioak[16], baina, itzultzaile neuronalen laguntzarekin, azken urtetan izugarrizko jauzia eman dute. Gaur egun, aukera ugari egoteaz gain, itzulpenen kalitatea ere asko igo da, eta gero eta hizkuntza gehiago prozesatzeko gaitasuna dute.

Hala ere, euskara bi hizkuntza handien tartean egoteak ondorio batzuk ere badauzka, eta horren adibide da 2004ko Iparraldeko ikasleen unibertsitatera sartzeko azterketa[17]. Garai hartan, Iparraldeko ikasleek, Hegoaldeko unibertsitate batean ikasi nahi baldin bazuten, UNEDek (Espainiako Urrutiko Hezkuntzarako Unibertsitate Nazionala) gaztelaniaz eman eta zuzenduko zituen azterketa batzuk gainditu behar zituzten, baina azterketa hori euskaraz egin ahal izateko tartean itzultzaileak erabili ziren. Horregatik, joan-etorriko itzulpena egin behar izan zuten. Lehenik, Madrilgo UNEDek bidaltzen zituen azterketak euskaratu, eta ondoren, Iparraldekoen erantzunak gaztelaniara eraman.

Entretenimendua[aldatu | aldatu iturburu kodea]

Joan-etorriko itzulpenaren adibidea Eusko Jaurlaritzaren itzultzaile neuronala erabiliz.

Itzulpen automatikorako sistemaren kalitatea edo testu baten egokitasuna ebaluatzeko joan-etorriko itzulpena erabiltzea zalantzan badago ere, itzulpen automatikoarekin dibertitzeko modu bat da[5], izan ere, joan-etorriko itzulpen batetik sortutako testua komikoki txarra izan daiteke. Garai batean, esaterako, prozesu honekin entretenitzeko helburua zuten webguneak zeuden[5][18]. Beste aldaera batzuek testua hainbat hizkuntzatan bidaltzen dute jatorrizkora itzuli aurretik[19], edo joan-etorriko testua itzultzen jarraitzen dute oreka lortu arte (hau da, itzulpenaren emaitza joaneko itzulpenerako erabilitako testuaren berdina izan arte)[20].

Joan-etorriko itzulpenaren adibide bat literaturan, Philip K. Dicken Galactic Pot-Healer eleberrian aurkitu genezake. Bertan, protagonistak liburuen izenburuak eta esaera zaharrak joan-etorriko itzulpen bidez itzultzen ditu eta, ondoren, bere lagunak jatorrizkoa asmatzen saiatzen dira. Bestalde, Australiako Spicks and Specks telebista-saioak "Turning Japanese" izeneko lehiaketa bat zuen, joan-etorriko itzulpena abestien letretan erabiltzen zuena. Saio honetan, lehiakideek behar bezala asmatu behar zuten proposatzen zitzaien abestiaren izenburua[21].

Bestalde, hainbat film ospetsuren legez kanpoko kopietan, itzultzaile automatikoak erabiltzen dira azpitituluak itzultzeko, eta askotan zentzurik gabeko izen eta esaldiak agertzen dira. Honen adibide dira Star Wars III. Atala: Sitharren Mendekua filmaren legez kanpoko kopia txinatar batetik hartutako azpidatziak, izan ere, ingelesetik txinera eta ondoren txineratik ingelesera itzulitako azpititulu hauetan, Darth Vader-en "NO!" ("EZ!") ospetsua, "Do not want" ("Ez dut nahi") moduan itzulita zegoen. Honetaz gain, film honetan bertan, hainbat protagonisten izenak ere asko aldatzen dira[22].

Amaitzeko, aipatzekoa da teknika hau probatzeko webgune asko daudela, eta horietako bat probatu nahi izan ezkero aukera aproposa da TranslationParty webgunea erabiltzea.

Beste erabilera batzuk[aldatu | aldatu iturburu kodea]

Itzulpen metodo honek izan ditzake beste erabilera batzuk ere. Saiakuntza klinikoen munduan adibidez, oso ohikoa da egindako itzulpenen etorriko itzulpenak eskatzea, hauen zehaztasun eta kalitate maila ziurtatzeko[23]. Jatorriko testua eta etorriko itzulpena alderatuz, hizkuntzaren ñabarduretatik sor daitezkeen nahasmendu, anbiguotasun eta akatsak identifikatu daitezke.

Aurretik aipatu bezala, jatorriko testua eta etorriko itzulpenaren artean ezberdintasun handiak badaude, zaila da jakitea akatsa joanekoan edo etorrikoan izan den. Horregatik, adiskidetze edo reconciliation izenekoa egiten da, hau da, etorriko itzulpena egitean txosten bat osatzen da egon daitezkeen gaizki-ulertu edo akatsekin, eta hobekuntza proposamenak egiten dira.

Itzulpen zerbitzu mota hauek enpresa farmazeutikoak, medikuntzaren arloko erakundeak eta ikerkuntza klinikoan erabiltzen dira batez ere [23].

Joan-etorriko itzulpena doako online itzultzaileetan[aldatu | aldatu iturburu kodea]

Interneten gaur egun itzultzaile automatiko asko aurkitu ditzakegu, horietako asko neuronalak, eta doan erabili ditzakegu bai kontsultak egiteko eta baita entretenitzeko ere[24]. Euskarazko itzultzaile neuronalak ere eskura dauzkagu eta itzulpen egokiak egiten dituztela ikusi da[25], baina ez dago hauek balioztatzen dituen inongo lanik.

Hala ere, gaztelania eta ingelesa hartuta, eta joan-etorriko itzulpena erabiliz, honako puntuazioa dauka zerbitzuetako bakoitzak[26]:

Doako itzulpen automatikoko tresnen rankinga[26]
Itzultzailea Guztira Esamoldeak Erregistroa Lexikoa Partikuladun aditzak Gramatika
Google 20 2 4 4 5 5
Babylon 16 5 2 4 5 0
Reverso 13 5 3 2 0 2
Bing 12 4 1 4 4 0
Babelfish 11 5 2 1 2 1
Systrans 9 5 2 1 2 0
Prompt 8 0 1 2 0 5
Woldlingo 4 0 1 1 2 0
Inertran 2 1 0 1 0 0
Webtrance 0 0 0 0 0 0

Ikus gainera[aldatu | aldatu iturburu kodea]

Hona hemen joan-etorriko itzulpenarekin lotura izan dezaketen artikulu zerrenda.

Erreferentziak[aldatu | aldatu iturburu kodea]

  1. a b van Zaanen, Menno; Zwarts, Simon. (2006). «Unsupervised Measurement of Translation Quality Using Multi-engine, Bi-directional Translation» Lecture Notes in Computer Science (Springer Berlin Heidelberg): 1208–1214. ISBN 978-3-540-49787-5. (Noiz kontsultatua: 2021-02-26).
  2. a b c d e Somers, Harold. (2005-12). «Round-trip Translation: What Is It Good For?» Proceedings of the Australasian Language Technology Workshop 2005: 127–133. (Noiz kontsultatua: 2021-02-26).
  3. a b «The Efficacy of Round-trip Translation for MT Evaluation» translationjournal.net (Noiz kontsultatua: 2021-02-26).
  4. Kupść, Anna. (2003). «Two approaches to aspect assignment in an English-Polish machine translation system» Proceedings of the 7th International EAMT workshop on MT and other Language Technology Tools, Improving MT through other Language Technology Tools Resources and Tools for Building MT - EAMT '03 (Association for Computational Linguistics)  doi:10.3115/1609822.1609825. (Noiz kontsultatua: 2021-02-26).
  5. a b c Gaspari, Federico (2006). "Look who's translating. Impersonation, Chinese whispers and fun with machine translation on the Internet. EAMT-2006: 149-158 via Mt- Archive.
  6. {Machine Translation: Deficiency in Translating English Sentences with Different Temporal References into Arabic. Journal of Education and Practice, 47-52 or..
  7. «Round Trip Translation Using PNMT Systems | SYSTRAN» web.archive.org 2020-08-15 (Noiz kontsultatua: 2021-03-03).
  8. Moon, Jihyung; Cho, Hyunchang; Park, Eunjeong L.. (2020-04-28). «Revisiting Round-Trip Translation for Quality Estimation» arXiv:2004.13937 [cs] (Noiz kontsultatua: 2021-03-02).
  9. (Ingelesez) «Gotcha!: Translation Software» www.baselinemag.com (Noiz kontsultatua: 2021-03-02).
  10. (Ingelesez) Fonseca, E.. (2019). Proceedings of theFourth Conference on Machine Translation (Volume 3:Shared Task Papers, Day 2). , 1-10 or..
  11. Shigenobu, Tomohiro. (2007). «Evaluation and Usability of Back Translation for Intercultural Communication» Lecture Notes in Computer Science (Springer Berlin Heidelberg): 259–265. ISBN 978-3-540-73288-4. (Noiz kontsultatua: 2021-03-02).
  12. a b Matthieu, Désilets, Alain Hermet,. (2009-08-29). Using Automatic Roundtrip Translation to Repair General Errors in Second Language Writing. PMC 671987975. (Noiz kontsultatua: 2021-03-03).
  13. a b (Ingelesez) Round-trip translation for automated grammatical error correction. 2014-03-19 (Noiz kontsultatua: 2021-03-03).
  14. (Ingelesez) Wong, Derek F.; Lu, Yi; Chao, Lidia S.. (2016-09-15). «Bilingual recursive neural network based data selection for statistical machine translation» Knowledge-Based Systems 108: 15–24.  doi:10.1016/j.knosys.2016.05.003. ISSN 0950-7051. (Noiz kontsultatua: 2021-03-03).
  15. a b (Ingelesez) Ahmadnia, Benyamin; Dorr, Bonnie J.. (2019-01-01). «Augmenting Neural Machine Translation through Round-Trip Training Approach» Open Computer Science 9 (1): 268–278.  doi:10.1515/comp-2019-0019. ISSN 2299-1093. (Noiz kontsultatua: 2021-03-02).
  16. Irekia. «Irekia - Gaztelera-euskara, klik batean» www.irekia.euskadi.eus (Noiz kontsultatua: 2021-03-03).
  17. «Bigarren urtez, Iparraldekoek selektibitatea euskaraz» Argia (Noiz kontsultatua: 2021-03-03).
  18. «Lost in Translation - Cross-language computer translation» web.archive.org 2016-12-28 (Noiz kontsultatua: 2021-03-01).
  19. (Ingelesez) «Bad Translator: Translate Text Back and Forth» MUO 2010-04-12 (Noiz kontsultatua: 2021-03-01).
  20. (Ingelesez) «Translation Party: Tapping Into Google Translate's Untold Creative Genius» TechCrunch (Noiz kontsultatua: 2021-03-01).[Betiko hautsitako esteka]
  21. Spicks and Specks. (Noiz kontsultatua: 2021-03-01).
  22. «Recursive Translation» TV Tropes (Noiz kontsultatua: 2021-03-02).
  23. a b (Ingelesez) «The What And Why Of Back Translation And Reconciliation» Language Scientific (Noiz kontsultatua: 2021-03-01).
  24. (Ingelesez) «20+ Sites to translate your text for free» Speakt.com 2017-12-20 (Noiz kontsultatua: 2021-03-02).
  25. Berria. «Erabilgarri dago Elhuyarren itzultzaile automatiko eleaniztuna» Berria (Noiz kontsultatua: 2021-03-02).
  26. a b Hampshire, Stephen; Salvia, Carmen Porta. (2010). «Traslation and the Internet: evaluating the Quality of Free Online Machine Translators» Quaderns: Revista de traducció (17): 197–209. ISSN 1138-5790. (Noiz kontsultatua: 2021-03-02).

Kanpo estekak[aldatu | aldatu iturburu kodea]