Itzulpen memoria

Wikipedia(e)tik
Hona jo: nabigazioa, Bilatu

Itzulpen memoriak hizkuntza bateko jatorrizko testuez eta euren beste hizkuntza bateko itzulpen lerrokatuez osaturiko biltegiak dira. Itzulpen memorien definizio hau bat dator corpus paraleloen definizio onartuenetako batekin ( Baker, 1995a). Horregatik esan daiteke itzulpen memoriak corpus paraleloak direla.

Horrela, itzulpen memoriak edo corpus paraleloak jatorrizko testuez eta helburu hizkuntzara itzulitako testuez osatuta daude. Testu hauek gainera, itzulpenaren unitate edo segmentuen arabera lerrokatuta daude. Euren baliokideekin batera gordetzen diren itzulpen unitateak modu aldakorrean definitzen dira, esaldi amaiera markatzen duen puntuazio zeinuak (.,?,!,:, ...) edo paragrafo saltoak izanik lehenetsita sarrien eskaintzen direnak lagundutako itzulpen sistemetan.

Orokortasunak[aldatu | aldatu iturburu kodea]

Itzulpen memorien (hemendik aurrera, IM) funtzio nagusia esaldi batetik sugerentzia totalak edo partzialak eta terminoen komunztadurak bilatzea da. Itzulpenean zehar, IMaren datu-basean jatorrizko hizkuntzaren segmentuak bilatzen dira. IMak guztiz bat etortzen den segmentu bat badauka jatorrizko hizkuntzan, segmentu hori IMaren leihoaren partean azalduko da, bere itzulpenarekin eta datu-basean segmentuarekin gordeta dagoen informazio osagarriarekin. Antzekotasun gradua %100 da. IMak guztiz berdina ez den segmentu bat izan ordez soilik antzekoa den segmentu bat baldin badauka, segmentu hau ere erakutsiko da, bere itzulpenarekin eta IMak kalkulatutako antzekotasun graduarekin batera. Guztiz berdina ez den segmentu bat «fuzzy match» (kointzidentzia partziala) izena dauka IM sistema guztietan. Itzultzailearentzat onargarria den antzekotasun gradua moldatu daiteke MT sistema guztietan. Errekurtso linguistiko paralelo hauen edukia ezinbestekoa da, baina bilaketa-motorea ere erabakigarria da, testu-kantitate handia miatzea eta komunean dauden hizkuntza- eta terminologia-patroiak identifikatzea ahalbidetzen duelako. Ondorioz, memorien edukiak eta bere indexazioak emaitza onak ematen baditu, memoria hauek hizkuntzalaritza-bitartekariaren lanabes onena izango dira. Ildo honetak, Abaituak (2002) adierazten du nola, corpus paraleloak izanda, hiztegiak jada ez direla informazio-iturri bakarra, eta, aipatu dugunez, definizioz itzulpen memoriak testu paraleloak dira. Itzulpen biltegia, hau da, corpus paraleloa, itzulpen memorien bolumenaren eta elikatze-maiztasunaren arabera handituz doa, eta hauek itzulpen-prozesuan ematen den itzulpen-unitateen baliozkotzean sortzen dira, itzulpen lagunduaren ingurunean. Itzulpen memoriak sortzeko beste teknika bat itzulita dauden (eta, beraz, baliokideak diren) testuen lerrokatzea da. Lerrokatzea horretarako berariazkoak diren tresnekin egiten da, lerrokatzaile izena dutenak. Askotan erabiltzen da itzulpen memoriak terminoa ordenagailuz lagundutako itzulpen-sistemak (ingelesez, CAT Tools) izendatzeko. Hauek itzultzaile profesional laguntzeko diseinatutako programa informatikoak dira. Itzulpen memoriak ezinbestekoak izan dira hizkuntzaren industria modu globalean agertzeko.

Itzulpen memorien erabilera[aldatu | aldatu iturburu kodea]

Itzultzaile batek, lehenengoz, sorburu testu bat (itzuli beharreko testua) emango dio itzulpen memoriari. Programak testua miatuko du eta bere datu-basean parekoak diren segmentuak aurkitzen saiatuko da, hau da, segmentu-pareak non testua lehenago itzulitako beste segmentuekin kointziditzen duen. Programak aurkitutako edozein kointzidentzia aurkeztuko dio itzultzaileari berrikusi dezan.

Itzultzaileak proposamena onartu, atzera bota edo aldatu eta aldatutako bertsio hori erabiltzea erabaki dezake. Azken kasu honetan, aldatutako bertsioa datu-basean gordetzen da. Itzulpen memoria-sistema batzuk %100 zuzenak diren kointzidentziak bakarrik bilatzen dituzte, hau da, kointzidentzia zehatzak. Beste batzuk kointzidentzia-algoritmoak [1] erabiltzen dituzte antzeko segmentuak lortzeko. Kointzidentziak aurkitzen ez diren segmentuak eskuz itzuli beharko dira. Emaitza datu-basean gordeko da ondorengo sesioetan programak erabili ahal izateko. Itzulpen memorien erabilera baliagarriagoa da testu errepikakorretan, hala nola eskuliburu teknikoetan. Lehenago itzulitako dokumentuen itzulpen areagotuak egiteko baliagarriak dira ere. Memoria-itzultzaile bat modu jarraitu batean erabiltzen bada denbora batez, askoz lan gutxiago egin beharko dute itzultzaileek.

Abantaila nagusiak[aldatu | aldatu iturburu kodea]

Itzulpen memoria-kudeatzaileak egokiak dira, bereziki, dokumentazio teknikoa eta hiztegi espezializatua duten dokumentuak itzultzeko. Haien onuren artean hurrengoak daude:

  • Dokumentua guztiz itzulita dagoela ziurtatzen dute (ez dira segmentu hutsak onartzen).
  • Itzulitako dokumentuak koherenteak direla ziurtatzen dute, ohizko definizioak, fraseologia eta terminologia barne. Hau garrantzitsua da itzultzaile desberdinek dokumentu berean lan egiten dutenean.
  • Formatu desberdinekin lan egitea ahalbidetzen dute, formatu horiek prozesatzeko beharrezkoa den softwarea eduki gabe.
  • Itzulpenaren prozesu globala azkartzen dute. Lehenago itzulitako materiala «gogoratzen» dutenez, itzultzaileek behin baino ez dute itzuli behar.

Eragozpen nagusiak[aldatu | aldatu iturburu kodea]

  • Itzulpen memoriari erreferentzia egiten diogunean, itzulitako esaldiak “birziklatu”daitezkeela esan nahi dugu. Hala eta guztiz ere, itzulpengintzaren oinarrizko printzipio bat testuaren edukiaren mezua itzultzea da, eta ez berau osatzen duten esaldiak.
  • Gaur egun IMek ez dute eskuragarri dauden testu formatu guztientzako filtrorik.
  • IMen kudeatzaileen erabilerari lotutako ikasketa-kurba bat dago eta programak pertsonalizatu egin behar dira ahalik eta eraginkorrenak izateko.
  • Sortutako datu-baseen mantentze-lanak etengabeko lana eskatzen duen eskulan bat izaten jarraitzen du. Mantentze-lan honetako gabeziek lanaren etekina, erabilgarritasuna eta IMren prestazioak murriztea eragiten dute.
  • Biltegiratutako testu baten kalitatea giza-itzultzailearen eraginkortasunaren araberakoa da. Segmentu jakin bateko akats batek zuzendu arte iraungo du, eta segmentu hori agertzen den itzulitako testu guztietan azalduko da.
  • IMek mundu industrialarekiko nolabaiteko antzekotasunak sortarazten dituzte, giza itzultzaileen esplotazioa errazten baitute, amaierako produktuaren kalitatea murriztuz.

Partekatutako itzulpen-memoriak[aldatu | aldatu iturburu kodea]

Zer dira partekatutako itzulpen-memoriak?[aldatu | aldatu iturburu kodea]

Partekatutako itzulpen-memoriek bi itzultzaile edo gehiagok proiektu bereko fitxategiak itzultzea ahalbidetzen dute, itzulpen memoria bera erabiliz aurretik itzulitako segmentuak berreskuratu baitaitezke. Memoriak memoria fitxategi zentralizatu batetik partekatu daitezke, bezeroaren hornitzaile batek kudeatzen duena. Hornitzaileak itzulpen lan bat jasotzen duenean memoria osoa deskargatu beharko du. Behar diren aurreprozesamendu lanak egin beharko ditu, eta deskargatu duen memoriarekin lana aztertuko du. 2.hornitzaileak itzulpen enkargu bat jasotzen duenean operazio bera burutuko du. Lanak amaitutakoan, nahitaezkoa da memoria unitate berriak edo memoria nagusian aldatutako unitateak eranstea. Lan hau hornitzaile bakar baten ardura baino ez da izango, memoriaren jagole den heinean. Baliabide egokiak baditu, bezeroaren ardura ere izan liteke.

Memoriak partekatzeko arrazoiak[aldatu | aldatu iturburu kodea]

Bezero batek sistema hau aukeratzeko arrazoiak:

  • Kostuak murriztea, memoriari dagokionez bi hornitzaileek baldintza berdinetan lehiatuz.
  • Arlo ezberdinetan (software, web-orrialdeak, marketing) trebatutako bi hornitzailek itzuli ditzaketen edukiak partekatzea.
  • Arriskuak dibertsifikatzea eta hornitzaile bakar batekiko erabateko mendekotasuna saihestea.
  • Memorien datu-baseen kontrola izatea.

Hornitzaile batek sistema hau aukeratzeko arrazoiak:

  • Beste hornitzaileekiko abantaila komertziala izatea. TMaren zaintzaile izanda, hornitzaileak bere postua erabiliko du lan gehiago eskuratzeko eta eginkizun ordezkatzaileak beste hornitzaile batzuei uzteko.
  • Beste hornitzaileekiko nagusitasun teknikoa erakustea.

Memorien erabilpen partekatuaren abantailak[aldatu | aldatu iturburu kodea]

Behar bezala kudeatzen badira, hornitzaile batek sortu eta kudeatutako itzulpen unitateak (esaldi eta esamoldeak) beste batek ere erabil ditzake, eta horrela kostuak murriztuko ditu. Memoriaren baliabidea zentralizatuz, gainera, memoriak mantentzeko gastuen bikoizketa desagertzen da. Guzti horrek memoriaren erabilpenak dakartzan kostuak murrizten ditu. Online dagoen memoria (edo beste edozein memoria) partekatzen bada, badirudi bere edukia erabili nahi duen edonoren eskura jartzen dela, authoring prozesuetan bezala. Hala ere, komeni da esatea Trados bezalako itzulpen tresnak itzultzaile profesionalek eguneko jardunean erabiltzeko diseinatuta daudela, eta ez bezeroak erabiltzeko.

Adibideak[aldatu | aldatu iturburu kodea]

Arazoak[aldatu | aldatu iturburu kodea]

Partekatutako memoriak ondo erabiltzeko hainbat arazo konpondu behar dira. Batzuek konponketa erraza dute, baina beste batzuk erronka bilakatzen dira.

Ondorioak[aldatu | aldatu iturburu kodea]

Partekatutako memorien erabilerak bezeroaren ikuspuntutik (hornitzaile bakar batekiko menpekotasuna ezabatzeagatik) komenigarria dirudien arren, praktikan mendekotasun honek ez du zerikusirik momentu jakin bateko memoriaren jagolearekin. Eduki mota berdinetarako hornitzaile bakar bat erabiltzeko askoz arrazoi sendoagoak daude. Hainbat hornitzailek askotariko edukiak itzultzen dituzten kasuetan komeni da memorien erabilpen partekatua, baina hala ere kontuan hartu beharrezko zenbait arazo izango ditugu. Kasu gehienetan, gomendagarriena hornitzailearen prozedurak banatuta edukitzea litzateke, eta gero biei pixkanaka memoriaren artxiboak banatzea. Partekatutako memoriak erabiliz gero, hornitzaile bat (edo bezeroa, espezializatutako baliabideak baditu) memoriez arduratu beharko da. Eginkizun hau hornitzaileetako bati baldin badagokio, bigarren hornitzailea prozesuari dagozkion xedeetarako azpikontratatutzat hartzea gomendatzen dugu.

Bibliografia[aldatu | aldatu iturburu kodea]

  • Abaitua, J. 2002. “Tratamiento de corpora bilingües”, en Tratamiento del lenguaje natural, Martí M. A. y Llisterri, J. (eds). Barcelona: Edicions Universitat de Barcelona: 61-90
  • Baker, M. 1995. “Corpora in Translation Studies: An Overview and Some Suggestions for Future Research”, Target, 7(2): 223-243.
  • Melby, A. K. 1982. “A bilingual concordance System and its use in linguistics studies”, en The Eight Lacus Forum 1982, Gutwinsky, W. y Jolly, G. (eds). Columbia: Hornbeam Press: 541-549

Ikusi ere[aldatu | aldatu iturburu kodea]