Itzulpen memoria

Itzulpen memoriak testu-biltegi batzuk dira, hizkuntza bateko jatorrizko testuak eta testu horien beste hizkuntza bateko itzulpenak lerrokatuta gordetzen dituztenak. Itzulpen memorien definizio hau bat dator corpus paraleloen definizio onartuenetako batekin (Baker, 1995a). Horregatik, itzulpen memoriak corpus paraleloak direla esan daiteke.

Horrela, itzulpen memoriak edo corpus paraleloak jatorrizko testuez eta helburu hizkuntzara itzulitako testuez osatuta daude. Testu horiek, gainera, itzulpen-unitate edo segmentuen arabera lerrokatuta daude. Euren baliokideekin batera gordetzen diren itzulpen-unitateak definitzeko moduak askotarikoak dira, esaldi amaiera markatzen duten puntuazio zeinuak (.,?,!,:, ...) edo paragrafo saltoak dira lagundutako itzulpen sistemek sarrien erabiltzen dituztenak bestelakorik zehaztu ezean.

Orokortasunak[aldatu | aldatu iturburu kodea]

Itzulpen memorien (hemendik aurrera, IM) funtzio nagusia da esaldi batetik iradokizun totalak edo partzialak eta terminoen konkordantziak bilatzea. Itzulpenean zehar, IMaren datu-basean jatorrizko hizkuntzako segmentuak bilatzen dira. IMak jatorrizko hizkuntzan guztiz bat datorren segmentu bat badauka, segmentu hori leihoaren IMaren partean azalduko da, eta horrekin batera, baita bere itzulpenarekin eta datu-basean segmentuarekin gordeta dagoen informazio osagarria ere. Antzekotasun maila %100 izaten da halakoetan. IMak jatorrizko segmentuaren guztiz berdina ez baizik eta soilik antzekoa den segmentu bat baldin badauka, segmentu hori ere erakutsiko da, bere itzulpenarekin eta IMak kalkulatutako antzekotasun mailarekin batera. Guztiz berdina ez den segmentu bati «fuzzy match» (kointzidentzia partziala) deritzo IM sistema guztietan. Itzultzailearentzat onargarria den antzekotasun maila moldatu egin daiteke MT sistema guztietan. Baliabide linguistiko paralelo hauen edukia ezinbestekoa da, baina bilaketa-motor bat izatea ere erabakigarria da, testu-kantitate handia miatzea eta testuetan errepikatzen diren hizkuntza- eta terminologia-patroiak identifikatzea ahalbidetzen duelako. Ondorioz, memorien edukiak eta bere indexazio sistemak emaitza onak ematen badituzte, memoria hauek hizkuntza-bitartekariaren lanabes onena izango dira. Ildo horretan, Abaituak (2002) adierazten du corpus paraleloak beste aukera bat bihurtu direla, hots, hiztegiak ez direla jada informazio-iturri bakarra, eta, esan bezala, itzulpen memoriak berez testu paraleloak dira. Itzulpen biltegia, hau da, corpus paraleloa, itzulpen memorien bolumenaren eta elikatze-maiztasunaren arabera handitzen doa; izan ere, lagundutako itzulpenari esker lortzen diren itzulpen-unitateak baliozkotzean sortzen dira itzulpen memoriak.. Itzulpen memoriak sortzeko beste teknika bat da itzulita dauden (eta, beraz, baliokideak diren) testuak lerrokatzea. Lerrokatze hori lerrokatzaileen bitartez egiten da, alegia, horretarako berariaz sortutako tresnen bidez. Askotan, itzulpen memoria terminoa erabiltzen da ordenagailuz lagundutako itzulpen-sistemak (ingelesez, CAT Tools) izendatzeko. Sistema horiek itzultzaile profesionalei laguntzeko diseinatutako programa informatikoak dira. Itzulpen memoriak ezinbestekoak izan dira maila globaleko hizkuntzaren industria sortzeko.

Itzulpen memorien erabilera[aldatu | aldatu iturburu kodea]

Hasteko, itzultzaile batek sorburu testu bat (itzuli beharreko testua) ematen dio itzulpen memoriari. Programak testua aztertzen du eta bere datu-basean aurretik itzulitako segmentu pareekin bat datozen segmentuak topatzen saiatzen da. Programak aurkitutako edozein kointzidentzia aurkeztuko dio itzultzaileari, hark berrikusi dezan.

Itzultzaileak proposamena onartzea, edo atzera botatzea erabaki dezake, edota proposamena aldatu eta aldatutako bertsio hori erabiltzea. Azken kasu horretan, aldatutako bertsioa datu-basean gordetzen da. Itzulpen memoria-sistema batzuek %100ean bat datozen kointzidentziak bakarrik bilatzen dituzte, hau da, kointzidentzia zehatzak. Beste batzuek kointzidentzia-algoritmoak erabiltzen dituzte antzeko segmentuak lortzeko. Kointzidentziarik ez daukaten segmentuak eskuz itzuli behar izaten dira. Emaitza datu-basean gordetzen da, programak ondorengo saioetan erabil dezan. Itzulpen memorien erabilera baliagarriagoa da testu errepikakorretan, hala nola eskuliburu teknikoetan. Lehenago itzulitako dokumentuen itzulpen inkrementalak egiteko ere baliagarriak dira. Itzulpen-memoria bat aldi batez modu jarraitu batean erabiltzen bada, itzultzaileei lan handia aurrez dakieke.

Abantaila nagusiak[aldatu | aldatu iturburu kodea]

Itzulpen memorien kudeatzaileak bereziki egokiak dira dokumentazio teknikoa eta hiztegi espezializatua duten dokumentuak itzultzeko. Hauexek dira onura batzuk:

Dokumentua guztiz itzulita dagoela ziurtatzen dute (ez dira segmentu hutsak onartzen).
Itzulitako dokumentuak koherenteak direla ziurtatzen dute, ohizko definizioak, fraseologia eta terminologia barne. Hori garrantzitsua da hainbat itzultzailek dokumentu berean lan egiten dutenean.
Askotariko formatuekin lan egitea ahalbidetzen dute, formatu horiek prozesatzeko beharrezkoa den softwarea eduki gabe.
Itzulpenaren prozesu globala azkartzen dute. Aurretik itzulitako materiala «gogoratzen» dutenez, itzultzaileek behin baino ez dute itzuli behar.

Eragozpen nagusiak[aldatu | aldatu iturburu kodea]

Itzulpen memoria kontzeptuaren oinarrian dagoen ideia da, itzulitako esaldiak “birziklatu” egin daitezkeela. Hala eta guztiz ere, itzulpengintzaren oinarrizko printzipio bat testuaren edukiaren mezua itzultzea da, eta ez berori osatzen duten esaldiak.
Gaur egun IMek ez dute eskuragarri dauden testu formatu guztientzako filtrorik.
IMen kudeatzaileen erabilerari lotutako ikasketa-kurba bat dago eta programak pertsonalizatu egin behar dira ahalik eta eraginkorrenak izaten daitezen.
Sortutako datu-baseen mantentze-lana eskulan-prozesu bat da oraindik ere, etengabeko jarraipena eskatzen duena. Mantentze-lan horren gabeziek IMaren errendimendua, erabilgarritasuna eta zerbitzuak murritzarazten dituzte.
Biltegiratutako testu baten kalitatea itzuli duen pertsonaren eraginkortasunaren araberakoa da. Segmentu jakin bateko akats batek hor jarraituko du zuzendu arte, eta segmentu hori agertzen den testu itzuli guztietan azalduko da.
IMek mundu industrialarekiko nolabaiteko antzekotasunak sortarazten dituzte, itzultzaileen esplotazioa errazten baitute, eta horrek amaierako produktuaren kalitatea murrizten du.

Partekatutako itzulpen-memoriak[aldatu | aldatu iturburu kodea]

Zer dira partekatutako itzulpen-memoriak?[aldatu | aldatu iturburu kodea]

Partekatutako itzulpen-memoriek ahalbidetzen dute bi itzultzaile edo gehiagok proiektu bereko fitxategiak itzultzea, itzulpen memoria bera erabiliz aurretik itzulitako segmentuak berreskuratu baititzakete. Memoriak memoria-fitxategi zentralizatu batetik partekatu daitezke, zeina bezeroaren hornitzaile batek kudeatzen du. 1. hornitzaileak itzulpen lan bat jasotzen duenean, memoria osoa deskargatu beharko du. Behar diren aurreprozesamendu lanak egin beharko ditu, eta deskargatu duen memoriarekin aztertuko du lana. 2.hornitzaileak itzulpen enkargu bat jasotzen duenean, operazio bera burutuko du. Lanak amaitutakoan, nahitaezkoa da memoria-unitate berri edo aldatuak memoria nagusian sartzea. Lan hori hornitzaileetako baten ardura baino ez da izango, memoriaren jagole den heinean. Bezeroaren ardura ere izan liteke, baliabide egokiak baditu.

Memoriak partekatzeko arrazoiak[aldatu | aldatu iturburu kodea]

Bezero batek sistema hau aukeratzeko arrazoiak honako hauek izan litezke:

Kostuak murrizten dira bi hornitzaileei memoria bera erabiltzen utziz eta, beraz, baldintza berdinetan lehiatzeko aukera emanez.
Arlo ezberdinetan (softwarea, webguneak, marketina) trebatutako bi hornitzailek eduki itzulgarriak parteka ditzakete.
Arriskuak dibertsifikatzen dira eta hornitzaile bakar batekiko mendekotasun erabatekoa saihestea.
Bezeroak du memorien datu-baseen kontrola.

Hornitzaile batek sistema hau aukeratzeko arrazoiak, berriz, honako hauek dira:

Beste hornitzaileekiko abantaila komertziala izan dezake. IMaren jagole izanda, hornitzaileak posizio pribilegiatu batean dago lan gehiago eskuratzeko eta beste hornitzaileak bigarren mailako eginkizunetara baztertzeko.
Beste hornitzaileekiko nagusitasun teknikoa erakuts dezake.

Memorien erabilpen partekatuaren abantailak[aldatu | aldatu iturburu kodea]

Behar bezala kudeatzen badira, hornitzaile batek sortu eta kudeatutako itzulpen unitateak (esaldi eta esamoldeak) beste batek ere erabil ditzake, eta horrela kostuak murriztuko ditu. Memoriaren baliabidea zentralizatuz, gainera, memorien mantentze lanen gastuak bikoizketa saihesten da. Guzti horrek memoriaren erabilpenak dakartzan kostuak murrizten ditu. Memoria sarean jarrita (edo beste edozein modutan) partekatzen bada, badirudi haren edukia erabili nahi duen edonoren eskura jartzen dela, authoring prozesuetan bezala. Hala ere, komeni da esatea Trados bezalako itzulpen tresnak itzultzaile profesionalek eguneko jardunean erabiltzeko diseinatuta daudela, eta ez bezeroek erabiltzeko.

Adibideak[aldatu | aldatu iturburu kodea]

Wordfast VLTM (Very Large Translation Memory)

Arazoak[aldatu | aldatu iturburu kodea]

Partekatutako memoriek ondo funtziona dezaten, hainbat arazo konpondu behar dira. Batzuek konponketa erraza dute, baina beste batzuk erronka handiak dira.

Ondorioak[aldatu | aldatu iturburu kodea]

Partekatutako memorien erabilerak onuragarria dirudien arren bezeroaren ikuspuntutik, hornitzaile bakar batekiko mendekotasuna saihesten duelako, praktikan mendekotasun horrek ez du zerikusirik momentu jakin bateko memoriaren jagolea pertsona bat ala bestea izatearekin. .Askoz ere arrazoi sendoagoak daude eduki mota berdinetarako hornitzaile bakar bat erabiltzeko.

Bi hornitzailek eduki mota desberdinak itzultzen dituzten kasuetan, komenigarria da memoriak modu partekatuan erabiltzea, baina halakoetan ere kontuan hartu beharreko zenbait arazo izan ohi dira. Kasu gehienetan, gomendagarriena izan ohi da hornitzaileren prozedurak banatuta edukitzea, eta gero biei pixkanaka memoriaren artxiboak banatzea.

Partekatutako memoriak erabiliz gero, hornitzaile batek hartu beharko du memorien ardura (edo bezeroak, espezializatutako baliabideak baditu). Eginkizun hori hornitzaileetako bati ematen baldin bazaio, bigarren hornitzailea azpikontratatutzat hartzea gomendatzen dugu prozesuari dagozkion xedeetarako.

Bibliografia[aldatu | aldatu iturburu kodea]

Abaitua, J. 2002. “Tratamiento de corpora bilingües”, in Tratamiento del lenguaje natural, Martí M. A. eta Llisterri, J. (arg). Bartzelona: Edicions Universitat de Barcelona: 61-90
Baker, M. 1995. “Corpora in Translation Studies: An Overview and Some Suggestions for Future Research”, Target, 7(2): 223-243.
Melby, A. K. 1982. “A bilingual concordance System and its use in linguistics studies”, in The Eight Lacus Forum, Gutwinsky, W. eta Jolly, G. (arg). Columbia: Hornbeam Press: 541-549

Ikus, gainera[aldatu | aldatu iturburu kodea]

Euskalbar, itzulpen memoriak eta beste corpus batzuk integratzen dituen tresna informatikoa, itzulpengintza lanetan lagungarri.
Testu corpusa
Hizkuntzaren industria
Ordenagailuz lagundutako itzulpena
TMX
Google itzultzailearen tresnen kutxa

Kanpo estekak[aldatu | aldatu iturburu kodea]

AmaGama EN > EU itzulpen memorietan arakatzeko tresna informatikoa. (Ingelesetik munduko hainbat hizkuntzatara, tartean euskarara, egindako itzulpen memorien datu-baseekin egindako tresna informatiko, bilatzaile formatuarekin).

Datuak: Q333761