Corpus paralelo

Wikipedia, Entziklopedia askea

Corpus paraleloa (ikusi testu corpus) maila batera lerrokaturik dauden bi hizkuntz desberdinetako testu bik osatzen duten duten errekurtso linguistiko bat da, normalean, lerrokada, sekzio, orri, edota hitzeko.

Corpus paralelo motak[aldatu | aldatu iturburu kodea]

4 corpus paraleloak ezberdindu daitezke:

Kalitate txarreko itzulpenak dituzten, edota zehazki lerrokatuak ez dauden esaldi elebidunak dituen corpus paraleloa.

Corpus konparagarri bat itzulita ez dauden dokumentu elebidunetatik abiatuta egiten dira. Dokumentuak alineaturik daude.

Corpus cuasi-konparagarri batek alineaturik edo alineatu gabe dauden dokumentu heterogeneo ez paraleloek osatzen dute.

Corpus paralelo arraroenak dokumentu berari buruzko hainbat itzulpen dituztenak dira, gutxienez esaldi mailan alineaturik eta bi hizkuntza edo gehiagotan.

Kanpo estekak[aldatu | aldatu iturburu kodea]