Matxin (itzultzaile automatikoa)

Wikipedia, Entziklopedia askea
Matxin (itzultzaile automatikoa)
Jatorria
SortzaileaIxa taldea eta Elhuyar Fundazioa
Sorrera-urtea2007
Ezaugarriak
Hizkuntzaeuskara eta gaztelania
matxin.elhuyar.eus

Matxin euskararekin lan egiten zuen eta publikoki erabilgarri egon zen lehenengo itzulpen automatikoko (IA) sistema izan zen, Espainiako Gobernuak 2006an diruz lagunduta Euskal Herriko Unibertsitateko Ixa Taldearen eta Elhuyarren artean garatua. Software librea da, GNU GPL lizentziapean argitaratutakoa. Tresna erabilgarria izan zen eta hainbat aplikaziotan integratu zen 2019ra arte, Orduan sortu ziren [Itzultzai automatiko neuronalekhttps://eu.wikipedia.org/wiki/Itzulpen automatiko neuronal#Euskararako itzultzaile neuronalak itzultzaile automatiko neuronalek] askoz kalitate hobea lortu zuten, elia.eus itzultzailea esate baterako.

OpenTradek barne hartzen dituen bi proiektuetako bat zen, eta ezberdintasun lexiko eta sintaktiko handiak aurkezten dituzten hizkuntzen arteko itzulpenak burutzeko prestatuta zegoen.

Matxin erabilera orokorreko itzulpen automatikoko sistema da, transferentzian oinarritua. Hiru fasetan egiten du itzulpena: analisia, transferentzia eta sorkuntza. Analisi-fasean abiapuntu-testuaren analisi sintaktikoa lortzen du (gaztelaniarako Freeling software libreko paketea erabiltzen da). Transferentzia lexikalean estaldura handiko hainbat hiztegi berrerabiliz eraikitako lexikoi elebiduna kontsultatzen da. Transferentzia estrukturalean, besteak beste, postposizioen desanbiguazioa eta aditz-kateen transferentzia burutzen da. Sorkuntza sintaktikoan hitzak eta sintagmak ordenatzen dira eta sorkuntza morfologikoan postposizioen informazioa sintagmako azken hitzari gehitzen zaio, hitzaren forma lortuz Morfeus euskararako prozesadore morfologikoarekin. Hainbat tresna eta baliabide linguistiko berrerabili direnez, bereziki landu da sistemako datuen, erregelen eta moduluen arteko datu-fluxuaren formatuen estandarizazioa.

Sistemaren arkitektura abiapuntu-hizkuntzatik independentea izateko diseinatuta zegoen eta inplementatuta dagoen Matxin 1.0 prototipoak espainieratik euskarara itzultzen du. Matxin 2.0 prototipoak aurreko lanaren hobekuntzak ditu eta, horrez gain, SMT sistema berria garatu da euskaratik espainierara itzultzeko.

Prototipoak OpenTrad proiektuko webgunean proba daitezke.[1] Sourceforge-n kode irekiko software libre gisa banatzen da.[2]

Ikus, gainera[aldatu | aldatu iturburu kodea]

Erreferentziak[aldatu | aldatu iturburu kodea]

  • Mayor A. (2007) "Matxin: Erregeletan oinarritutako itzulpen automatikoko sistema baten eraikuntza estaldura handiko baliabide linguistikoak berrerabiliz". Doktoradutza-tesia. Euskal Herriko Unibertsitateko Donostiako Informatika Fakultatea.
  • Alegria I., Díaz de Ilarraza A., Labaka G., Lersundi M., Mayor A., Sarasola K. (2007) "Transfer-based MT from Spanish into Basque: reusability, standardization and open source". LNCS 4394. 374-384. Cicling 2007.
  • Alegria I., Díaz de Ilarraza A., Labaka G., Lersundi M., Mayor A., Sarasola K., M. Forcada, S. Ortiz, L. Padró (2005) "An Open Architecture for Transfer-based Machine Translation between Spanish and Basque". In Proceedings of the MT Summit X Workshop on Open-Source Machine Translation Workshop.

Kanpo estekak[aldatu | aldatu iturburu kodea]

  1. «Opentrad itzultzailea – Dokumentuen eta testuen itzultzailerik onena kode irekian.» www.opentrad.com (Noiz kontsultatua: 2022-03-24).
  2. «Matxin: an open-source shallow-transfer machine translation engine and toolbox» matxin.sourceforge.net (Noiz kontsultatua: 2022-03-24).