Matxin (itzultzaile automatikoa)

Wikipedia, Entziklopedia askea
Jump to navigation Jump to search

Matxin euskararekin lan egiten duen eta publikoki erabilgarria den lehenengo itzulpen automatikoko (IA) sistema da, Espainiako Gobernuak diruz lagunduta Euskal Herriko Unibertsitateko Ixa Taldearen eta Elhuyarren artean garatua. Software librea da, GNU GPL lizentziapean argitaratutakoa.

OpenTradek barne hartzen dituen bi proiektuetako bat da, eta ezberdintasun lexiko eta sintaktiko handiak aurkezten dituzten hizkuntzen arteko itzulpenak burutzeko prestatuta dago.

Matxin erabilera orokorreko itzulpen automatikoko sistema da, transferentzian oinarrituta. Hiru fasetan egiten du itzulpena: analisia, transferentzia eta sorkuntza. Analisi-fasean abiapuntu-testuaren analisi sintaktikoa lortzen du (espainerarako Freeling software libreko paketea erabiltzen da). Transferentzia lexikalean estaldura handiko hainbat hiztegi berrerabiliz eraikitako lexikoi elebiduna kontsultatzen da. Transferentzia estrukturalean, besteak beste, postposizioen desanbiguazioa eta aditz-kateen transferentzia burutzen da. Sorkuntza sintaktikoan hitzak eta sintagmak ordenatzen dira eta sorkuntza morfologikoan postposizioen informazioa sintagmako azken hitzari gehitzen zaio, hitzaren forma lortuz Morfeus euskararako prozesadore morfologikoarekin. Hainbat tresna eta baliabide linguistiko berrerabili direnez, bereziki landu da sistemako datuen, erregelen eta moduluen arteko datu-fluxuaren formatuen estandarizazioa.

Sistemaren arkitektura abiapuntu-hizkuntzatik independetea izateko diseinatuta dago eta inplementatuta dagoen Matxin 1.0 prototipoak espainieratik euskarara itzultzen du. Matxin 2.0 prototipoak aurreko lanaren hobekuntzak ditu eta, horrez gain, SMT sistema berria garatu da euskaratik espainierara itzultzeko.

Prototipoak OpenTrad proiektuko webgunean proba daitezke eta Sourceforge-n kode irekiko software libre bezala banatzen da.

Ikus, gainera[aldatu | aldatu iturburu kodea]

Erreferentziak[aldatu | aldatu iturburu kodea]

  • Mayor A. (2007) "Matxin: Erregeletan oinarritutako itzulpen automatikoko sistema baten eraikuntza estaldura handiko baliabide linguistikoak berrerabiliz". Doktoradutza-tesia. Euskal Herriko Unibertsitateko Donostiako Informatika Fakultatea.
  • Alegria I., Díaz de Ilarraza A., Labaka G., Lersundi M., Mayor A., Sarasola K. (2007) "Transfer-based MT from Spanish into Basque: reusability, standardization and open source". LNCS 4394. 374-384. Cicling 2007.
  • Alegria I., Díaz de Ilarraza A., Labaka G., Lersundi M., Mayor A., Sarasola K., M. Forcada, S. Ortiz, L. Padró (2005) "An Open Architecture for Transfer-based Machine Translation between Spanish and Basque". In Proceedings of the MT Summit X Workshop on Open-Source Machine Translation Workshop.

Kanpo loturak[aldatu | aldatu iturburu kodea]