IXA pipes

Wikipedia, Entziklopedia askea
Jump to navigation Jump to search
Testuak automatikoki analizatzeko Ixa-pipes tresnen arkitektura.

IXA pipes testuak automatikoki lantzeko hainbat tresna informatikoz osatutako multzo bat da, hizkuntzaren prozesamenduan hainbat hizkuntzatarako erabil daitekeena.[1][2]

Ixa Taldeak sortu zuen 2014an eta software librea da (Apache lizentzia 2.0). Ixa pipes katearekin lortzen den prozesamendu linguistikoa IXAKat tresnekin ere osatu daiteke. Izan ere, Ixa pipes hizkuntzaren prozesamendurako hainbat tresna eleaniztunen sorta bat da, eta baditu hainbat tresna euskararen prozesamendurako. ixaKat eta IXA pipes kateak modularrak direnez, eta biek NAF formatua erabiltzen dutenez sarrera/irteera formatu moduan, bi multzotako tresnak kateatu daitezke prozesamendu-kate berean.

Multzoko tresna nagusiak hauek dira:

  • ixa-pipe-tok: Tokenizatzailea eta segmentatzailea hainbat hizkuntzatarako. Testu bateko hitzak, puntuazio-markak, zenbakiak eta antzeko osagaiak banatzen dituena
  • ixa-pipe-pos: Testu bateko hitz bakoitzaren lema eta kategoria lortzea (adjektibo, izen, aditz...). Ingelesez lemmatizer eta POS tagging esaten zaie tresna horiei. Erabil daiteke hizkuntza hauekin: euskara, herbeherera, ingelesa, frantzesa, galiziera, alemana, italiera eta espainiera.
  • ixa-pipe-nerc: Entitate izendunak errekonozitzen ditu eta testuan etiketatzen dtu. Ingelesez Named Entity Recognition tagger esaten zaie tresna horri. Erabil daiteke hizkuntza hauekin: euskara, herbeherera, ingelesa, alemana, italiera eta espainiera.
  • Iritzi-helburuen erauketa. Ingeleserako bakarrik.
  • ixa-pipe-chunk: Zati sintaktiko bakoitza bereiztea. Erabil daiteke hizkuntza hauekin: euskara eta ingelesa. Estatistikoki detektatzen ditu sintagma mailako osagai sintaktiko sinpleak).
  • ixa-pipe-parse: Probabilistic constituent parser for Spanish and English.

Erreferentziak[aldatu | aldatu iturburu kodea]

  1. (Ingelesez)  Agerri, Rodrigo, «IXA pipes: Efficient and Ready to Use Multilingual NLP tools.» (PDF), Language Resources and Evaluation Conference (LREC2014),, http://www.lrec-conf.org/proceedings/lrec2014/pdf/775_Paper.pdf. Noiz kontsultatua: 2018-03-06 .
  2. (Ingelesez)  IXA pipes: ready to use NLP tools, http://ixa2.si.ehu.es/ixa-pipes/. Noiz kontsultatua: 2018-03-06 .

Kanpo loturak[aldatu | aldatu iturburu kodea]