IXA pipes

Wikipedia, Entziklopedia askea
Jump to navigation Jump to search
IXA pipes
Garatzailea Ixa Taldea
Informazio orokorra
Sistema eragilea Sistema anitzetan (Linux, Windows eta OS X)
Data 2014
Programazio-lengoaia Java
Lizentzia Apache License 2.0 (APL 2.0). lizentzia
Euskaraz Bai
[1]
Testuak automatikoki analizatzeko Ixa-pipes tresnen arkitektura.

IXA pipes testuak automatikoki lantzeko hainbat tresna informatikoz osatutako multzo bat da, hizkuntzaren prozesamenduan hainbat hizkuntzatarako erabil daitekeena.[1][2]

Ixa Taldeak sortu zuen 2014an eta software librea da (Apache lizentzia 2.0). Euskararako Ixa pipes katearekin lortzen den prozesamendu linguistikoa bestela ere egin daiteke IxaKat tresnekin ere. Izan ere, Ixa pipes hizkuntzaren prozesamendurako hainbat tresna eleaniztunen sorta bat da, eta baditu hainbat tresna euskararen prozesamendurako. IxaKat eta IXA pipes kateak modularrak direnez, eta biek NAF formatua erabiltzen dutenez sarrera/irteera formatu moduan, bi multzotako tresnak konbinatu daitezke prozesamendu-kate berean.

Ixa-pipes multzoko tresna nagusiak hauek dira:

  • ixa-pipe-tok: Tokenizatzailea eta segmentatzailea hainbat hizkuntzatarako. Testu bateko hitzak, puntuazio-markak, zenbakiak eta antzeko osagaiak banatzen dituena
  • ixa-pipe-pos: Testu bateko hitz bakoitzaren lema eta kategoria lortzea (adjektibo, izen, aditz...). Ingelesez lemmatizer eta POS tagging esaten zaie tresna horiei. Erabil daiteke hizkuntza hauekin: euskara, herbeherera, ingelesa, frantzesa, galiziera, alemana, italiera eta espainiera.
  • ixa-pipe-nerc: Entitate izendunak errekonozitzen ditu eta testuan etiketatzen dtu. Ingelesez Named Entity Recognition tagger esaten zaie tresna horri. Erabil daiteke hizkuntza hauekin: euskara, herbeherera, ingelesa, alemana, italiera eta espainiera.
  • Iritzi-helburuen erauketa. Ingeleserako bakarrik.
  • ixa-pipe-chunk: Zati sintaktiko bakoitza bereiztea. Erabil daiteke hizkuntza hauekin: euskara eta ingelesa. Estatistikoki detektatzen ditu sintagma mailako osagai sintaktiko sinpleak).
  • ixa-pipe-parse: Probabilistic constituent parser for Spanish and English.

Erreferentziak[aldatu | aldatu iturburu kodea]

  1. (Ingelesez)  Agerri, Rodrigo, «IXA pipes: Efficient and Ready to Use Multilingual NLP tools.» (PDF), Language Resources and Evaluation Conference (LREC2014),, . Noiz kontsultatua: 2018-03-06 .
  2. (Ingelesez)  IXA pipes: ready to use NLP tools, . Noiz kontsultatua: 2018-03-06 .

Kanpo loturak[aldatu | aldatu iturburu kodea]