Bitextor

Wikipedia, Entziklopedia askea

Bitextor kode irekiko aplikazio aske bat da. Bere helburua, hizkuntz aunitzeko web orrialdeak oinarrizko corpus gisa hartuz, itzulpen memoriak sortzean datza. Bitextor GNU GPL v2 baimenaz argitaratua dago.

Aplikazioak erabiltzaileak agindutako webgunetik HTML fitxategi guztiak deskargatu eta aurreprozesatze bidez hurrengo faseetarako formatu aproposetara bilakatzen ditu. Jarraian, heuristiko multzo bat (batez ere HTML etiketen egituran eta testu-katearen luzeran oinarriturik) aplikatzen zaio, fitxategi bikoteak sortu eta hauek, testu bera hizkuntz ezberdinetan izateko hautagai bilakatuz. Hautagai hauetan oinarriturik, TMX formatuko itzulpen memoriak garatzen dira LibTagAligner liburutegiari esker, non HTML etiketak eta testu-blokeen luzera erabiltzen diren lerrokatzea gauzatzeko.

Tresna honen helburua internet bidez hizkuntz aunitzeko corpusak lortzeko erraztasuna ematea da. Hasiera batean, Bitextor itzulpen automatikorako aplikazioak trebatzeko prozesua errazteko sortua izan zen, Apertium plataformarena zehazki.

Ikus, gainera[aldatu | aldatu iturburu kodea]

Kanpo estekak[aldatu | aldatu iturburu kodea]