Terminologia erauzketa

Wikipedia, Entziklopedia askea

Terminologia erauzketa (ingelesez, terminology extraction) informazio erauzketaren barne dagoen arlo bat da. Terminologia erauzketaren helburua corpus bat oinarri izanik, automatikoki termino garrantzitsuak eskuratzean datza.

Komunitate birtual bateko gai baten ezagutza irudikatzeko lehen pausoetako bat gai horretarako termino garrantzitsuekin berbategi bat osatzea da. Dokumentu sorta baten oinarrituz gai baten inguruko termino garrantzitsuak eskuratzeko metodo ezberdinak definitu izan dira.

Orokorrean, terminologia automatikoki erauzteko, termino hautagaiak ateratzen dituzten prozesagailu linguistikoak erabili ohi dira. Ondoren, hautagaien zerrenda horretatik termino batzuk kentzen dira metodo estatistikoak eta ikasketa automatikoan oinarritutakoak erabilpenaren bitartez iragaziz. Terminologia erauztea oso baliagarria da antzekotasun semantiko eta ezagutzaren kudeaketa bezalakoetan oinarri bezala izateko.

Ikus, gainera[aldatu | aldatu iturburu kodea]

Kanpo estekak[aldatu | aldatu iturburu kodea]