Wikiproiektu:Ieproba

Wikipedia, Entziklopedia askea

Sarrera[aldatu iturburu kodea]

Hemen topatuko duzun edukia, euskaraz argitaratzen duten hainbat hedabide digitaletatik erauzia dago. Euskarazko albiste bakoitzaren pertsonen izen entitateak automatikoki jaso dira, asteko pertsonaia aipatuenak zentzuk diren erakusteko aukera emanez. Astelehenero, pasa den asteko 10 entitate nabarmenenak automatikoki publikatuko dira. Horretarako, azkeneko asteko izen entitateak bestelako izen entitate guztiekin konparatzen dira, berrienak direnak aukeratuz. Azkeneko lau asteetako pertsonaiak etengabe eguneratzen joango dira eta zaharragoak direnak bukaerako menu zabalgarrian gordeta geratuko dira. Horrez gain, bistaraketa interaktibo bat sortu da, pertsonaia berri zein ohikoen arteko erlazioak erakusten dituena. [1]

Metodologia[aldatu iturburu kodea]

Lan honen sorkuntzan erabilitako metodologiak hainbat pausu ditu: hedabide digitalen identifikazioa, hedabideen entzuketa bitartez albisteak jasotzea, albisteetatik izen entitateak erauztea eta azkeneko astean nabarmenak izan diren entitateen aukeraketa.

  • Euskarazko hedabideen eskuzko identifikazioa: Euskal Herrian euskaraz aritzen diren 8 komunikabide digital identifikatu dira.
  • Hedabideen entzuketa: MSM crawlerra erabili da hedabideen RSS loturak jasotzeko. Hedabide ezberdinetatik berri jarioa jaso, garbitu eta gorde da corpus batean. Jasotako albiste bakoitzetik egunkaria, data, hizkuntza, titularra, edukia eta lotura gorde dira.
  • Izen entitateen erauzketa: Lehenik eta behin, entzuketan euskarazko, gaztelerazko eta frantsesezko albisteak lortzen direnez, soilik euskarazko albisteak aukeratuko dira, beste guztiak alboratuz. Euskarazko albiste bakoitzaren edukia tokenizatu, lematizatu eta izen entitateen detektoreaz aztertu da. Hiru fase hauetatik eratorritako entitate izendunak jaso ostean, albiste bakoitzaren izen entitateak gorde dira.
  • Izen entitateen aukeraketa: Euskarazko albiste guztietatik, izen entitate berrienak eta nabarmenenak aukeratzeko tf-idf banaketan oinarritu gara. Banaketa horri esker, azkeneko asteko izen entitateak beste guztiekin konparatzen dira, ohikoak diren izen entitateak alboratu eta azkeneko astean nabarmenak direnak jasotzeko asmoz.

Esteka interaktiboa[aldatu iturburu kodea]

Astero adierazgarrienak diren Izen Entitateak aurkitzeaz gain, interesgarria iruditu zaigu bistaraketa berezi bat proposatzea izen entitateen maiztasuna eta berritasuna haintzat hartzen dituena. Scattertext teknikari esker, izen entitate berrienak nabarmendu ahalko ditugu zaharrenetatik. Horrez gain izen entitate aipatuenak eta gutxi aipatuenen arteko ezberdintasuna ikusi ahal izango da aldi berean. Adierazpen grafiko hau egunero berrituko da, iragandako 7 egunetako datuak eta azkeneko hilabeteko datuak konparatuta, izen entitateak sailkatu eta agerpenen iturria ikusteko aukera emanez.

Bistaraketaren adierazpen grafikoan izen entitateen banaketa topatu dezakegu, denboraren eta agerpen kopuruaren arabera. Era honetan, bi dimentsioetako grafikoaren goiko erdian estitate berri eta ohikoenak topatu ditzakegu. Aldi berean, grafikoaren eskubi aldean estitate zahar ohikoenak topatuko dira. Halaber, entitate berri aipatuenak grafikako goiko eskubiko koadrantean aurkitu ahal izango ditugu, azkeneko astean aipatuenak izan diren entitateak izango dira hauek. Bestalde, ezkerreko goiko koadrantean beti aipatuak diren entitateak kokatuko dira, hau da, ohikoenak. Eskubiko beheko koadrantean, ostera, albiste zaharretan ohikoak izan diren eta albiste berrietan agerpen txikia daukatenak azaltzen dira.

Bistaratze sistema honek izen entitateen bilatzaile bat dauka ere, entitatea grafikoan kokatzeaz gain, bere agerpen guztiak emango dizkigu. Agerpenetan egunkaria, eguna, albistera lotura eta albistean agertzen diren bestelako entitateak edukiko ditugu. Era honetan, entitate bakoitzaren informazio ahalik eta osatuena lortuko dugu, bere agerpenen testuingurua erakutsiko duen bistaratze bat eskainiz.

MAPA INTERAKTIBORA ESTEKA

2020-11-30ko asteko izen entitateak[aldatu iturburu kodea]

Izena Wikidata en wiki ca wiki es wiki fr wiki ZIRRIBORROA
Diego Armando Maradona d:Q17515 en:Diego Armando Maradona ca:Diego Armando Maradona es:Diego Armando Maradona fr:Diego Armando Maradona Zirriborroa
Oier Oa
Alfonso Zenon
Haritz Larrañaga Altuna
Beñat Egiarte
Zenon d:Q189664 en:Zenon es:Zenon fr:Zenon Zirriborroa
Astrazeneca
You Tuberra
Haranburur
Ana Arregi

2020-11-23ko asteko izen entitateak[aldatu iturburu kodea]

Izena Wikidata en wiki ca wiki es wiki fr wiki ZIRRIBORROA
Gaizka Astorkizaga
Valentina Morisolli
Aran Santamaria
Andrei Fuchs
Miren Balmaseda
Valentilla Morisolli
Amaia Larruzea
Inazio Arregi
Maialen Arteaga
Fauveau d:Q56538348 en:Fauveau fr:Fauveau Zirriborroa

2020-11-16ko asteko izen entitateak[aldatu iturburu kodea]

Izena Wikidata en wiki ca wiki es wiki fr wiki ZIRRIBORROA
Nerea Ibarzabal Salegi
James Erskin
Zihara Jainaga Larrinaga
Miguel Salvador
Miel A Elustondo
Oier Aranzabale
Ezkieta
Peio Alcantarilla
Asier Maia Anabitarte
Zvezda d:Q341054 en:Zvezda es:Zvezda fr:Zvezda Zirriborroa

2020-11-09ko asteko izen entitateak[aldatu iturburu kodea]

Izena Wikidata en wiki ca wiki es wiki fr wiki ZIRRIBORROA
Amagoia Gurrutxaga Uranga
Garbine Ubeda
Bengoetxea VI.
Marije Insausti
November d:Q125 en:November ca:November es:November fr:November Zirriborroa
Enekoitz Telleria Sarriegi
Jerome Peters
Ana Maria Garcia Garcia
Bengoetxea Vi.a
Ismael Manterola Ispizua

Bestelakoak[aldatu iturburu kodea]

Erreferentziak[aldatu iturburu kodea]