Wikiproiektu:Ieproba
Sarrera
[aldatu | aldatu iturburu kodea]Hemen topatuko duzun edukia, euskaraz argitaratzen duten hainbat hedabide digitaletatik erauzia dago. Euskarazko albiste bakoitzaren pertsonen izen entitateak automatikoki jaso dira, asteko pertsonaia aipatuenak zentzuk diren erakusteko aukera emanez. Astelehenero, pasa den asteko 10 entitate nabarmenenak automatikoki publikatuko dira. Horretarako, azkeneko asteko izen entitateak bestelako izen entitate guztiekin konparatzen dira, berrienak direnak aukeratuz. Azkeneko lau asteetako pertsonaiak etengabe eguneratzen joango dira eta zaharragoak direnak bukaerako menu zabalgarrian gordeta geratuko dira. Horrez gain, bistaraketa interaktibo bat sortu da, pertsonaia berri zein ohikoen arteko erlazioak erakusten dituena. [1]
Metodologia
[aldatu | aldatu iturburu kodea]Lan honen sorkuntzan erabilitako metodologiak hainbat pausu ditu: hedabide digitalen identifikazioa, hedabideen entzuketa bitartez albisteak jasotzea, albisteetatik izen entitateak erauztea eta azkeneko astean nabarmenak izan diren entitateen aukeraketa.
- Euskarazko hedabideen eskuzko identifikazioa: Euskal Herrian euskaraz aritzen diren 8 komunikabide digital identifikatu dira.
- Hedabideen entzuketa: MSM crawlerra erabili da hedabideen RSS loturak jasotzeko. Hedabide ezberdinetatik berri jarioa jaso, garbitu eta gorde da corpus batean. Jasotako albiste bakoitzetik egunkaria, data, hizkuntza, titularra, edukia eta lotura gorde dira.
- Izen entitateen erauzketa: Lehenik eta behin, entzuketan euskarazko, gaztelerazko eta frantsesezko albisteak lortzen direnez, soilik euskarazko albisteak aukeratuko dira, beste guztiak alboratuz. Euskarazko albiste bakoitzaren edukia tokenizatu, lematizatu eta izen entitateen detektoreaz aztertu da. Hiru fase hauetatik eratorritako entitate izendunak jaso ostean, albiste bakoitzaren izen entitateak gorde dira.
- Izen entitateen aukeraketa: Euskarazko albiste guztietatik, izen entitate berrienak eta nabarmenenak aukeratzeko tf-idf banaketan oinarritu gara. Banaketa horri esker, azkeneko asteko izen entitateak beste guztiekin konparatzen dira, ohikoak diren izen entitateak alboratu eta azkeneko astean nabarmenak direnak jasotzeko asmoz.
Esteka interaktiboa
[aldatu | aldatu iturburu kodea]Astero adierazgarrienak diren Izen Entitateak aurkitzeaz gain, interesgarria iruditu zaigu bistaraketa berezi bat proposatzea izen entitateen maiztasuna eta berritasuna haintzat hartzen dituena. Scattertext teknikari esker, izen entitate berrienak nabarmendu ahalko ditugu zaharrenetatik. Horrez gain izen entitate aipatuenak eta gutxi aipatuenen arteko ezberdintasuna ikusi ahal izango da aldi berean. Adierazpen grafiko hau egunero berrituko da, iragandako 7 egunetako datuak eta azkeneko hilabeteko datuak konparatuta, izen entitateak sailkatu eta agerpenen iturria ikusteko aukera emanez.
Bistaraketaren adierazpen grafikoan izen entitateen banaketa topatu dezakegu, denboraren eta agerpen kopuruaren arabera. Era honetan, bi dimentsioetako grafikoaren goiko erdian estitate berri eta ohikoenak topatu ditzakegu. Aldi berean, grafikoaren eskubi aldean estitate zahar ohikoenak topatuko dira. Halaber, entitate berri aipatuenak grafikako goiko eskubiko koadrantean aurkitu ahal izango ditugu, azkeneko astean aipatuenak izan diren entitateak izango dira hauek. Bestalde, ezkerreko goiko koadrantean beti aipatuak diren entitateak kokatuko dira, hau da, ohikoenak. Eskubiko beheko koadrantean, ostera, albiste zaharretan ohikoak izan diren eta albiste berrietan agerpen txikia daukatenak azaltzen dira.
Bistaratze sistema honek izen entitateen bilatzaile bat dauka ere, entitatea grafikoan kokatzeaz gain, bere agerpen guztiak emango dizkigu. Agerpenetan egunkaria, eguna, albistera lotura eta albistean agertzen diren bestelako entitateak edukiko ditugu. Era honetan, entitate bakoitzaren informazio ahalik eta osatuena lortuko dugu, bere agerpenen testuingurua erakutsiko duen bistaratze bat eskainiz.
MAPA INTERAKTIBORA ESTEKA
2020-11-30ko asteko izen entitateak
[aldatu | aldatu iturburu kodea]Izena | Wikidata | en wiki | ca wiki | es wiki | fr wiki | ZIRRIBORROA |
Diego Armando Maradona | d:Q17515 | en:Diego Armando Maradona | ca:Diego Armando Maradona | es:Diego Armando Maradona | fr:Diego Armando Maradona | Zirriborroa |
Oier Oa | ||||||
Alfonso Zenon | ||||||
Haritz Larrañaga Altuna | ||||||
Beñat Egiarte | ||||||
Zenon | d:Q189664 | en:Zenon | es:Zenon | fr:Zenon | Zirriborroa | |
Astrazeneca | ||||||
You Tuberra | ||||||
Haranburur | ||||||
Ana Arregi |
2020-11-23ko asteko izen entitateak
[aldatu | aldatu iturburu kodea]Izena | Wikidata | en wiki | ca wiki | es wiki | fr wiki | ZIRRIBORROA |
Gaizka Astorkizaga | ||||||
Valentina Morisolli | ||||||
Aran Santamaria | ||||||
Andrei Fuchs | ||||||
Miren Balmaseda | ||||||
Valentilla Morisolli | ||||||
Amaia Larruzea | ||||||
Inazio Arregi | ||||||
Maialen Arteaga | ||||||
Fauveau | d:Q56538348 | en:Fauveau | fr:Fauveau | Zirriborroa |
2020-11-16ko asteko izen entitateak
[aldatu | aldatu iturburu kodea]Izena | Wikidata | en wiki | ca wiki | es wiki | fr wiki | ZIRRIBORROA |
Nerea Ibarzabal Salegi | ||||||
James Erskin | ||||||
Zihara Jainaga Larrinaga | ||||||
Miguel Salvador | ||||||
Miel A Elustondo | ||||||
Oier Aranzabale | ||||||
Ezkieta | ||||||
Peio Alcantarilla | ||||||
Asier Maia Anabitarte | ||||||
Zvezda | d:Q341054 | en:Zvezda | es:Zvezda | fr:Zvezda | Zirriborroa |
2020-11-09ko asteko izen entitateak
[aldatu | aldatu iturburu kodea]Izena | Wikidata | en wiki | ca wiki | es wiki | fr wiki | ZIRRIBORROA |
Amagoia Gurrutxaga Uranga | ||||||
Garbine Ubeda | ||||||
Bengoetxea VI. | ||||||
Marije Insausti | ||||||
November | d:Q125 | en:November | ca:November | es:November | fr:November | Zirriborroa |
Enekoitz Telleria Sarriegi | ||||||
Jerome Peters | ||||||
Ana Maria Garcia Garcia | ||||||
Bengoetxea Vi.a | ||||||
Ismael Manterola Ispizua |
Bestelakoak
[aldatu | aldatu iturburu kodea]- 2020-11-02ko astea
- 2020-10-26ko astea
- 2020-10-19ko astea
- 2020-10-12ko astea
- * Kepa Arkauz
- * Imanol Jaio
- * Vini Zabu
- * Igor Uriarte
- * Androni
- * Jonathan Caicedo
- * Marco Frapporti
- * Demare
- * Gluck
- * Rice
- 2020-10-05ko astea
- 2020-09-28ko astea
- 2020-09-21ko astea
- 2020-09-14ko astea
- 2020-09-07ko astea
- * Gonzalez Sola
- * Ineos
- * Julian Alaphilippe
- * Wout Van Aert
- * Peter Sagan
- * Alestis
- * Roglic
- * Adam Yates
- * Yates
- * Acitur
- 2020-08-31ko astea
- 2020-08-03ko astea
- * Alfredo Alzueta
- * Hugh Elliot
- * Jho Low
- * Kuala Lumpur
- * Najib
- * Jho
- * Najib Razak
- * Iban Apaolaza
- * Raul Angel Fuentes
- * Aitor Fresnedo
- 2020-07-27ko astea
- 2020-07-20ko astea
- 2020-07-13ko astea
- 2020-07-06ko astea
- 2020-06-29ko astea
- * Xabin Makazaga
- * Rocio de Meer
- * Aretxabaleta
- * Prieto
- * Jaka Albisu
- * Maneros
- * Jose maria Zabala
- * Alizia Iribarren
- * Polonara
- * Heiz
- 2020-06-22ko astea
- 2020-06-15ko astea
- 2020-06-08ko astea
- * Elhadji Ndiaye
- * Floydi
- * Baden
- * Michael Baden
- * Jeorge Floyd
- * ´brien
- * Chauvin
- * Ndiaye
- * Tou Thao
- * Serrano Izko
- 2020-06-01ko astea
Erreferentziak
[aldatu | aldatu iturburu kodea]- ↑ «Euskarazko on-line artikuluetan aipatutako izendun entitate nabarmenen identifikazioa denbora errealean | Ixa taldea» www.ixa.eus (Noiz kontsultatua: 2022-07-18).