Arantza Diaz de Ilarraza Sanchez

Wikipedia, Entziklopedia askea
Arantza Diaz de Ilarraza» orritik birbideratua)
Arantza Diaz de Ilarraza Sanchez

Bizitza
Jaiotzako izen-deiturakArantza Díaz de Ilarraza Sánchez
JaiotzaDonostia1957ko apirilaren 18a (67 urte)
Herrialdea Gipuzkoa, Euskal Herria
Hezkuntza
HeziketaEuskal Herriko Unibertsitatea
Donostiako Informatika Fakultatea
Tesi zuzendariaFelisa Verdejo
Doktorego ikaslea(k)Eneko Agirre
Xabier Arregi Iparragirre
Bertol Arrieta
Montse Maritxalar Anglada
Aingeru Mayor
Gorka Labaka
Maite Oronoz Antxordoki
Itziar Gonzalez-Dios
Maxux Aranzabe
Itziar Aduriz Agirre
Mikel Iruskieta Quintian
Begoña Altuna
Nora de la Serna
Julián Gutiérrez Serrano
Jose Angel Vadillo
Hizkuntzakgaztelania
euskara
Jarduerak
Jarduerakinformatikaria eta unibertsitateko irakaslea
Enplegatzailea(k)Euskal Herriko Unibertsitatea
Donostiako Informatika Fakultatea
Lan nabarmenak
Jasotako sariak
KidetzaUdako Euskal Unibertsitatea
Ixa taldea
Sociedad Española para el Procesamiento del Lenguaje Natural
Erasmus mundus programme: an european oportunity for students and scholars (en) Itzuli

Inguma: Arantza-Diaz-de-Ilarraza-Sanchez

Arantza Díaz de Ilarraza Sánchez (Donostia, 1957ko apirilaren 18a) Euskal Herriko Unibertsitateko irakasle osoa da. Donostiako Informatika Fakultatean lan egin du 1981etik 2023an erretiratu den arte.[1][2]

Euskal Herrian aitzindaria izan da Hizkuntzaren Prozesamenduaren eta Adimen Artifizialaren arloetan. 1990eko bere tesia arloko lehenetakoa izan zen.[3] Arlo horretan bide-urratzailea eta ekintzailea izan da, eta eragin nabarmena izan du Euskal Herriko nahiz nazioarteko hainbat erakunderen eta ikerkuntza-sareren sorreran eta bilakaeran.

Ixa Taldearen sortzailea izan zen Iñaki Alegria, Xabier Arregi Iparragirre, Xabier Artola Zubillaga eta Kepa Sarasolarekin batera, eta taldearen koordinatzailea izan da hasiera-hasieratik, 30 urtean.[4] Nabarmentzekoa da ibilbide osoan taldeari eman dion garrantzia eta lortu duen proiekzioa. Ixa Taldea erreferentziazkoa izan da eta da aipatutako arloan, nola Euskal Herrian hala nazioartean. Ikerketa-lan horrek gizartean eta, batez ere, euskal komunitatean eta euskal kulturan izan duten eragina ere nabarmentzekoa da. Xuxen zuzentzaile ortografikoa eta itzultzaile automatikoak dira tresna ezagunenak, baina badira beste asko ere. Hori dena aitortu zuen, besteak beste, 2013an jasotako Abbadia Sariak.[5][6]

2018an HiTZ ikerketa-zentroa sortu zuen, Ixa eta Aholab taldeen indarrak batuz, eta bera izan zen zentroaren lehen zuzendaria, Eneko Agirrek eta German Rigauk 2020an ardura hori hartu zuten arte.[1][7] Hizkuntza-teknologia ardatz duen zentro berri horretan 63 ikertzailek egiten dute lan 2021ean.

Lan aparta egin du adituak eta doktoreak formatzen hizkuntzaren prozesamenduaren arloan. Zuzendu dituen 14 tesietatik harantzago,[8] arloko hainbat doktorego-programaren arduraduna izan da; guztira 55 tesi irakurri ziren euskaraz lerro honetan, 1988tik 2021era. Bestalde, Hizkuntzaren Azterketa eta Prozesamendua / Language Analysis and Processing masterraren zuzendaria ere izan da; master-titulu hori euskaraz eman izan da hasieratik, eta ingelesez 2014tik aurrera, Erasmus Mundus mailako master gisa. Guztira ia 200 lagun dira master horietatik sortu diren adituak. 2012an, UPV/EHUko Master eta Doktorego Eskolako idazkari akademikoa ere izan zen.

Bizialdia[aldatu | aldatu iturburu kodea]

Donostiako Amara Zaharra auzoan jaio zen. Haurtzaroan Venezuelan bizi izan zen, gurasoak bertara lanera joanda, eta bost urte zituela itzuli zen Donostiara. Ikasketak Donostiako Santa Teresa ikastetxean eta Usandizaga institutuan egin zituen, eta gero informatika ikasi zuen, artean Informatika Zentro eta gerora Donostiako Informatika Fakultatea izango zenean. Karrera egiten zuen bitartean euskaldundu zen.

1979an lortu zuen Informatikako Lizentziatura, eta handik bi urtera hasi zen irakasle fakultatean bertan. 1983an egin zuen graduko tesina eta 1990ean defendatu zuen Informatikako doktoretza-tesia, betiere Euskal Herriko Unibertsitateko Informatika Fakultatean.[9]

Egun, Alkizan bizi da.

Irakasle osoa[aldatu | aldatu iturburu kodea]

Irakasle kontratatuen artean gorengo maila den irakasle oso kategoriako lehen emakumea izan zen UPV/EHUn, 2013an. Karrera zientifiko eta teknologikoetan gizonen eta emakumeen arteko parekotasuna benetakoa izan dadin, nesken interesa txikitatik pizteko beharra aldarrikatzen du, baita emakume erreferenteak ezagutzera ematekoa ere.[10] Bestalde, berak sortutako ikerketa-taldean, eta bere argitalpen zientifikoetan agertzen diren egilekideak aztertuta, emakume eta gizonen arteko proportzioa oso gertu dago parekidetasunetik, ingeniaritzetan ohikoa ez bada ere.

Euskara unibertsitatean sartzeko prozesuaren barruan hainbat irakasgai irakatsi ditu euskaraz, eta horien artean ekarpen handiena egin zuen Programazioaren Metodologia I (93/94), Programazioaren Metodologia II (91/92) eta Hizkuntzaren Prozesamendua (1996/97) irakasgaiak euskaratzen.[11][12][13]

Kudeatzailea eta antolatzailea[aldatu | aldatu iturburu kodea]

Informatika Fakultatea

Díaz de Ilarrazak ibilbide luzea egin du unibertsitate-kudeaketan. Honako kargu hauek izan ditu UPV/EHUn: Lengoaia eta Sistema Informatikoak Sailaren zuzendaria (1985-1987), UPV/EHUko Informatika Fakultateko Ikerkuntzarako eta Kanpo-Harremanetarako dekanordea (1992-1996). Horrez gain, Fakultate Batzarreko kidea izan da eta hainbat kudeaketa-batzordetan parte hartu du luzaro.

Ixa Taldea 2008an, Arantza aurrean.

Gorago esan bezala, IXA taldearen sortzaileetako bat izan zen 1988an. 2002an, ELEKA SL spin-off enpresaren sorrera bultzatu zuen, UPV/EHUko Ixa Taldearen eta Elhuyar Fundazioaren arteko lankidetzaren ondorioz. 2018an, berriz, HITZ ikerketa-zentroaren sortzaile eta lehen zuzendaria izan zen.[1]

Hitz Zentroaren lehen zuzendaria (2018)

Adituak eta doktoreak hezten eragile[aldatu | aldatu iturburu kodea]

Díaz de Ilarrazaren tesi-zuhaitz partzial bat[14][15] Emakume eta gizonen arteko proportzioa oso gertu dago parekidetasunetik (emakumeen nodoak kolore gorrian, gizonezkoenak urdinez).

Berak pertsonalki 14 doktorego-tesi zuzendu ditu eta 4 ikaslibururen egilekidea izan da.[16][15] Baina berak zuzendu dituen tesietatik harantzago, 1991. urteaz geroztik Lengoaia eta Sistema Informatikoak Sailak sustatutako hainbat doktorego-programaren irakaskuntza-arduraduna eta partaidea izan da, eta 2006tik aurrera, berriz, master honen arduraduna: HAP: Hizkuntzaren Azterketa eta Prozesamendua / LAP: Language Analysis and Processing, baita izen bera duen doktorego-programarena ere.

Unibertsitateko graduen mailatik harantzago, hizkuntza-teknologian profesional adituak eta doktoreak hezten eragile nagusia izan da bere tesia bukatu zuenetik. Hasieran, gai hori lantzen zuten doktorego-ikastaro espezifikoak emanez; gero, 2001 eta 2006 urteen artean, UEUren eta UPV/EHUren artean sortu zuten Hizkuntza eta Teknologia (HIZTEK) berezko tituluaren proposatzaile, batzorde akademikoko kide eta irakasle izan zen. Eta, azkenik, 2006tik aurrera Hizkuntzaren Azterketa eta Prozesamendua master ofizialaren arduraduna izan da. Euskaraz eman izan da master-titulu hori hasieratik, eta ingelesez 2014tik aurrera, ordudanik koordinatu izan baita Europa mailako Language and Communication Technology Erasmus Mundus masterrarekin, zeinetan Díaz de Ilarraza batzordekide izan baita. Nazioarteko partzuergo zabal batean integratuta, partzuergoan oro har ematen den ingelesaren ikuspuntu globalaz gain, baliabide gutxiko hizkuntza baten ikuspegia gehitzen diote UPV/EHUko partaideek master horretan.

2001ean hasitako heziketa-lerro honetan 150 aditu sortu dira. Gaur egun hizkuntza-teknologiaren lan-eremua dinamizatzen ari diren informatikari eta hizkuntzalari gehienak hortik atera dira. Masterrean, hizkuntzaren prozesamenduan ezinbestekoak diren bi arloak uztartzen dira: teknologia, batetik, eta hizkuntzalaritza, bestetik.

Hizkuntzaren Azterketa eta Prozesamendua doktorego-programan guztira 55 tesi irakurri dira euskaraz lerro honetan 1988tik, eta horietako 20 tesi aurkeztu ziren 2012-2017 epean.

Esan bezala, Díaz de Ilarraza UPV/EHUko Master eta Doktorego Eskolako idazkari akademikoa izan zen 2012an.

Ikertzailea[aldatu | aldatu iturburu kodea]

Diaz de Ilarrazaren 50 egilekide, artikulu zientifikoetan (Ixa, Aminer)

Díaz de Ilarrazak 180 liburu-kapitulu argitaratu ditu,[17][18] eta hainbat eta hainbat artikulu estatuko eta nazioarteko aldizkari eta biltzar zientifikoetan, informatikaren, adimen artifizialaren eta hizkuntzalaritza konputazionalaren arloetan. Euskal komunitate zientifikoaren Inguma datu-basean, esaterako, berak euskaraz idatzitako 60 lan baino gehiago agertzen dira.[19]

1990ean defendatu zuen Informatikako doktoretza-tesian hizkuntza naturalezko elkarrizketen kudeaketa aztertu zuen, irakaskuntza adimentsuko sistema batean.[3] Informatikako programak diseinatzen irakasten zuen CAPRA sistema tutore adimendunaren elkarrizketa-sistema bat programatu zuen. Horretarako, ikaslearen mezuak linguistikoki ulertu behar ziren eta irakaskuntza-sistemaren formalizazioa eta modelizazioa lortu behar ziren.[9] Nonbait, hogeita hamar urte geroago hain ospetsu bihurtu ziren chatbotak edo ChatGPT aplikazioen aurrekariak ziren Díaz de Ilarrazaren lan haiek.[2]

Hizkuntzaren prozesamenduaren arloan aritzen den Ixa ikertaldeko ikertzaile nagusia izan da 30 urtean zehar. Ixa Taldea A motako ikerketa-talde gisa onartuta dago Eusko Jaurlaritzan, hau da, gorengo mailan. 1988 eta 2020 urteen artean guztira 14 milioi euroren finantzazioa kudeatu zuen Díaz de Ilarrazak, nazioarteko beste hainbat ikerketa-talderekin lankidetzan; guztira, talde guztien artean, 44 milioi euroren aurrekontua osatuz.[20] Berak koordinatu duen taldearen kide kopurua 30etik gorakoa izan da beti XXI. mendea hasi zenetik. Kopuru hori handituz joan zen, eta 2020an 73 pertsona ziren koordinatzen zituenak.[21]

Ikerketa-lerroak[aldatu | aldatu iturburu kodea]

Ugariak dira Díaz de Ilarrazak ikertzaile moduan landu dituen arloak. Gehienak hizkuntzaren prozesamendu automatikoarekin eta Ixa Taldearekin lotuta badaude ere, sistema tutore adimendunen arloan ere aritu izan da hainbat urtetan, Galan Taldearekin.[22] Hauek dira bere ibilbide osoan jorratu dituen sei ikerlerro nagusiak:

Díaz de Ilarrazaren ikertzailearen artikulu-egilekideen grafoa.[14] Argitalpen guztiak ez dira kontuan hartu, 2020an Wikidatan zeudenak bakarrik. Emakume eta gizonen arteko proportzioa oso gertu dago parekidetasunetik (emakumeen nodoak kolore gorrian, gizonezkoenak urdinez).

Sistema Tutore Inteligenteak (1981tik).[aldatu | aldatu iturburu kodea]

Díaz de Ilarrazaren tesia arlo honetan kokatu zen: Informatikako programak diseinatzen irakasten zuen CAPRA sistema tutore inteligentearen elkarrizketa-sistema bat kudeatzen zuen. Felisa Verdejo informatikari aitzindaria izan zen bere tesi-zuzendaria. Tesia bukatuta, Isabel Fernández de Castrorekin batera gidatu zuen lerro hau, UPV/EHUko Informatika fakultatean, eta Galan ikertaldea sortu zuten. 1989an lehen europar proiektua lortu zuen taldeak. ITSIE: Intelligent Tutoring System for Industrial Environments izeneko proiektu hartan, lankidetzan aritu ziren zentro hauekin: UPV/EHU, Iberdrola, Labein, Heriot Watt University, Marconi (Edinburgo) eta CISE (Italia).

Hiztegi-ezagutzaren erauzketa eta egituraketa (1993-2000).[aldatu | aldatu iturburu kodea]

Xabier Arregi Iparragirreren eta Eneko Agirreren tesiak zuzendu zituen arlo horretan.

Oinarrizko analizatzaile linguistikoak (1994tik)[aldatu | aldatu iturburu kodea]

Hiru tesi zuzendu zituen lerro honetan: Itziar Aduriz (Patxi Goenagarekin batera), Maxux Aranzabe (Joxe Mari Arriolarekin batera) eta Bertol Arrietarena (Iñaki Alegriarekin batera).

Hainbat tresna linguistikoren integrazioa irakaskuntza-ingurune batean (1994tik)[aldatu | aldatu iturburu kodea]

Montse Maritxalarren eta Maite Oronozen tesiak zuzendu zituen arlo horretan, bigarrena Koldo Gojenolarekin batera.

Hizkuntza-tresna informatikoen integrazioa eta testuak linguistikoki etiketatzeko laguntzak (1995etik)[aldatu | aldatu iturburu kodea]

Besteak beste, sintaktikoki etiketatutako EPEC corpusa (EPEC-DEP) sortu zen lan horietatik.

Itzulpen automatikoa (2000tik)[aldatu | aldatu iturburu kodea]

Arantza Diaz de Ilarraza bulegoan(2000)

Díaz de Ilarrazak (Kepa Sarasolarekin batera) zuzendutako Aingeru Mayorren tesiaren emaitza Matxin programa itzultzailea izan zen (2007), euskararako sortu zen lehenengoa. Geroago katalana, galiziera, euskara eta gaztelaniaren arteko itzulpen automatikoa eskaintzen zuen Opentrad kode irekiko sistemaren barruan Matxin itzultzailea ere integratu zen 2009an, itzultzaileak www.opentrad.com web-orrian erabil zitezkeen doan.[23]

Geroago, 2010ean, Gorka Labakaren tesian itzultzaile automatiko estatistiko bat sortu zen.

Paradigma neuronalaren ekarriarekin, 2017az geroztik izugarrizko hobekuntza nabaritu zen hizkuntza nagusien arteko itzulpen automatikoan. Geroxeago, eta arin, euskal munduko ikerkuntza-komunitatea gai izan zen euskaratik eta euskararako itzultzaile neuronalak mundu mailako egoeraren pare jartzeko.

2015ean hasi zen euskararako itzulpen neuronala aztertzen, TADEEP proiektuan.[24] Ordurako Deepl itzultzaileak kalitatezko emaitzak ematen zituen 10 hizkuntzaren arteko itzulpenetan, baina euskara ez zegoen horien artean.[25] Bi urte geroago, baina, lehen emaitza onak lortuta, lehen demoa publikoki eskura zegoen (2017). 2017an bertan, hainbat agente (Ixa Taldea, Elhuyar, Vicomtech, Ametzagaña, Mondragon Lingua...) elkartu eta MODELA izeneko proiektua abiatu zen.[25][26] Beste urtebeteko epean, 2018an, MODELA itzultzailea plazaratu zen, Interneten publiko orokorrerako euskarazko itzulpen neuronala eskaintzen zuen lehen zerbitzua.[7]

Abiada bizian mugitzen ari den arlo honetan, gutxienez beste hiru itzultzaile neuronal gehiago plazaratu dira harrezkero:

  • Eusko Jaurlaritzaren Itzultzaile neuronala: Eusko Jaurlaritzako itzulpen-memoriak erabiliz (IVAP-HAEEk 20 urtetan bildutako 10 milioi "esaldi" baino gehiago).[27]
  • batua.eus: Vicomtech-ek MODELA sisteman hobekuntzak egin zituen (RNN teknologiatik Transformer teknologiara pasatu ziren) eta corpusa handitu zuten.[28][29]
  • Itzultzailea.eus: Elhuyarrek ere antzeko hobekuntzak egin zituen, eta hizkuntza berriak gehitu zituen (ingelesa, frantsesa, espainiera, galegoa eta katalana).[30]

Transferentzia zientifiko aplikatua[aldatu | aldatu iturburu kodea]

Xuxen 2020
Zuzentzaile ortografikoa (Xuxen, 1994) euskara batuaren erabilera normalizatzeko funtsezko tresna.

Díaz de Ilarrazak bere ibilbide zientifikoan ikerketa teorikoa sakonki landu du, eta ehunka argitalpen plazaratu ditu. Baina ikerketa hori ez da argitalpen soiletan geratu. Azterketa teorikoa egitearekin batera, proiektu gehienetan teknologia-transferentzia ere egin du Ixa Taldeak.

Zuzentzaile ortografikoa[aldatu | aldatu iturburu kodea]

Esate baterako, taldeak 1994an plazaratu zituen Xuxen zuzentzaile ortografikoa eta EDBL datu-base lexikala, lexikala, zeinak euskara batuaren erabilera normalizatzeko funtsezko tresna izan baitira harrezkero. Taldekide ziren Iñaki Alegria informatikariaren eta Miriam Urkia hizkuntzalariaren tesiek Xuxen zuzentzaile ortografikoaren oinarri informatikoa eta linguistikoa ezarri zuten.[31][32][33][34]. Baina, aldi berean, Klaudio Harluxetek sortutako Hizkia enpresarekin lankidetzan eta Eusko Jaurlaritzako finantzazioari esker, zuzentzaile hori lehen urratsetako bat izan zen euskara mundu digitalean erabili ahal izateko; 1995 hartan Luistxo Fernandezek idatzitako Leihoak Zabalduz txostenean azaltzen zen hori, urte berean plazaratu baitziren Xuxen eta euskaraz lokalizatutako lehen sistema eragilea ere (Windows 95).

Itzulpengintza automatikoa[aldatu | aldatu iturburu kodea]

Berdin esan daiteke itzulpen automatikoaz.[35] 2000. urtekoak dira taldearen lehen argitalpen zientifikoak gai horretaz, eta gero guztira 100 baino gehiago izan dira.[36] Baina azterketa teorikoak egitearekin batera, teknologia-transferentzia ere egin dute. Matxin programa itzultzailea publikoki aurkeztu zen 2007an, euskararako sortu zen lehenengoa. Geroago, 2010ean, Gorka Labakaren tesian itzultzaile automatiko estatistikoa sortu zuten. Eta horrela, 2017 inguruan, paradigma neuronalaren iraultza zela-eta hizkuntza nagusien arteko itzultzaile automatiko eta izugarrizko hobekuntza lortu zenean, euskal ikertzaileak oso epe motzean (urtebete) gai izan ziren euskararako lehen itzultzaile neuronalak sortzeko.[37]

Transferentzia: produktu erregistratuak[aldatu | aldatu iturburu kodea]

Ixa Taldeak hizkuntza prozesatzeko 27 produktu erregistratu ditu 27 urtetan,[38][39][40] eta produktu horietako 9 hauen garapenean parte-hartze zuzena izan du Díaz de Ilarrazak:

  • 1994: XUXEN, euskararako zuzentzaile ortografiko eta analizatzaile morfologikoa.
  • 1997: EDBL: Euskararen datu-base lexikala. Hiztegi informatiko baten moduko zerbait da, baina hitzez gain, atzizkiak-eta ere hartzen ditu bere barruan. Maiz txarto idazten diren hitzak (Hitz ez estandarrak, esaterako: *eritzi, *iharduera) eta hitz anitzeko unitate lexikalak ere (adarra jo edo Amerikako Estatu Batuak bezalakoak, esaterako) jasotzen ditu. Esanahia barik, item bakoitzaren propietate lexikal eta morfologikoak zehazten ditu sarrera bakoitzak. Informazio hori Xuxen zuzentzaile ortografikoaren eta hizkuntzaren prozesamendurako beste tresna eta aplikazio askoren oinarri lexikala da.
  • EDBL datu-base lexikaleko elementuen proportzioak
  • Hitz ez-estandarrak
    Hitz ez-estandarrak
  • Hiztegi-sarrera, hitz flexionatu eta ez-independenteak
    Hiztegi-sarrera, hitz flexionatu eta ez-independenteak
  • Hitz anitzeko unitate lexikalak
    Hitz anitzeko unitate lexikalak
  • 2001: EUSTAGGER, euskararen lematizatzaile/etiketatzailea. Euskarazko edozein hitz emanda, programa honek hitzaren lema (erroa, hiztegian bilatu beharko litzatekeena), hitzaren kategoria morfologikoa (izena, aditza, adjektiboa...) eta hitzeko atzizkiak identifikatzen ditu. Adibidez: etxekoena hitza emanda, erroa edo lema etxe dela, kategoria izen arrunta dela, eta atzizkiak ko+en+a direla esango luke.[41][42][43]
  • 2003: Basque WordNet / Euskal WordNet. Euskarazko lehen ezagutza-base lexikal edo hiztegi semantiko eleaniztuna da, ingelesezko WordNet eta hizkuntza anitzeko EuroWordNet-en eredua jarraitzen duena. Era honetan, euskal hitzak ingelesezko WordNet-ekoekin lotzen ditu era erdi-automatikoan. Euskal WordNet gaztelaniari, ingelesari, galizierari, portugesari eta katalanari lotuta dago, Multilingual Central Repository errepositorioan (MCR). Beste hizkuntza batzuei lotuta egoteaz gain, Euskal WordNet SUMO eta Top Ontology ontologietara mapeatuta dago. Erabiltzaile arruntei dagokienez, beste hiztegi arruntek eskaintzen dituzten itzulpen elebidunez gain, informazio gehigarria ematen du. Adibidez, pagoa hitza bilatuz gero, zuhaitz mota bat dela eta zehazki zer motatakoa den adierazten du. Sinatzaileak: Itziar Aduriz, Eneko Agirre, Iñaki Alegria, Olatz Ansa, Maxux Aranzabe, Xabier Arregi, Olatz Arregi, Bertol Arrieta, Jose Mari Arriola, Xabier Artola Zubillaga, Aitziber Atutxa, Arantza Díaz de Ilarraza, Nerea Ezeiza, Koldo Gojenola, Mikel Lersundi, Montserrat Maritxalar, David Martinez, Aingeru Mayor, Maite Oronoz, Eli Pociello, Kepa Sarasola, Aitor Soroa, Larraitz Uria eta Ruben Urizar.
  • 2008: IXAti, chunker-a. Euskarako azaleko analizatzaile sintaktikoa. Sinatzaileak: Izaskun Aldezabal, Iñaki Alegria, Maxux Aranzabe, Olatz Arregi, Jose Mari Arriola, Xabier Artola Zubillaga, Kepa Bengoetxea, Klara Ceberio, Arantza Díaz de Ilarraza, Nerea Ezeiza, Koldo Gojenola, Mikel Lersundi, Maite Oronoz eta Ruben Urizar.
  • 2008: Xuxeng, euskarazko testuetarako estilo eta gramatika zuzentzailea. Sinatzaileak: Itziar Aldabe, Bertol Arrieta, Arantza Díaz de Ilarraza, Nerea Ezeiza, Montserrat Maritxalar, Maite Oronoz, Kepa Sarasola eta Larraitz Uria.
  • 2008: libiXaml, anotazio linguistikoak kudeatzeko liburutegia. Sinatzaileak: Xabier Artola Zubillaga, Arantza Díaz de Ilarraza, Kike Fernandez, Koldo Gojenola, Aitor Sologaistoa eta Aitor Soroa.
  • 2012: EUSMT, itzulpen automatiko estatistikoa euskararako. Sinatzaileak: Iñaki Alegria, Arantza Díaz de Ilarraza, Gorka Labaka eta Kepa Sarasola.
  • 2019: EUSRST_TB, euskal RST erlazioez zuhaitz-bankua (testu etiketatua, diskurtso-markekin). Sinatzaileak: Jon Alkorta, Maxux Aranzabe, Arantza Díaz de Ilarraza, Kike Fernandez, Itziar Gonzalez-Dios, Mikel Iruskieta, Mikel Lersundi, Oier Lopez de Lacalle eta Esther Miranda.

Ikerketa-elkarteen sortzaile eta eragilea[aldatu | aldatu iturburu kodea]

Díaz de Ilarrazak estatu mailako eta nazioarteko biltzarrak antolatzen lagundu du, eta horietako askoren Antolakuntza Batzordean eta Batzorde Zientifikoan parte hartu du. Hizkuntzaren Prozesamendurako Espainiako Elkartearen (Sociedad Española para el procesamiento del Lenguaje Natural, SEPLN) zuzendariorde eta elkarteak argitaratzen duen aldizkariaren editore izan zen 1990etik 2004ra bitartean.

Liburuak[aldatu | aldatu iturburu kodea]

  • Hizkuntzalaritza konputazionala. Izaskun Aldezabal Roteta, Jose Mari Arriola Egurrola eta Kepa Sarasola Gabiolarekin (UEU, 2005).[44]
  • Oinarrizko programazioa. Ariketa bilduma. Kepa Sarasola Gabiolarekin (UEU, 1999).[45]
  • Programen egiaztapena eta eratorpena. Xabier Arregi Iparragirre eta Paqui Lucio Carrascorekin (UEU, 1993).[46]
  • Verificación de programas y metodología de la programación (Spanish Edition). Xabier Arregi Iparragirre eta Paqui Lucio Carrascorekin.

Sariak eta errekonozimenduak[aldatu | aldatu iturburu kodea]

Hainbat sari lortu ditu Diaz de Ilarrazak koordinatzen duen Ixa Taldeak; besteak beste hauek:[47]

Ikerketa-proiektu nagusiak[aldatu | aldatu iturburu kodea]

Díaz de Ilarrazak eta Ixa Taldeak 200 ikerketa-proiektu eta 57 ikerketa-kontratu landu dituzte 32 urtetan, eta proiektu horien munta ekonomikoa 12 miloi euro baino handiagoa izan da. Finantziazio horren erdia baino gehiago kanpotik etorri da (% 24,2 Europatik edo Estatu Batuetatik, % 22,4 Madrilgo ministerioetatik eta % 7,3 kontratu eta patenteetatik), eta beste erdia bertako finantziazio-iturrietatik (Eusko Jaurlaritza, UPV/EHU, Aldundiak eta Euskaltzaindia). 200 proiektu horietako 20tan Diaz de Ilarraza izan da ikertzaile nagusia; hain zuzen ere, honako hauetan:

  • 2019: Itzulbide: Testu klinikoak euskaratik eta euskarara egokitzeko itzultzaile automatiko baten garapena eta ezartzea. Osakidetza. Osasun-txostenak gazteleratik euskarara eta euskaratik gaztelerara itzuliko dituen itzultzaile automatiko neuronal baten garapena.
  • 2016PROSA-MED: Testuen prozesamendu semantiko aurreratua, diagnostikoak, prozedurak, kontzeptu medikoak eta beraien arteko erlazioak txosten medikoetatik erauzteko. Madrilgo Ministerio de Economía y Competitividad. Osasun-sektoreak garrantzia handia du gizartearen bizi-kalitaterako eta baita bere diziplinarteko izaeragatik. Egunero, milaka dokumentu mediko sortzen dira osasun-sisteman (ospitaleak, osasun-zentroak), eta testuen analisi automatikorako tresnek aurrerapen handia ekar dezakete, testu horietan dagoen ezagutza prozesatuz. Proiektuan lan horiek egiteko tresna multzo zabala eta eraginkorra sortu ziren: 1) Testu medikoen analisi morfologiko, sintaktiko eta semantikoa. 2) Txosten medikoei CIE-10 kodeketaren bidezko esleipena egiteko tresna. 3) Kontzeptu medikoen arteko erlazioen detekzioa, aurkako erreakzioen detekzioa barne.
  • 2016: UPV/EHU taldea (A motako Eusko Jaurlaritzaren ikerketa-taldea). UPV/EHU.
  • 2016IXA taldea. A motako ikertalde finkatua. Eusko Jaurlaritza.
  • 2014EXTRECM: Kontzeptu medikoen arteko erlazioen erauzketa askotariko informazio-iturrietatik. Madrilgo Ministerio de Economia y Competitividad.
  • 2013: EHU-Azpiegitura 2013: Hizkuntzaren prozesamendurako eta hodei-konputaziorako konputagailu-klusterra. UPV/EHU.
  • 2010: EHU-Azpiegitura 2010: Corpus eta baliabide linguistikoen kudeaketarako zerbitzaria. UPV/EHU.
  • 2010: TIMM sare tematikoa: Tratamiento de Información Multilingüe y Multimodal / Informazio eleaniztun eta multimodalaren tratamendua. MICCINN.
    Isabel Fernandez de Castrok eta Díaz de Ilarrazak elkarrekin zuzendu zuten Europako ITSIE proiektua 1989an.
  • 2010-2015: IXA taldea, A motako ikertalde finkatua. Eusko Jaurlaritza.
  • 2009: RTTH: Hizketa-teknologiako sare tematikoa. MEC.
  • 2008: Itzulpen automatikorako sistema, Matxin. Eleka Ingeniaritza Linguistikoa.
  • 2000-2003: HERMES: Hemeroteka elektronikoetarako informazio-berreskurapen eleaniztun eta informazio-erauzketa semantikoa / Hemerotecas electrónicas: recuperación multilingüe y extracción semántica. Partaideak: CICyT, UPV/EHU, UNED, UPC eta UB.
  • 1996-1999: ITEM: Informazioa berreskuratzeko sistema eleanitza. Partaideak: CICyT, UPV/EHU, UNED eta UPC.
  • 1996: Hizkuntza baten ikaskuntza-prozesuaren ikerketarako sistema adimenduna. Ikaslearen Modelizazioa.
  • 1994: XUXEN: Euskararako zuzentzaile ortografiko eta analizatzaile morfologikoa.[70]
    Xuxen (1994)
  • 1992: HAIN: Hizkuntz aplikazioetarako ingurunea. Eusko Jaurlaritza
  • 1991: Euskararako datu-base lexikal baten diseinua. GFA.[70]
  • 1991: Euskararako analizatzaile morfologiko baten diseinua (GFA).[70] Geroago, Morfologia konputazionala: euskararen morfologiaren deskribapena liburua argitaratu zen proiektuko emaitzekin (2002).[71]
  • 1989-1991: Prestakuntzarako sistema adimendunak industriaguneetan / Intelligent Training Systems in Industrial Environments. Europako Batzordea, FP2-ESPRIT-2. Ikertzaile nagusia, Isabel Fernandez de Castrorekin batera.

Díaz de Ilarrazak zuzendutako Ixa Taldearen nazioarteko harreman-sarea mundu mailako 20 talde baino gehiagorengana hedatu da. Besteak beste, taldea proiektuetan lankidetzan aritu da unibertsitate hauekin: Helsinki, Berlin-UBER, Sidney, Lisboa, Groningen, Bangor, Dublin-DCU, Praga-CUNI, Budapest IICT-BAS, Cuscoko UNSAAC, Bartzelonako UPC eta UB, Deustua, UNED, Valentzia, Alacant, Jaén, Vigo eta Santiago de Compostela. Beste alde batetik, ikerketa-zentro hauekin ere aritu izan da lankidetzan: Sidneyko Health Language Analytics enpresarekin, Santiago de Cubako Centro de Lingüística Aplicada-rekin, German Research Center for Artificial Intelligence DFKI institutuarekin, Clarin sarea, ISCA-SALTMIL (Special Interest Group on Minority Languages), Baionako eta Toulouseko CNRS taldeekin. Eta, azkenik, noski, Euskal Herriko Tecnalia, Elhuyar, Vicomtech, Aholab taldea (UPV/EHU), Euskaltzaindia, UZEI eta Langune klusterreko beste kide guztiekin.

Erreferentziak[aldatu | aldatu iturburu kodea]

  1. a b c Unanue Irureta, Maialen. (2018-12-09). ««Itzultzaile automatiko batek ez du sekula pertsona batek bezala itzuliko»» Berria (Noiz kontsultatua: 2018-12-10).
  2. a b «Arantza Diaz de Ilarraza, adimen artifizialaren aintzindaria Euskal Herrian» EITB 2023-10-13 (Noiz kontsultatua: 2023-10-14).
  3. a b (Gaztelaniaz) Diaz de Illarraza Sanchez, Arantza. (1990). «Gestión de diálogos en lenguaje natural para un sistema de enseñanza inteligente.» www.educacion.gob.es (Teseo, Tesis doctorales) (Noiz kontsultatua: 2018-12-06).
  4. «Emakumeak eta Teknologia .Emakumeen nazioarteko eguna 2014 – UPV/EHU — Unibertsitatea.Net» www.ueu.eus (Noiz kontsultatua: 2023-08-03).
  5. Press, Europa. (2013-12-02). «EHUko IXA Taldeak Anton Abbadia saria jasoko du gaur, euskararen normalizazioan egindako lanarengatik» www.europapress.es (Noiz kontsultatua: 2021-01-24).
  6. «Antton Abbadia saria jaso du gaur iluntzean EHUko Ixa Taldeak (35'50) | EiTB Televisión a la carta» www.eitb.tv (EITB) (Noiz kontsultatua: 2021-01-24).[Betiko hautsitako esteka]
  7. a b «Cathedra Arantza Diaz de Ilarraza» UPV/EHU (Noiz kontsultatua: 2021-01-25).
  8. «MARIA ARANZAZU DIAZ DE ILARRAZA SANCHEZ - 14 tesi, 42 tesi-epaimahai - Universidad del País Vasco / Euskal Herriko Unibertsitatea» ekoizpen-zientifikoa.ehu.eus (Noiz kontsultatua: 2023-05-24).
  9. a b (Gaztelaniaz) Diaz de Ilarraza Sanchez, Arantza. (1990). GESTION DE DIALOGOS EN LENGUAJE NATURAL PARA UN SISTEMA DE ENSEÑANZA INTELIGENTE. UPV/EHU.
  10. SLU, Herritar Berri. (2019-08-22). «Zientzia eta teknologia: gizonen kontua soilik?» GAUR8 (Noiz kontsultatua: 2019-08-28).
  11. Arregi Iparragirre, Xabier; Diaz de Ilarraza Sanchez, Arantza; Lucio Carrasco, Paqui. (1993). Programen egiaztapena eta eratorpena. UEU arg ISBN 978-84-86967-50-5. (Noiz kontsultatua: 2021-01-21).
  12. Diaz de Ilarraza Sanchez, Arantza; Sarasola Gabiola, Kepa. (1999). Oinarrizko programazioa. Ariketa bilduma. UEU arg ISBN 978-84-8438-002-3. (Noiz kontsultatua: 2021-01-21).
  13. Aldezabal Roteta, Izaskun; Arriola Egurrola, Jose Mari; Diaz de Ilarraza Sanchez, Arantza; Sarasola Gabiola, Kepa. (2005). Hizkuntzalaritza konputazionala. UEU arg ISBN 978-84-8438-065-8. (Noiz kontsultatua: 2021-01-21).
  14. a b Diaz de Ilarraza Sanchez, Arantza. (2020). «Scholia. Academic tree (Arantza Diaz de Ilarraza, 2020)» scholia.toolforge.org (Scholia) (Noiz kontsultatua: 2021-01-24).
  15. a b «Arantza Diaz de Ilarraza Sanchez. Tesi-zuhaitza» query.wikidata.org (Noiz kontsultatua: 2021-01-24).
  16. Diaz de Ilarraza Sanchez, Arantza. (2020). «Scholia. Academic tree (Arantza Diaz de Ilarraza, 2020)» scholia.toolforge.org (Scholia) (Noiz kontsultatua: 2021-01-24).
  17. Arantza Diaz de Ilarrazaren argitalpenak Ixa Taldearen webgunean
  18. (Ingelesez) «dblp: Arantza Díaz de Ilarraza» dblp.uni-trier.de (Noiz kontsultatua: 2024-03-18).
  19. Arantza Diaz de Ilarraza Sanchez irakaslearen produkzioa Inguma datu-basearen arabera (>40 produktu)
  20. «Proiektuak eta kontratuak | Ixa Taldea» ixa.si.ehu.eus (Noiz kontsultatua: 2021-01-22).
  21. «Ixakideak | Ixa Taldea» ixa.si.ehu.eus (Noiz kontsultatua: 2021-01-22).
  22. (Gaztelaniaz) «GaLan - Transferencia e Innovación OTRI - UPV/EHU» Transferencia e Innovación OTRI (Noiz kontsultatua: 2023-10-14).
  23. Matxin itzultzaileak beste bi urrats egin ditu – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2023-10-14).
  24. «Welcome to TAdeep (MINECO-FEDER project) | TAdeep» ixa2.si.ehu.es (Noiz kontsultatua: 2020-01-28).
  25. a b Alegria, Iñaki. (2018-09-11). «Itzulpen automatiko neuronalaren aurrerapenak eskura» Sarean .eus (Noiz kontsultatua: 2020-07-13).
  26. «MODELA» modela.ametza.com (Noiz kontsultatua: 2020-01-28).
  27. Eusko Jaurlaritza. (2019). «Euskara-Gaztelania itzultzaile automatiko neuronala» www.euskadi.eus (Noiz kontsultatua: 2020-01-28).
  28. «BATUA.eus - Euskarazko itzultzailea» www.batua.eus (Noiz kontsultatua: 2020-01-28).
  29. Vaswani, Ashish; Shazeer, Noam; Parmar, Niki; Uszkoreit, Jakob; Jones, Llion; Gomez, Aidan N; Kaiser, Łukasz; Polosukhin, Illia. (2017). Guyon, I. ed. «Attention is All you Need» Advances in Neural Information Processing Systems 30 (Curran Associates, Inc.): 5998–6008. (Noiz kontsultatua: 2020-01-28).
  30. «Itzultzailea» Itzultzailea (Noiz kontsultatua: 2020-01-28).
  31. Alegria Loinaz, Iñaki. (1995). Euskal morfologiaren tratamendu automatikorako tresnak. UPV/EHU- (TESIKER euskarazko tesiak).
  32. Urkia, Miriam. (1997). Euskal morfologiaren tratamendu informatikorantz. UPV/EHU - TESIKER euskarazko tesiak.
  33. Alegria Loinaz, Iñaki. (1995). «EUSKAL MORFOLOGIAREN TRATAMENDU AUTOMATIKORAKO TRESNAK.» www.educacion.gob.es (TESEO tesis doctorales) (Noiz kontsultatua: 2020-04-24).
  34. Urkia, Miriam. (1997). «EUSKAL MORFOLOGIAREN TRATAMENDU INFORMATIKORANTZ» www.educacion.gob.es (UPV/EHU) (Noiz kontsultatua: 2020-04-25).
  35. «Itzulpengintza Automatikoa | HiTZ Zentroa» www.hitz.eus (Noiz kontsultatua: 2021-01-24).
  36. IXA Taldea. (2021). «Itzulpen Automatikoa | Artikuluak | Ixa Taldea» ixa.si.ehu.eus (Ixa Taldea) (Noiz kontsultatua: 2021-01-24).
  37. «Modela - Hasiera» www.modela.eus (Noiz kontsultatua: 2021-01-24).
  38. «Patenteak | Ixa Taldea» ixa.si.ehu.eus (Noiz kontsultatua: 2021-01-24).
  39. «Produktuak | Ixa Taldea» ixa.si.ehu.eus (Noiz kontsultatua: 2021-01-24).
  40. «patenteak | HiTZ Zentroa» www.hitz.eus (Noiz kontsultatua: 2021-01-24).
  41. «Eustagger | Ixa Taldea» ixa.si.ehu.eus (Noiz kontsultatua: 2021-01-24).
  42. «Robustness and customisation in an analyser/lemmatiser for Basque | Ixa Taldea» ixa.si.ehu.eus (Noiz kontsultatua: 2021-01-24).
  43. «Combining Stochastic and Rule-Based Methods for Disambiguation in Agglutinative Languages | Ixa Taldea» ixa.si.ehu.eus (Noiz kontsultatua: 2021-01-24).
  44. AldezabalRoteta, Izaskun; Sarasola Gabiola, Kepa; Arriola Egurrola, Jose Mari; Diaz de Ilarraza Sanchez, Arantza. (2005). Hizkuntzalaritza konputazionala. UEU ISBN 978-84-8438-065-8. (Noiz kontsultatua: 2021-01-26).
  45. Diaz de Ilarraza Sanchez, Arantza; Sarasola, Kepa. (1999). Oinarrizko programazioa: Ariketa bilduma. UEU ISBN 978-84-8438-002-3. (Noiz kontsultatua: 2021-01-26).
  46. «Bilaketaren emaitzak :: Buruxkak Liburutegi digitala» www.buruxkak.eus (Noiz kontsultatua: 2021-01-26).
  47. «Sariak | Ixa Taldea» ixa.si.ehu.eus (Noiz kontsultatua: 2021-01-29).
  48. ikergazte. «Arantza Diaz de Ilarraza: “Gurean ez ezik beste arlo askotan ere diziplinartekotasuna funtsezkoa da”» IkerGazte 2021 (Noiz kontsultatua: 2021-06-11).
  49. ikergazte. «EGITARAU OROKORRA» IkerGazte 2021 (Noiz kontsultatua: 2021-06-11).
  50. «https://twitter.com/inakialegria/status/1403095970729148427» Twitter (Noiz kontsultatua: 2021-06-11).
  51. Espainiako Informatika-Ikerketa Sari bi Eneko Agirre eta Mikel Artetxerentzat – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2021-06-07).
  52. a b (Gaztelaniaz) Sociedad Científica Informática de España (SCIE). (2021). Otorgados los Premios de Investigación SCIE-FBBVA 2021 – SCIE. (Noiz kontsultatua: 2021-06-07).
  53. (Ingelesez) «COLING’2020 outstanding papers announcement» COLING’2020 2020-11-29 (Noiz kontsultatua: 2020-12-11).
  54. Campos, Jon Ander; Cho, Kyunghyun; Otegi, Arantxa; Soroa, Aitor; Agirre, Eneko; Azkune, Gorka. (2020-12). «Improving Conversational Question Answering Systems after Deployment using Feedback-Weighted Learning» Proceedings of the 28th International Conference on Computational Linguistics (International Committee on Computational Linguistics): 2561–2571. (Noiz kontsultatua: 2020-12-11).
  55. Ixa ikerketa-taldeak Estatu Batuetako gobernuak bultzatutako COVID-19 gaixotasunaren inguruan antolatutako adimen artifizialeko txapelketan saria jaso du – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2021-01-31).
  56. (Ingelesez) «COVID-19 Open Research Dataset Challenge (CORD-19)» kaggle.com (Noiz kontsultatua: 2021-01-31).
  57. «Elkarrizketak sortzen - Ixa Taldea» www.ixa.eus (Noiz kontsultatua: 2021-01-31).
  58. Google-saria hirugarrenez irabazi du Eneko Agirre ixakideak – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2021-01-31).
  59. Google-ren ikerketa-saria Eneko Agirreri hitzen esanahiak grafikoki erakusteagatik – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2021-01-31).
  60. Google Research saria Eneko Agirre taldekideari – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2021-01-31).
  61. EAMTko artikulu onenarentzako Springer saria IXA taldeari! – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2021-01-31).
  62. Ixa Taldearena da Testu Klinikoen Prozesamenduaz 2017ko 3 artikulu onenetako bat – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2021-01-31).
  63. Txiotesia2-ko saria Itziar Gonzalezi – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2021-01-31).
  64. Saria: Bagera elkartearen “bidelagunak” gara – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2023-04-12).
  65. Ixa Taldea. (2013). Gipuzkoako Foru Aldundiak emandako Anton Abadia Saria, Euskararen normalkuntza lanetan izandako eraginagatik.. .
  66. Ixa Taldea, Abbadia Saria – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2021-01-31).
  67. Ibilaldia 2012 omenaldia: Euskara teknologia berrietan sartzeko aintzindariak – Hizkuntza-teknologiak. (Noiz kontsultatua: 2020-02-11).
  68. Oronoz Antxordoki, Maite. «Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko baliabideen garapena: datak, postposizio-lokuzioak eta komunztadura» (PDF) Tesiker, Euskarazko doktorego-tesiak (Noiz kontsultatua: 2019-12-13).
  69. Maite Oronoz eta Larraitz Uria punta-puntan Mitxelena tesi-sarian – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2021-01-31).
  70. a b c Fernandez, Luistxo. (1995-12-24). «Leihoak Zabalduz. Windows95 euskaratua, hizkuntza makinen bidez lantzeko tresna berriak... Informatikaren eta euskararen arteko muga esploratu gabeetan barrena abiatu gara - Wikiteka» eu.wikisource.org (Euskaldunon Egunkaria) (Noiz kontsultatua: 2020-04-25).
  71. Alegria Loinaz, Iñaki; Urkia Gonzalez, Miriam. (2002). Morfologia konputazionala. UEU ISBN 9788484380344. (Noiz kontsultatua: 2018-12-15).

Ikus, gainera[aldatu | aldatu iturburu kodea]

Kanpo estekak[aldatu | aldatu iturburu kodea]

Gai honi buruzko informazio gehiago lor dezakezu Scholian