Karen Spärck Jones

Wikipedia, Entziklopedia askea
Karen Spärck Jones

Bizitza
JaiotzaHuddersfield1935eko abuztuaren 26a
Herrialdea Erresuma Batua
HeriotzaWillingham (en) Itzuli eta Cambridgeshire2007ko apirilaren 4a (71 urte)
Heriotza moduaberezko heriotza: minbizia
Familia
Ezkontidea(k)Roger Michael Needham (en) Itzuli  (1958ko ekainaren 10a -
Hezkuntza
HeziketaGirton College (en) Itzuli
Cambridgeko Unibertsitatea
Tesi zuzendariaR. B. Braithwaite (en) Itzuli
Hizkuntzakingelesa
Jarduerak
Jarduerakinformatikaria, unibertsitateko irakaslea eta artificial intelligence researcher (en) Itzuli
Enplegatzailea(k)Newnham College (en) Itzuli
Wolfson College
Jasotako sariak
KidetzaBritainiar Akademia
Association for the Advancement of Artificial Intelligence (en) Itzuli
cl.cam.ac.uk…

Karen Spärck Jones (Huddersfield, 1935eko abuztuaren 26Willingham, 2007ko apirilaren 4) Erresuma Batuko zientzialaria eta informatikaria izan zen Hizkuntzalaritza konputazionalean ekarpen handia egin zuena.

Informazioa eskuratzea alorrean ikertzaile aitzindaria izan zen.

Biografia[aldatu | aldatu iturburu kodea]

Karen Spärck Huddersfielden jaio zen Erresuma Batuko Mendebaldeko Yorkshire konderrian.

Bere aita Owen Jones izan zen, kimikako irakasle bat, eta bere ama Ida Spärck izan zen, Norvegiatik Erresuma Batura Bigarren Mundu Gerran alde egin zuena. Spärck Jones Huddersfieldeko eskola batean ikasi zuen, eta gero Cambridgeko Girton Collegen 1953tik 1956raino, Historia estudiatu zuen eta gero Filosofia urte gehigarri batean.

Orduan maisu lanean hasi zen eskola batean, baina laster hasi zen informatikan lan egiten. Informatikan lanean ari izan zen denbora guztian nabarmen sustatu zuen emakume gehiago diziplina honetan sar zitezen. Adibidez, berea da aipu hau:

« Informatikan emakume gehiago sartzea oso garratzitsua dela uste dut. Nire leloa da hau: Informatika garrantzitsuegia da gizonezkoen eskuetan uzteko.
I think it's very important to get more women into computing. My slogan is: Computing is too important to be left to men.
»
Karen Spärck Jones

Beren ikerbidea 1950ean hasi zen, tesaurus bat sortzen parte hartu zuen Cambridgeko Unibertsitateko Hizkuntzaren Azterketarako ikerketa-unitatean.

1964an aurkeztu zuen bere doktorego-tesia, "Sinonimia eta sailkapen semantikoa" izenburua zuena, teknika estatistiko eta probabilistikoak teknika linguistikoekin konbinatuta.[1] Tesiaren planteamendua aitzindaria izan zen bere arloan.

EHUko Informatika Fakultatean izan zen 1990ko irailean, IXA taldeak gonbidatuta. SEPLN elkartearen urte hartako kongresuan. Bere hitzaldia Erresuma Batuan Hizkuntzaren prozesamenduaren arloan indarrean zeuden programa nazionalei buruzkoa izan zen. Hitzaldiaren edukia Procesamiento del Lenguaje Natural aldizkarian argitaratu zen, 1992ko urtarrilean.[2]

Informazioa eskuratzearen arloan ikertzen jarraitu ahal izan zuen Royal Society eta Biblioteka Britainiarra instituzioetatik eman zizkioten bekei esker. 1974tik 2002an erretiratu zen arte Cambridgeko Unibertsitateko Informatika Laborategian lan egin zuen, baita gero ere 2007an minbiziagatik hil zen arte.

Roger Needhamekin ezkonduta egon zen 1958tik honen heriotzaraino 2003an.

Obra zientifikoa[aldatu | aldatu iturburu kodea]

Karen Spärck Jonesek indexazio automatizatuaren garapena lideratu zuen, dokumentu batean hitz bakoitzak duen garrantzia informatiboa aurkitzeko adierazle bat asmatu zuen; harrezkero "indexazio pisatua" edo pisu bidezkoa izenarekin ezagutuko zena.

ITF izena duen algoritmo hau (Inverse Term Frecuency edo terminoaren alderantzizko maiztasuna) termino batek dokumentu batean duen garrantzia kalkulatzen du dokumentuan agertzen den aldi kopuruaren arabera eta horren erlazioa gainerako terminoen kopuruarekin. Algoritmo honek baztertzen ditu gehiegitan agertzen diren hitzak (hizkuntzaren hitz funtzionalak, esaterako preposizioak edo elkartzeak) eta gutxiegitan agertzen direnak (agerraldi gutxi batzuk dituztenak), dokumentuaren edukia deskribatzeko balio informatzaile nahikoa ez dutelakoan.

Adierazle honek are garrantzitsuagoa izan zen beste berri bati zabaldu zion bidea: IDF (Inverse Document Frecuency edo dokumentuaren alderantzizko maiztasuna). Aurrekoaren antzekoa zena baina datu-base dokumental bateko dokumentu guztietan kalkulatzen da. Interneteko bilatzaile batean, adibidez, kontsulta bati erantzuteko aurkitu diren dokumentuak lortuta, normalean algoritmo horrekin aztertzen dira, dokumentuak beren garrantziaren arabera ordenatzeko. Gaur egunean Interneten eta datu-base dokumentaletan bilaketa asko eta asko egiten direnez, nabaria da Karen Spark Jonesek eta Stephen Robertsonek asmatu zuten algoritmo honen garrantzia itzela dela

Beste ikertzaile batzuek algoritmoa hobetu dute geroago ere: Keith van Rijsbergen, Peter Ingwersen edo Ricardo Baeza-yates.

Argitalpenak[aldatu | aldatu iturburu kodea]

Bere obren batzuk dira honakoak:

  • Automatic keywords classification for information retrieval. Londres: Butterworths, 1972.
  • Information retrieval experiment. Londres: Butterworths, 1981.
  • Readings in information retrieval (en coautoría con Willett). San Francisco: Morgan Kaufmann.

Ikerketako aldizkari zientifikotan artikulu ugari argitaratu zituen, horien artean ondokoak:

  • A statistical interpretation of term specificity and its application in retrieval (1972) Journal of Documentation aldizkariko 28. zenbakian
  • Index term weighting (1973) Information Storage and Retrieval aldizkariko 9.zenbakian.

Sariak eta dominak[aldatu | aldatu iturburu kodea]

Sari ugariekin saritu zuten, haien artean:

  • Gerard Salton saria 1988an.
  • Meritu akademikorako ASIST&T saria 2002an,
  • Bizitza osoko ikertzaile-ibilbidearen saria, hizkuntzalaritza konputazionalean ospetsuena den ACL nazioarteko elkarteak emana.
  • Allen Newell saria ACM-AAAI elkarteak emana (2007)
  • Lovelace domina 2007an, artean minbiziak jota zegoela.

Erreferentziak[aldatu | aldatu iturburu kodea]

  1. Karen Spärck Jones. Synonymy and Semantic Classification (liburu moduan argitaratua). Edinburgh University Press. Edinburgh Information Technology series. 1986.}
  2. Artola, Xabier. (2007). Karen Sparck-Jones berriro saritua – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2024-02-12).

Bibliografia[aldatu | aldatu iturburu kodea]

  • In memorian, Journal of de American Society for Information Science and Technology. 59(5). pp. 852–854, 2008.
  • MOYA ANEGÓN; Felix de (2002): Técnicas avanzadas de recuperación de información. Manual de ciencias de la documentación liburuan. Madrid : Pirámide.

Kanpo loturak[aldatu | aldatu iturburu kodea]