Indexazio

Wikipedia, Entziklopedia askea

Indexazioa indize bat sortzeko helburuaz Informazioa era ordenatuan erregistratzea da. Kontzeptua “index” hitzetik dator[1] (índice, gazteleraz) eta, beraz, hitz baten edo batzuen bitartez edukiak adieraztea da indexazioa.

Informatikan, indexatzea informazioak forma ordenatu eduki dezan indize bat egitea da. Ekintza honen ondorioz informazio horren gaineko bilaketak nabarmen azkarrago eta efizienteagoak dira. Horregatik hain zuzen, indexazioa bilaketa-tresnen eta datu-baseen funtsezko elementua da.

Webetako informazioa bilatzen adituak diren Yahoo eta Googleen kasuan, enpresa hauek internetaren esplorazio iraunkorra egiten dute, arakatzen dituzten orrialde guztien eta baita ere haien edukiaren indizea sortzen dute. Hartara, kontsulta bat egitean, bilaketa-tresnak indizera jotzen du elementu desiratuak aurkitzeko, honela emaitzak zuzen eta azkar ekartzen ditu. Indizerik gabe, bilaketa-tresnak web-orri guztien edukia eskaneatu behar izango luke bilaketa bat hasten den bakoitzean; interneten dagoen informazio bolumena kontuan hartuta, ahalmen handiko ekipoak erabilita ere prozesu oso motela izango zen.

Indexazio motak[aldatu | aldatu iturburu kodea]

Hiru indexazio mota daude:

Indexazio automatikoa[aldatu | aldatu iturburu kodea]

Indexazio automatikoa programa informatikoek kudeatzen dute, eta dokumentuaren hitz guztiak izango dira indizeak. Adibidez, prentsa datu-baseetan edota Google bilatzailean indexazio mota hau erabiltzen da. Indexazio automatikoak, funtsean, hitz-gakoen bidez dokumentu bat aurkitzea du helburu; izenak dioen bezala, modu automatiko batean[2]. Aipatutako hitzak makinen edo aparatu elektronikoen bidez hartzen dira, hau da, ez dago gizakien inongo parte hartzerik.

Indexazioa lengoaia naturalean[aldatu | aldatu iturburu kodea]

Indexatzeko hitzak, izenak berak dioenez, lengoaia naturaletik hartzen dira inongo mugarik gabe; hau da, edozein hitz erabil daiteke indizeak osatzeko. Esaterako, aldizkarietako artikuluetan egileak ezarritako gako-hitzak izan daitezke adibide on bat. Lengoaia naturala autoreak bere ideiak dokumentuan adierazteko erabiltzen dituen hitzen multzoa da; gizakiak pentsatu, irakurri eta idatzi egiten du lengoaia naturalaren bitartez.

  • Folksonomia da lengoaia naturaleko indexazioaren adibide bat: Indexazio kolaboratzaile edo soziala da[3], hau da, interneteko informazioa eta edukiak sailkatzeko pertsona talde baten elkarlan espontaneoa. Ingelesezko folk eta taxonomy hitzen baturatik dator terminoa eta informazioa antolatzeko etiketak sortzean datza.
  • Folksonomia: Bi folksonomia mota daude, bata folksonomia estua eta bestea folksonomia zabala dira. -Estua: erabiltzaile bakoitzak bere edukiak baino ez ditu etiketatzen. Hau da, egileak berak edota pertsona kopuru mugatu batek soilik esleituko dizkio etiketak edukiei. Orokorrean, folksonomia estua objektu bati lotuta izaten da zuzenean, eta, nola erabiltzen ari diren jakitea zaila denez, ez du hiztegirik edota beste deskribapenik sortzen. Flickr da folksonomia mota honen adibide argia; irudiak eta bideoak kudeatu, ordenatu eta partekatzeko sareko aplikazioa da, eta bakoitzak bere edukietan baino ezin ditu erabili etiketak. -Zabala: erabiltzaile guztiek dute etiketak gehiago aukeratzeko eta sortzaileak ez du bere edukiari esleitzen zaizkion etiketetan eraginik. Beraz, edozein pertsonak ezar ditzakeenez, hizkuntza desberdin askotako etiketak izan ohi dira. Del.icio.us da folksonomia mota honen adibideetako bat, estekak ordenatzeko eta partekatzeko web-orria Gainera, folksonomia ikusteko etiketen lainoa delakoa ere badago; bertan ikus daiteke, hitzen tamainaren arabera, hitz bakoitza zenbatetan erabili den. Hau da, hitza zenbat eta handiago agertzeak orduan eta aldi gehiagotan erabili dela esan nahi du. Gaur egun, katalogoetan ere ikus daiteke, orokorrean, etiketen laino hau. Folksonomiak hainbat abantaila eta desabantaila dituzte: Batetik, etiketatzea ulertzeko eta egiteko erraza da, ez da inolako prestakuntzarik behar indexazioan, eta folksonomiaren hiztegian zuzenean erabiltzailearen hiztegia bera islatzen da. Aldi berean, folksonomiak malguak dira; hau da, erabiltzaileak nahi duenean gehitu edo kendu ditzake etiketak. Halaber, etiketek erabiltzaileen kontzeptu kultural, sozial eta politikoak islatzen dituzte, eta hau komunitateak sortzeko baliagarria da, erabiltzaileek interes komunak partekatu ditzaketelako. Azkenik, folksonomiak multi-dimentsionalak dira; hau da, erabiltzaileek kontzeptua adierazteko edozein zenbaki edota etiketa konbina ditzakete. Etiketak era librean hautatzen badira (proposatutako hiztegi batetik hartu beharrean), nahasmena sor daiteke, indexatutako edukiaren bilaketaren eraginkortasuna gutxituz eta fenomeno hauek sortuz: sinonimia (kontzeptu bera adierazten duten etiketa desberdin ugari); homonimia (etiketa bera baina esanahi desberdina), polisemia (etiketa bera, baina elkarren artean harremana duten esanahi asko dituena) eta stemming (hitzek bere errorea murriztea, bilaketa errazteko).

Indexazioa lengoia dokumentaletan[aldatu | aldatu iturburu kodea]

Lengoaia naturaleko indexazioan ez bezala, indexazio mota honetan hitzak termino normalizatuen zerrenda batetik hautatzen dira, hau da, aurretik adostutako terminoak baliatzen dira indizeak eratzeko unean, gero esanahi bera duten termino desberdinak nahas ez daitezen.

Adibidez, idazle edo egile bati lotutako informazio guztia bateratzeko, bere izena nola gorde zehaztuko da; Txilardegiren inguruko informazio guztia Txilardegi etiketarekin gordeko da, eta ez, esaterako, bere benetako izenarekin (Jose Luis Alvarez Enparantza). Indexazio mota honek, beraz, hiru helburu ditu: informazio bilaketak erraztea, indexazioan sakabanaketa saihestea eta bilaketetan zarata (zaborra) eta isiltasuna (bilaketen porrota) ekiditea.

Termino normalizatuen zerrendak honako hauek dira:

  • Autoritateak: Izen propioen normalizazioa eta bateraketa bilatzen dute liburutegietan eta dokumentazio-zerbitzuetan. Honi esker, egile baten lan guztiak batera topatu ahal izango ditugu, eta datu-basearen erregistro guztietan autorearen izena modu berean idatzita agertuko da. Adibidez, IMDb zineari buruzko webgune ospetsuan ere izenen normalizazioa erabiltzen da.
  • Gai-sarrerak: liburutegietan erabiltzen dira, liburuen gaiak indexatzeko Azaleko indexazioa izaten da, liburu bakoitzari sarrera bat edota sakan batzuk jartzen zaizkiolako. Liburuen fitxetan deskribapen bibliografikoaren ondoan agertzen dira. Lau motatako azpigai onartzen dira: o    Azpigaiak: Telebista-ekoizpena, adibidez. o    Topografikoak: Komunikabideak-Italia, adibidez. o    Kronologikoak: Espainia-Historia-Bigarren Karlistaldia, 1872-1876, adibidez. o    Formakoak: Argazkiak, Bideoak eta abar. Gai-sarrerak ez dira bakarrik liburutegietan erabiltzen. Adibidez, IMDb-n pelikula bat bilatzerakoan, filme horren generoa zein den ikusi ahalko dugu. Kasu honetan, Fight Club dramazko pelikula bat da, eta drama agertuko zaigu. Gainera, generoen arabera ere bila ditzakegu pelikulak; 28 genero desberdin daude, guztira, plataforma honetan.
  • Thesaurusak


Indizeak lengoaia dokumental elkarkorrak dira (sailkapenak, ordea, hierarkikoak), hiztegi modukoak. Zerrenda alfabetikoetan azalduko dira, euren esanahia kontuan izan gabe. Indizeak osatzeko bi modu daude:

Aurrekoordinazioa: elementu semantikoak indexazioa egiterakoan lotzen dira, indizeak gero eta zehatzagoak bihurtuz (adibidez, umorezko seriea).

Ondorengo koordinazioa: egitura semantiko sinplea dute eta kontzeptu konplexuak adierazteko, indize desberdinak konbinatuko dira (adibidez: umorea, seriea).

Erreferentziak[aldatu | aldatu iturburu kodea]

  1. (Gaztelaniaz) Romero, Dean. «¿Qué es la indexación o indexar un contenido?» www.inboundcycle.com . Noiz kontsultatua: 2020-03-07.
  2. (Gaztelaniaz) Lapuente, Chusa Lamarca; Lapuente, María Jesús Lamarca. «Indización automática» www.hipertexto.info . Noiz kontsultatua: 2020-03-07.
  3. «Beneath the Metadata: Some Philosophical Problems with Folksonomy» www.dlib.org.

Kanpo estekak[aldatu | aldatu iturburu kodea]