Ezagutzaren metodologia

Wikipedia, Entziklopedia askea
Jump to navigation Jump to search

Ezagutzaren metodologiak hiru motatako informazioak identifikatzen ditu gomendatze-sistemak erabil ditzan:

Ezagutza-metodologiaren eskema orokorra
1. Erabiltzaileen informazio demografikoa: adina, generoa, bizilekua ...
2. Produktuaren ezaugarrien araberako erabiltzaileen lehentasunak: pelikula mota, zuzendaria, aktore nagusia ...
3. Aurretiko esperientziak: erosketa-ebaluazioak ...

Informazio honen datu-basearen gainean, erabiltzaileak hainbat produkturekin duen zaletasuna kalkulatzen da eta gero erabiltzaileari gomendatzen zaizkio zaletasun handieneko produktuak . Informazio egoki, zehatz eta zuzena ematen duten iturburuak, garrantzirik gabeko informazioa ematen duten iturburuak baino maizago erabiliko direla espero da.

Motibazioa[aldatu | aldatu iturburu kodea]

Erronka garrantzizkoenetako bat bai merkaturatze sistema batean edo gomendatze sistema batean bezeroari buruzko edo produktu baten bezeroari buruzko edo zerbitzu bateko erabiltzaileari buruzko informazio baliagarria eskuratzea da. Oro har, lehen urratsa informazioa bilatzea da eskura dagoen edozein iturburu bat analizatuz. Hala ere, sortzen den arazo nagusia informazio horren erabilgarritasuna da. Hortaz, a priori, gomendioetarako informazioaren egokitasunari buruzko probak emango dituen mekanismo bat beharrezkoa da. Datu eskuragarri andanaren gainean bilaketa bukaezinak saihesteko, horrelakoetan baliabide gehiegi erabiltzen direla kontuan hartuta, informazioak aldez aurretik sailkatuta edo indexatuta egon behar du erraz aurkitzeko. Metodologia hau informazio-iturburu egituratuetarako bereziki definitu da.

Prozesuaren urratsak[aldatu | aldatu iturburu kodea]

  1. Iturburuetako informazioaren pertinentzia neurtzeko ezaugarri multzoa lortzea: ezaugarri hauek iturburu esanguratsua beste batzuekin konparatzea ahalbideratu behar dute.
  2. Iturburu fidagarriena hautatzeko neurri bat lortzea: iturburu baten konfiantza iturburu horrekin aurretik proposatutako gomendio emaitzetatik lortzen da.
  3. Iturburu egokienaren aukeraketa: eskura dagoen iturburu bakoitzaren egokitasun-neurria kalkulatzen da 1. urratsean lortutako pertinentzia-neurria eta 2 atalean lortutako fidagarritasun-balioa erabiliz. Honek gomendioetarako zer iturburu diren egokienak erabakitzeko balio du, era justifikatu batean.

Pertinentzia edo garrantziaren lorpena (R(S))[aldatu | aldatu iturburu kodea]

Iturburu bat zer punturaino den egokia jakiteko hainbat ezaugarri aztertu behar ditugu:

  • OSOTASUNA: eskuragarri dauden iturburuetatik erabiltzaileekin erlazionatutako informazioa lortzea da helburua. Erabiltzaile guztiei buruzko informazioa daukan datu-basea erabiltzaile batzuena bakarrik daukana baino osatuago izango da.

Emanda gomendatze-domeinu bateko erabiltzaile multzoa, iturburu baten osotasuna (I), iturrian ez dauden multzoko erabiltzaile kopurua (-ren bitartez ezagutzen dena) zati erabiltzaileen kopurua da.

  • DIBERTSITATEA: iturburuetan dauden informazio demografikoa ezagutzea ahalbideratzen du. Gomendatze sistemek informazio hau erabiltzen dute talde osoei genero, bizileku, adina ... ezaugarrien arabera gomendioak emateko. Iturburua, zenbat eta bariatuago izan, erabiltzaile talde gehiagorako balioko dute.

Dibertsitatea ( D) entropia bezala kalkulatzen da, non eta, bakoitza, taldeko erabiltzaileak diren eta , iturburuaren erabiltzaileen kopuru osoa.

  • MAIZTASUNA: iturburuaren informazio kantitatea jakiteko laguntzen du. Iturburu batek erabiltzaileekiko interakzioen bitartez informazioa eskuratzen du, hau da, erabiltzaileekiko interakzioa zenbat eta maizago izan orduan eta osoago izango da. Gainera, portaera, erosketa edo zenbat eta informazio gehiago izan erabiltzaileen ebaluazioei buruz, orduan eta zehatzagoak izango dira gomendioak.

Iturburua iterazio kopuruen arabera kategorietan banatzen dira:

kategoria: 1-10 elkarrekintza
kategoria: 11-25 elkarrekintza
kategoria: 26-50 elkarrekintza
kategoria: 51-100 elkarrekintza
kategoria: 101-200 elkarrekintza
kategoria: +201 elkarrekintza

iturburuaren elkarrekintzen (F) maiztasuna, kategoriak emanda, kategoria horien pisuen batura da bakoitza bere kopuruarekin ponderatuta, zati iturburuko erabiltzaile kopurua.

  • PUNTUALITATEA: iturburuen ahalmena informazio eguneratua izateko, erabiltzaileen gogoak eta lehentasunak denborarekin alda daitezkeela kontuan hartuta. Orain dela 10 urte gustuko filmak eta oraingoak desberdinak izan daitezke, baina orain dela 2 urtekoek haiek baino probabilitate gehiago dute orain gustukoak direnak izateko.

Iturburuekin erabiltzaileak ibili diren denboraldia kontuan hartuta ere kategoriak ezarri daitezke:

kategoria: 2006/01/01 - 2006/12/31
kategoria: 2007/01/01 - 2007/12/31
kategoria: 2008/01/01 - 2008/12/31
kategoria: 2009/01/01 - 2009/12/31
kategoria: 2010/01/01 - 2010/12/31
kategoria: 2011/01/01 - 2011/12/31

iturburuko interakzioen (P) puntualitatea, kategoriak emanda, pisuen batura da, faktoreaz biderkatuta, eta zati iturburuko erabiltzaile kopurua.

Azkenean garrantziaren neurria lortzen dugu:

  • ATRIBUTU GARRANTZITSUEN KOPURUA: nahiz eta iturburua osoa izan, erabiltzaileei buruzko informazio kantitatea handia izan, eta eguneratuta egon, beharbada informazio hori ez da zehatza gomendioak egiteko. Atributu pertinenteen kantitatea beste ezaugarri bat da iturburu batean behar dugun informazioa aurkitzen den ala ez adierazten duena.

Gomendioa egitea ahalbideratzen duten attributu multzoa emanda, iturburuko (R) atributu garrantzitsu kopurua honela definitzen da: izeneko rik gabeko atributu kopurua zati atributu kopuru osoa.

Fidagarritasunaren lorpena (T(S))[aldatu | aldatu iturburu kodea]

Iturri baten fidagarritasuna bere informazioa erabiltzeagatik ebaluatua izateko 0 eta 1en arteko probabilitate balio bat da. Balio hau iturburuetatik lehenagotik lortutako konfiantza ezaugarrian oinarritzen da. Gomendioen arrakastaren maila kalkulatzeko beharrezko informazioa gordetzen da, iturburu arrakastatsua (= 1) edo ez arrakastatsua (= 0) izan den informazioaren bitartez.

Iturburu egokien eta fidagarriena aukeraketa[aldatu | aldatu iturburu kodea]

Algoritmoak hiru elementu ditu:

1. Iturburu hautagaien multzo bat (S).
2. Iturburu egokienak (relevant ingelesez) eta fidagarrienak (trust ingelesez) aukeratzeko (R(S), T(S)) funtzioa.
3. Funtzio honek parametroa duen iturburuaren T partaidetza eta R konfiantza parametroen balioak erabiltzen ditu.
4. Iturburu aukeratuak dauzkan (F) soluzio multzoa.


Erreferentziak[aldatu | aldatu iturburu kodea]