PageRank

Wikipedia(e)tik
Hona jo: nabigazioa, Bilatu
PageRanken funtzionamenduaren adibidea
PageRank-en funtzionamendua

PageRank bilaketa-tresna batek indexatutako dokumentuen (edo web orrialdeen) garrantziari balioa emateko erabiltzen den algoritmo sorta da. PageRank metodoa Google bilatzaileak erabiltzen du orrialde baten garrantzia zehazteko. Googleren fundatzaile Larry Page eta Sergey Brinek 1998an asmatu zuten metodo hau Stanfordeko Unibertsitatean.

PageRank sistema loturetan oinarritzen da balioa zehazteko. Googlek A orrialdeak B orrialderako duen lotura bat Ak Bri emandako boto bezala kontsideratzen du. Baina lotura kontuan izateaz gain, berau nondik datorren ere kontuan izaten du. Orrialde garrantzitsu baten jatorria baldin badu, bere pisua are handiagoa izango da.

Googleek 1999ko Urtarrilaren 9an erregistratu eta patentaturiko marka. Google deituriko bilaketa motorrak PageRank sistema erabiltzen du web orriak indexatzeko. Horrek ahalbidetzen duen algoritmoa Larry Page-ek (hemendik dator PageRank-eko izena) eta Sergey Brin-ek Stanfordeko Unibertsitatean garatu zuten.

Algoritmoaren funtsezko oinarriak honela dio: zenbat eta lotura gehiago orri bat erreferentziatu are eta web orri baten pisua astunagoa izango da. Eta zenbat eta loturak dituen orriak astunagoa izan, eragina handiagoa izango da. Helburua loturak pisuaren arabera sailkatzea da, horrela zerrenda bat eman ahal izateko bila motor baten emaitza bezala, hau da, lotura garrantzitsuenak aurrean egotea.

PageRank izena Googlek erregistratuta dauka eta prozesua patentatuta dago. Beste bide bat HITS algoritmoa izan daiteke, Jon Kleinbergek sortutakoa.

Historia[aldatu | aldatu iturburu kodea]

PageRank algoritmoaren ideiak Soziometrian du jatorria eta jadanik 1953an egiaztatua izan zen. Metodoa 1949an erabili zen lehen aldiz gizakiaren egoera azaltzeko.

Algoritmoa[aldatu | aldatu iturburu kodea]

P\!R_i = \frac {1-d} {N} + d \, \sum_{\forall j \in \{(j,i)\}} {\frac {P\!R_j} {C_j}}
  • i: web orria
  • PRi: orri baten pisua
  • j: i –orria erreferentziatzen duten web orriak
  • PRj: PRi orriak erreferentziatzen duten web orrien pisua
  • Cj: PRj orriaren esteka guztiak
  • N: orri guztien kopurua
  • d: atenuatzailea, balioak 0 eta 1 artean hartu ahal dituena

d-rekin orri baten pisuaren zati bat (1-d) kendu egingo zaio eta banatua izango da algoritmoak barnean hartzen dituen orri guztien artean. Hau beharrezkoa da pisua inora ez bidaltzen duten orrietara joatea ekiditeko.

PageRank-a 1era normalizatzen bada, orri baten pisua interneteko erabiltzaile batek orri honetan dagoenaren probabilitate bezala interpretatu daiteke. Interneteko erabiltzailea saretik mugitzen da eta d probabilitatearekin oharkabean jadaneko orriaren esteka bat sakatzen du. 1-d probabilitatearekin hautatzen du orri berri bat. Orri batek ez baldin baditu kanporako estekarik, estekak jadanik dauden orri guztietara gehitu daitezke.

Honek bermatzen du PageRank-en balio guztien batura leku guztietatik 1 izatea eta ez balio txikiago bat.

Kritikak[aldatu | aldatu iturburu kodea]

Eragozpenak:

  • Finantzario indartsuago diren operadore konpainiak babes estekak (ingeleseko Backlink) erosi ahal dutenaren aukera dago, zerrendan gorago egotea ahalbidetuz. Honen esanahia da, batzuetan kalitate handiko orriak ez direla zerrendan erabakiorrak izaten baizik eta ahalbide finantzieroak.
  • PageRank-ak ez du laguntzen web orrien neurketa kualitatiboa egitera.
  • Webmasters-ek askotan ikusten du PageRanken irizpide bakarra esteken trukaketarako. Bidaltzen duten orrien edukia 2. leku batean geratzen da.

Esku-sartzea[aldatu | aldatu iturburu kodea]

Ez dira esteka guztiak kontutan hartzen adibidez esteken aurrean "Nofollow" baldin badago ez dira kontutan izango PageRank egiterakoan. Hau egiten da spam-a kontrolatzeko asmoarekin eta dauden era ez oso etikoak indizean eragina izatea ekiditeko asmoz.

Honela, ez da komenigarria gure web orrian estekak izatea zeinen PageRank-a 0 den ezta ere esteka abeletxetara hauek esteka sarkorrak eratzeko asmoarekin sortutako lekuak baitira. Gure web orrira estekatzen dituzten beste orriek ezin digute kalte egin, guk estekatzen ditugun web-ak ordez, bai. Hala ere atal honetan aipatzekoa da ere orriaren garrantzia ez du inolako esanahirik daukan informazioa ez baldin badator bat bilatzen denarekin.

Erreferentziak[aldatu | aldatu iturburu kodea]

Commonsen badira fitxategi gehiago, gai hau dutenak: PageRank Aldatu lotura Wikidatan


Ikusi[aldatu | aldatu iturburu kodea]