Lankide:Kolo Gutiérrez/Proba orria

Wikipedia, Entziklopedia askea

Estatistika ez-parametrikoa ikertzen diren aldagaiei buruzko emaitzak ateratzeko probabilitate-banaketa parametrizaturik behar ez duten metodoen multzoa da. Hori dela eta metodo ez-parametrikoak sarritan banaketa askeko metodo ere deitzen zaie, halere, metodo hauek banaketa ezagunekin ere baliozkoak eta eraginkorrak gertatzen dira haien parametroak mugaezinak direnean, edo zehazteke daudenean. Izan ere, proba parametrikoen aplikatzeko hipotesiak bete ezean, batez ere laginen tamaina txikiegiak oso zaila bihurtzen dela, askotan proba ez-parametrikoak erabili ohi dira. Metodo parametriloak ez bezala, horien abantaila nagusia sendotasuna da, horietan datuetarako suposatzen diren hipotesi arinek (zorizkotasunak, bereziki) ez baitute kolokan jartzen eskuratutako emaitzen zuzentasuna. Hala eta guztiz ere, metodo horiek ere badituzte desabantailak: ikertutako populazioaren probabilitate-banaketa ondo zehazturik baldin badago, eta lagina handi samarra da hurbilketa normala onartzeko, metodo ez-parametrikoak ez dira parametrikoak bezain efizienteak.

Sailkapena eta definizioak[aldatu | aldatu iturburu kodea]

"Estatistika ez-parametrikoa" esamoldea zehaztasunik gabe erabili izan da bi kontzeptu ezberdin adierazteko:

  1. Lehenengo esanahia probabilitate-banaketen familia parametriko jakin batean oinarritzen ez diren teknikei buruzkoa da. Honako hauek nagusiki:
    • Banaketa askeko metodoak, datuak probabilitate-banaketen familia ezagun batetik ateratzen direla suposatzen ez dituztenak.
    • Benetako parametrorik gabeko estatistika, estatistikoak definitzen dira laginaren datuen funtzio baten arabera bakarrik; inolako parametrori aipamena egiteke. Ordenaren estatistika, emaitzen sailkapena oinarritzen direnak, adibiderik ohikoena da.
  2. Bigarren esanahiak barne hartzen ditu eredu baten egiturak aldaezinak ez diren teknikak. Eskuarki, ereduaren tamaina handitzen da datuen konplexutasunak gora egiten duen neurrian. Teknika horietan, nahiz eta bakarka aztertutako aldagaiak maiz banaketa parametrikoen arabera aldatzen diren, aldagaien arteko erlazioak ez-parametrikoak dira. Besteak beste, honako teknika hauek barne izango lirateke:
    • Erregresio ez-parametrikoak, which is modeling whereby the structure of the relationship between variables is treated non-parametrically, but where nevertheless there may be parametric assumptions about the distribution of model residuals.
    • non-parametric hierarchical Bayesian models, such as models based on the Dirichlet process, which allow the number of latent variables to grow as necessary to fit the data, but where individual variables still follow parametric distributions and even the process controlling the rate of growth of latent variables follows a parametric distribution.

Aplikazioak eta helburuak[aldatu | aldatu iturburu kodea]

Estatistika ez-parametrikoak bai estatistika deskriptibatzailea bai inferentzia estatistikoa barne hatzen ditu. Metodo ez parametrikoak asko erabiltzen dira ordena zehatz bat hartzen duten populazioak aztertzeko. Horrelako metodoen erabilpena beharrezkoa izan daiteke datuak ordenan sailka ditzakegunean, baina ezin diegu zenbakizko irudikapen argirik eman, hala nola, bat eta bost izar arteko filmen balorapenak. Neurketa motei dagokionez, metodo ez-parametrikoek datu ordinalak sortzen dituzte.

Metodo ez-parametrikoek hipotesi gutxiago behar dituztenez, haien aplikagarritasuna antzeko kide parametrikoena baino askoz zabalagoa da. Hain zuzen ere, zenbat eta gutxiago dakigun espazio estatistiko batez, orduan eta egokiagoak suerta daitezke aplikatze aldera. Horrez gain, metodo ez-parametrikoak sendoagoak dira hain mugatzaile ez diren suposizio gutxi batzuetan oinarritzen baitirela.

Kalkulatzeko erreztasuna ere bada beste ohiko arrazoi bat metodo ez-parametrikoak erabiltzeko. Izan ere, metodo parametrikoen aplikatzeko baldintzak ere egokiak diren zenbaitetan, ez-parametrikoak nahiago ditzakegu soil-soilik erabiltzeko erraztasungatik. Aisetasun horri, eta haien berezko sendotasunari esker estatistikalari batzuen ustez metodo ez-parametrikoek ez digute aise hainbat oker eragiten, edo gaizki-ulertuak jasanarazten.

Esandako abantailalk gorabehera, kontuan hartu behar da metodo parametrikoak eta ez-parametrikoak baliogarriak diren kasuetan, ez-parametrikoek indarra gutxiago daukatela; hau da, konfidantza-mailar pareko ondorioak ateratzeko laginaren tamaina handiagoa izan beharko litzateke.

Eredu ez-parametrikoak[aldatu | aldatu iturburu kodea]

Eredu hauen egitura, parametrikoena ez bezala, ez dago a priori zehazturik, baizik eta sortzen da datuak ezagutu ahala. Ez-parametriko esamoldeak kasu honetan adierazten du parametroen izaera eta kopurua moldakorrak direla, parametro horien gabezia baino.

  • Histograma bat probabilitate-banaketaren zenbatespen ez-parametriko hutsa da.
  • Kernel densitatearen zenbatespena (ingelesez: KDE) probabilitate-banaketa balioztatzeko beste metodo bat da.
  • Kernels, splines eta wavelets direlakoetan oinarritutako erregresio ez-parametriko zein erdi-parametriko metodoak.
  • Datu-bilgarriaren analisiak (ingelesez: DEA) aldagai anitzeko analisiaren pareko efizientzia-koefizienteak ematen ditu, baina banaketari buruzko aierurik gabe.
  • K auzokide hurbilenak (ingelesez: KNNs) sailkatzen du zehazteko elementua gertuen dauden trebakuntza-multzoko k puntuak erabiliz.
  • Euskarri bektoredun makina (ingelesez: SVM), ez-parametriko tarte-zabaleko klasifikatzailea da Gaussen Kernel bat izan ezkero .
  • Momentuen metodoa probabilitate-banaketa polinomikoekin.

Metodoak[aldatu | aldatu iturburu kodea]

Inferentzia estatistikarako metodo ez-parametrikoak (edo banaketatik askeak) deritzegu hipotesi estatistikoak probatzeko prozedura matematikoei aztertutako aldagaien probabilitate-banaketari buruzko suposizioak egiten ez direnentzat. Gehien erabiltzen diren probak honako hauek dira:

Historia[aldatu | aldatu iturburu kodea]

Early nonparametric statistics include the median (13th century or earlier, use in estimation by Edward Wright, 1599; see Median § History) and the sign test by John Arbuthnot (1710) in analyzing the human sex ratio at birth (see Sign test § History).

Erreferentziak[aldatu | aldatu iturburu kodea]