Bolada-froga

Wikipedia(e)tik
Hona jo: nabigazioa, Bilatu
Ordenan jasotako datu batzuetarako, bolada-kopurua oso handia nahiz oso txikia denean, datuak jasotzean independentzia eta zorizkotasuna bazter daiteke. Bolada-kopurua ertaina bada, ez dago hipotesi nulutzat hartzen den independentzia edo zorizkotasuna baztertzeko ebidentzia askirik.

Bolada-froga edo Wald Wolfowitzen bolada-froga bi balioko segida bat zorizkoa edo independentea den erabakitzeko erabiltzen den hipotesi-froga ez-parametriko bat da. Froga burutzeko, boladak edo ondoz ondoko balio berdinen segidak kontatzen dira. Bolada kopurua zorizkotasun hipotesi nuluaren pean espero daitezkeenak baino nabarmen gehiago edo gutxiago badira, hipotesi nulua baztertu eta segida zorizkoa ez dela edo datuek dependentzia-mota bat erakusten dutela erabaki behar da. Froga Abraham Wald eta Jacob Wolfowitz estatistikariek asmatu zuten 1940 urtean.

Bolada-froga aldagai dikotomikoetarako[aldatu | aldatu iturburu kodea]

Aldagai dikotomikoak bi balio bakarrik hartzen dituzten aldagaiak dira (adibidez, sexua, akasgabe/akastun, azterketa bat gainditu/ez gainditu). Bolada-froga datu dikotomikoetan oinarritzen da, datuak jaso diren ordenan boladak edo balio bereko ondoz ondoko datu segidak zenbatuz. Adibidez, industria-prozesu batean ekoiztutako piezak akasgabeak (0) edo akastunak (X) diren jaso da:

X00X0000X00000XXXXX

Aurreko segidan 7 bolada daude: X-00-X-0000-X-00000-XXXXX.

Datuak zoriz jaso badira edo segida independentziaz suertatu bada, bolada kopurua ez da ez handiegia ez txikiegia izango. Izan ere,

  • bolada gutxi badaude, akastunak eta akasgabeak oro har batera gertatu eta beraz, akasgabe ondoren akasgabe eta akastun ondoren akastun suertatzeko joera (beraz, zorizkotasun-eza) dagoela baieztatu ahal izango da;
  • bolada asko badaude, akastunak eta akasgabeak txandakatzeko joera dagoela baiezta daiteke, akasgabe ondoren akastun eta akastun ondoren akasgabe suertatzeko joera (beraz, zorizkotasun-eza) dagoela baieztatu ahal izango da.

Hipotesi nulu moduan zorizkotasuna harturik, bolada-froga alde bikoa da: bolada kopurua txikia nahiz handia denean baztertuko da zorizkotasuna eta independentzia. Zorizkotasuna baztertzea dakarten balio kritikoak ematen dituzten taulak badaude.

Bolada kontrastea aldagai jarraituetarako[aldatu | aldatu iturburu kodea]

Bolada-froga aldagai jarraituetan aplikatzeko, datuen mediana kalkulatu eta, jaso diren ordenan, medianatik gora (+) edo behera (-) dauden sailkatzen dira. Era horretan, aldagai dikotomiko bat eskuratuko da. Adibidez, lantegi bateko eguneko ekoizpen datuak jaso dira:

45,26,36,40,39,32,28,25,24,22,18,17

Mediana 27 da. Beraz, datuak 27tik behera edo gora dauden sailkatuz:

+ - + + + + + - - - - -

Aldagai dikotomiko horretan 4 bolada daude. Aski da jaso diren datu-kopuruetarako balio kritikoa tauletan bilatzea, 4 balioak zorizkotasuna onartzera edo baztertzera daraman erabakitzeko.

Lagin-tamaina handiak[aldatu | aldatu iturburu kodea]

Taulak aldagai dikomotikoaren balio kopuru mugatuetarako eratzen dira, gehienetan 20ra bitartekoak. Hortik aurrera, zorizkotasunaren hipotesi nulupean R bolada kopuruen probabilitateak kalkulatzeko hurbilketa normala erabil daiteke:

R \sim N\Bigg(\mu=\frac{2n_1n_2}{n_1+n_2}+1,\sigma=\sqrt{\frac{2n_1n_2(2n_1n_2-n_1-n_2)}{(n_1+n_2)^2(n_1+n_2-1)}}\Bigg)

Froga alde bikoa denez, lagineko bolada kopuruaren probabilitatea, norabide egokian, adierazgarritasun-mailaren erdiarekin alderatu beharko da erabakia hartzeko.

Kanpo loturak[aldatu | aldatu iturburu kodea]