Bariantza-analisi

Wikipedia(e)tik
Hona jo: nabigazioa, Bilatu

Bariantza-analisia, labur eta nazioartean ANOVA (ingelesez, ANalysis Of VAriance) izenez ere ezaguna, fenomeno edo saiakuntza bateko aldakortasuna, bariantzaren bitartez zenbait zatitan bereizteko prozedura bat da, aldakortasuna kausa edo faktore jakinei egoztearren. Bariantza analisiak faktore eragileek dakarten gehikuntza (positiboa edo negatiboa) ere ematen du. Adibidez, zenbait makinak ekoiztutako elementuen iraupenari buruzko datuak erabiliz, bariantza analisiaren bitartez makina ezberdinek batez besteko iraupen ezberdina duten erabakitzen da, batez besteko hauen neurriarekin batera. Horretarako, makinek dakarten aldakortasunari dagokion bariantza, makinen arteko bariantza izenekoa, eta makinei ez dagokien aldakortasunari dagokion bariantza, errore esperimentala adierazten duen makinen barneko bariantza edo hondar bariantza izenekoa alderatzen dira. Makinen arteko bariantza makinen barneko bariantza baino nabarmen handiagoa bada, makina faktoreak ekoiztutako unitateen iraupenaren gainean eragina duela erabakitzen da. Bariantzak F hipotesi kontraste baten bitartez alderatzen dira.

Bariantza analisia Ronald Fisher estatistikariak garatu zuen 1920 eta 1930 hamarkadetan, nekazaritza ikerketetan murgildurik zebilela.

Aplikazioak[aldatu | aldatu iturburu kodea]

Bariantza analisia saiakuntzaz lortutako datuak aztertzeko erabili ohi da. Saiakuntzen diseinu klasikoan, faktoreak banan banan aztertu eta aldi bakoitzean beste faktore guztiak konstante mantentzen dira. Diseinu honek ordea saiakuntzaren berezko erroreak edo errore esperimentalak aztertzen den faktoreari egozten dio.

Bariantza analisiak aztertzen dituen diseinu faktorialak, non faktoreak batera aztertzen diren, errore esperimentala azalarazi, neurtu eta faktore bakoitzaren benetako eragina neurtzen du, faktore batzuk batera aldatzeko aukera ematearekin batera.

Horrela, bariantza analisia nekazaritzan (adibidez, ingurugiro ezberdinen eragina neurtzeko), medikuntzan (botika dosi ezberdinen eraginkortasuna aztertzeko) edo industrian (lan prozesu ezberdinen ekoizpenak erkatzeko) sarri erabili da. Hala ere, saiakuntzaz lortu ez diren datuetarako ere erabili da.

Eredua[aldatu | aldatu iturburu kodea]

Bariantza analisia burutzeko, eredu bat finkatzen da. Ereduan, behaketa edo datu bakoitza faktoreen balioek definitutako batez besteko bat gehi hondar osagai bat dela ezartzen da. Orobat, hondarrak banaketa normalari jarraitzen diotela, bariantza konstante dutela (homoskedastikotasuna) eta hondarren artean korrelaziorik eza dagoela ezartzen da. Bariantza analisiaren helburua faktoreen konbinazio ezberdinetarako batez bestekoak ezberdinak diren egiaztatu, F kontraste baten bitartez, eta batez besteko hauen zenbatespenak egitea da. Azkenik, ereduak aurrez suposatutakoak ere kontrastatu behar dira: normaltasuna, homoskedastikotasuna eta hondarren arteko independentzia.

Faktore kopurua[aldatu | aldatu iturburu kodea]

Kontuan hartutako balizko kausa kopurua zein den, faktore bakarreko, biko eta hiruko bariantza analisiak burutu ohi dira. Ahal bada ere, oso konplexua delako gutxitan burutzen dira hiru faktore baino gehiagoko bariantza analisiak.

Interakzioa[aldatu | aldatu iturburu kodea]

Faktore kopuruaz gainera, bariantza analisia burutzean faktoreen artean interakziorik dagoen ere kontuan har daiteke. Faktore bakoitzaren eragina baliteke ezberdina izatea beste faktore batek hartzen duen balioa edo egoera zein den. Adibidez, makina batek ekoizten dituen unitateetan dakarren iraupen gehikuntza makinan aritzen den langilearen prestakuntza nolakoa den aldatzen bada, makinaren eta langilearen prestakuntzaren artean interakzioa dagoela esaten da. Bariantza analisirako ereduan interakzioak gehitu egiten du zenbatetsi beharreko parametro kopurua eta beraz zaildu egiten du azterketa.

Zorizkotasuna eta bloke diseinuak[aldatu | aldatu iturburu kodea]

Datuak jasotzerakoan, ikerketa unitateak zoriz esleitu behar dira faktore ezberdinen artean, ikerketa unitatearen efektua deuseztatzeko. Adibidez, A eta B makinen ekoizpena erkatzeko langile bat hainbat ordutan bi makinetan lanean hasten bada, makina bakoitzean lan egingo duen orduak (ikerketa unitateak) zoriz esleitu behar dira: 10 ordutan zehar, zorizkoa ez den AAAAABBBBB segida burutuz, B makinan ekoizpen txikiagoa langilea nekatuta egoteagatik suertatu ote den ezingo da jakin eta horregatik ABBABBAAAB bezalako zorizko segida batean lan egin beharko du langileak ondorioak behar bezala ateratzeko. Unitateak zoriz esleitzeko prozesuari zoriztaketa deritzo.

Beste aukera bat, langilea lehenengo, bigarren, ... eta hamargarren orduan, egun ezberdinetan, bi makinetan lanean aritzea da. Orduaren efektua blokeatu egiten dela esaten da orduan. Ordua bloke bihurtuz, errore esperimentala murriztu eta bariantza analisiaren fidagarritasuna gehitu egiten da. Bloke faktoreak azalarazten duen errore esperimentala handia ez bada, hobe da zorizko diseinu huts batekin geratzea, bariantza analisiak fidagarritasuna galduko ez badu.

Diseinu errepikatuak[aldatu | aldatu iturburu kodea]

Azaldu gabeko aldakortasuna edo errore esperimentala murrizteko beste aukera bat, faktore konbinazio bakoitzeko behaketak errepikatzea da. Horrela, fidagarritasuna irabazten da, baina jaso beharreko datu kopurua biderkatu egiten da, ikerketaren kostua nabarmen gehituz.

Faktore finkoak eta zorizko faktoreak[aldatu | aldatu iturburu kodea]

Datuak biltzeko orduan, faktore bakoitzak hartzen dituen kategoria edo balio guztiak kontuan hartu direnean, faktorea finkoa dela esaten da. Faktore baterako, kategoria, balio edo unitate batzuk bakarrik hartu denean (unitate horiek populazio handiago bateko lagina izanik) faktorea zorizkoa da. Adibidez, ekoiztutako unitateen iraupenaren gainean makinen eta langileen efektua aztertzeko, makina bakoitzean lantegiko zenbait langile bakarrik jartzen denean lanean, bi faktore (makina eta langilea) aztertu behar da baina aukeratutako langileek populazio handiago baten lagina osatzen dute eta beraz, garatu beharreko eredua langileei buruz mistoa (faktore finko bat, makina alegia, eta faktore zorizko bat, langilea alegia) izango da.

Zorizko faktore bat sartzearen abantaila orokortasuna da. Adibidez, makinetako saiakuntzak langile ezberdinekin burutu eta zorizko efektuko eredua garatzean, langile aldagaiari buruzko ondorioak langile guztien populaziora zabaldu ahal izango dira.

Diseinu osoak eta zatiki faktorialak[aldatu | aldatu iturburu kodea]

Diseinu osoetan faktore guztietako mailak gurutzatu edo konbinatu egiten dira, datuak jasotzeari begira. Adibidez, errepikatu gabeko diseinu batean hurrenez 3, 4 eta 5 mailako saiakuntza baterako 3×4×5=60 behaketa behar dira. Maila kopurua handia duten faktoreak dituzten saiakuntzetan, behaketa kopurua murrizteko zatiki faktorialak erabiltzen dira. Esaterako, 3 mailako 3 faktoreko diseinu oso batek 3×3×3=27 behaketa behar ditu. Zatiki faktorialerako egitura den latindar karratu egiturari esker, 9 behaketa nahiko dira 3 faktoreak aztertzeko (1. faktorea: I, II, III; 2. faktorea: X, Y, Z; 3. faktorea: 1, 2, 3):

X Y Z
I 1 2 3
II 2 3 1
III 3 1 2

Hau da, latindar karratuaz I-X-1, ..., III-Z-2 faktore konbinazioei dagozkien behaketak bakarrik jasoko lirateke. 4 faktore zatiki faktorialez aztertzeko grekolatindar karratu diseinua ere badago.

Commonsen badira fitxategi gehiago, gai hau dutenak: Bariantza-analisi Aldatu lotura Wikidatan