Korrelazio-koefiziente

Wikipedia(e)tik
Hona jo: nabigazioa, Bilatu

Estatistikan, Pearsonen korrelazio koefiziente linealak edo, labur, korrelazio koefizienteak bi aldagai kuantitatiboren arteko korrelazio linealaren norabidea eta sendotasuna neurtzen duen adierazle bat da. Kobariantzatik eratortzen den koefizientea da: jatorrizko datuez kalkulaturiko kobariantza dimentsionatua izanik, korrelazioaren sendotasuna neurtzeko egokia ez denez, jatorrizko datuak estandarizatu eta datu estandarizatu hauekin kobariantza kalkulatuz lortzen da Pearsonen korrelazio koefizientearen formula.

Azpimarratu behar da Pearsonen korrelazio koefiziente linealak korrelazio lineala neurtzen duela eta ez dituela antzematen aldagaien artean izan daitezkeen bestelako erlazio motak.

Kalkulua lagin baterako[aldatu | aldatu iturburu kodea]

Honela irudikatu eta kalkulatzen da lagin batean,  (x_1, y_1), (x_2, y_2), \ldots,(x_n, y_n) datuetarako:

r_{xy}=\frac{s_{xy}}{s_xs_y},

s_{xy} bi aldagaien arteko kobariantza eta s_x, s_y x eta y aldagaien desbideratze estandarrak izanik hurrenez hurren.

Interpretazioa[aldatu | aldatu iturburu kodea]

Koefizientearen zeinuari buruz:

  • positiboa bada, korrelazioa positiboa edo zuzena izango da, hau da, aldagai batek gora egitean, eskuarki besteak ere gora egingo du;
  • negatiboa bada, korrelazioa negatiboa edo alderantzizkoa izango da, hau da, aldagai batek gora egitean, eskuarki besteak behera egingo du.

Koefizientearen balio absolutuari buruz:

  • 0 bada, bi aldagai kuantitatiboen artean ez dago korrelazio linealik.
  • 0.3 baino txikiagoa bada, korrelazioa ahula dela esan daiteke.
  • 0.3-0.6 tartean bada, korrelazioa ertaina dela esan daiteke.
  • 0.6 baino handiagoa bada, korrelazioa sendoa dela esan daiteke.
  • 1 bada, korrelazio lineala erabatekoa da: bi aldagaiei dagozkien puntuak zuzen bati jarraituz lerrokaturik daude.

Dena den, esan behar da interpretazio egokiagoa egiteko korrelazioaren aztergai diren antzeko ikerketak ere kontuan hartu behar direla.