Banaketa normal

Wikipedia(e)tik
Banakuntza normal» orritik birbideratua)
Hona jo: nabigazioa, Bilatu
Parametro ezberdinak dituzten lau banaketa normalen trinkotasun funtzioak. Kolore berdez irudikatzen dena N(0,1) banaketa normal estandarra da.

Probabilitate teorian eta estatistikan, zorizko aldagai bat banaketa normalari jarraitzen diola, zorizko aldagai gausstarra dela, edo laburrago normal banatzen dela esaten da, zorizko aldagaiaren trinkotasun funtzioa honelakoa denean:

f(x)=\frac{1}{\sigma \sqrt{2\pi}}\mathrm{e}^{\displaystyle-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2};-\infty<x<\infty

Estatistikan gehien erabiltzen den probabilitate banaketa da, bere ezaugarri bereziengatik. Zorizko aldagaiak har ditzakeen balioei buruz inongo murrizketarik jartzen ez duela (bere balio posibleak -\infty-tik \infty-ra baitoaz), bere trinkotasun funtzioak kanpai itxura erakusten du beti (eta horregatik Gaussen kanpaia ere deitzen zaio), datuen histograma irudikatuz gero errealitateko aldagai asko bezalaxe. Hori dela eta, aldagai askoren eredu gisa aukeratzen da, normal izena hortik datorrelarik. Bestalde, oso propietate matematiko interesgarriak ditu: probabilitate banaketa anitzen limitea da eta inferentzian zenbatesle askoren banaketa izanik, hipotesi kontraste eta konfiantza tarte askotarako erabiltzen da. Limitearen teorema zentralari esker, banaketa normala zorizko aldagaia faktore anitzen ekarpenen batura denerako ere da baliozkoa.

Banakuntza normala bi parametroren araberakoa da: μ eta σ, batez bestekoa edo itxaropen matematikoa eta desbideratze estandarra hurrenez hurren. Horrela, X aldagai bat banaketa normalari jarraitzen diola honela adierazten da:

X \sim N\big(\mu,\ \sigma\big)

Banakuntza normal estandarra μ=0 eta σ=1 parametroak dituen banaketa normala da eta beste banaketa normaletako probabilitateak kalkulatzeko oinarri gisa erabiltzen da. Banakuntza normal estandarra honela irudikatzen da:

Z \sim N\big(0,\ 1\big)

Propietateak[aldatu | aldatu iturburu kodea]

  • Banakuntza normalaren itxaropen matematikoa μ da. Desbideratze estandarra σ da.
  • Banakuntza normalaren trinkotasun funtzioa simetrikoa da, x=\mu ardatzaren inguruan.
  • Mediana eta moda bat datoz μ itxaropen matematikoarekin.
  • Itxaropen matematikoaren inguruko probabilitateak hauek ditugu:
    • [μ - σ, μ + σ] tarteko probabilitatea %68,26 da.
    • [μ - 2σ, μ + 2σ] tarteko probabilitatea %95,44 da.
    • [μ -3σ, μ + 3σ] tarteko probabilitatea %99,74 da.
  • Banakuntza normal estandarrean inferentzia estatistikoan maiz erabiltzen diren pertzentil jakingarri hauek daude:
    • P(Z<3.29053)=0.9995, hau da, banaketa normal estandar batean bere azpitik 0.9995eko probabilitatea uzten duen balioa 3.29053 da.
    • P(Z<3.09023)=0.999
    • P(Z<2.57583)=0.995
    • P(Z<2.32635)=0.99
    • P(Z<2.05375)=0.98
    • P(Z<1.95996)=0.975
    • P(Z<1.64485)=0.95
    • P(Z<1.28155)=0.90
  • X aldagai normal bati aldagai aldaketa lineala egiten bazaio, X ~ N(μ, σ) eta a, b zenbaki errealak izanik, orduan (aX + b) ~ N(+b, |a|σ).
  • X ~ N(μx, σx) eta Y ~ N(μy, σy) izanik, eta Y elkarrekiko independenteak direlarik, orduan:
    • U = X + Y ~ N(μx + μy, σx2 + σy2)
    • Arestikoaren alderantziz, independenteak diren bi zorizko aldagaien batura normal banatzen bada, bi zorizko aldagaiak normalak izan behar dira, Cramerren teoremaren arabera.
    • V = X - Y ~ N(μx - μy, σx2 + σy2)
    • X eta Y zorizko aldagaiek bariantza berdinak badituzte, U eta V elkarrekiko independenteak dira.

Probabilitateen kalkulua eta zorizko aldagai normalen estandarizazioa[aldatu | aldatu iturburu kodea]

Probabilitateak banaketa funtzioa erabiliz kalkulatzen dira, μ eta σ zehaztu ondoren:

F_X(x)=P(X \leq x)=\int_{-\infty}^x f_X(x)dx=\frac{1}{\sigma\sqrt{2\pi}}
\int_{-\infty}^x
e^{-\frac{(x - \mu)^2}{2\sigma^2}}\, dx ,\quad x\in\mathbb{R}

Aurreko kalkulua eskuz oso konplexua denez, probabilitateak estandarizazioa delako prozesu batez kalkula daitezke errazago. Estandarizazioaz banaketa normal guztiak banaketa normal estandarrera bihurtzen dira. Bihurketa hau egin eta gero, banaketa normal estandarreko probabilitateak taula batez aise kalkulatzen dira (taula ikusteko, eranskinera jo). X zorizko aldagai normal bat estandarizatzeko, μ itxaropena kendu eta emaitza σ desbideratze estandarraz zatitzen da:


P(X<x)=P\Big(\frac{X-\mu}{\sigma}<\frac{x-\mu}{\sigma}\Big)=
P\Big(Z<\frac{x-\mu}{\sigma}\Big)


Adibidez, X \sim N\big(\mu=8,\ \sigma=2\big) dugularik, zenbatekoa da P\big(X<10.2\big) probabilitatea?


P\big(X<10.2\big)=P\Big(Z<\frac{10.2-8}{2}\Big)=P(Z<1.1)=0.8643


Balio batetik gorako probabilitateak eta balio negatiboei dagozkien probabilitateak banaketa normalaren simetria eta probabilitateen osagarritasuna erabiliz kalkulatzen dira. z \geq 4 balioetarako probabilitateak ia 1 direla esan daiteke, taulan agertzen den zehaztasunerako.

Taularik ezean, banaketa funtzioaren probabilitateak errore funtzioa, erf ikurrez irudikatzen dena, eta bere Taylorren garapena erabiliz kalkula daitezke. Banakuntza normal estandarraren banaketa funtzioa honela lotzen da errore funtzioarekin:


\Phi(z)
=\frac{1}{2} \Bigl[ 1 + \operatorname{erf} \Bigl( \frac{z}{\sqrt{2}} \Bigr) \Bigr],
\quad x\in\mathbb{R}.

Ikus, gainera[aldatu | aldatu iturburu kodea]

Kanpo loturak[aldatu | aldatu iturburu kodea]

Commonsen badira fitxategi gehiago, gai hau dutenak: Banaketa normal Aldatu lotura Wikidatan