Txebixeven desberdintza
Probabilitate teorian eta estatistikan, Txebixeven desberdintzak edo Bienaymé-Txebixeven desberdintzak edozein probabilitate banakuntzatan, itxaropen matematiko edo batezbestekoa eta σ bariantza finituaren balioa soilik ezagutzen direlarik, suertatzen den balioa batezbestekotik gehienezko eta gutxienezko distantzia batera izateko probabilitatea hurbiltzen du, probabilitateari buruzko tarte bat ezarriz, probabilitate-banakuntza ezaguna ez denez probabilitate zehatza ezin baita finkatu. Zehatzago, suertatzen den balioa batezbestekotik gutxienezko ε distantzia batera izateko probabilitatea σ2/ε2 baino txikiagoa dela ezartzen du (eta beraz, gehienezko ε distantzia batera izateko probabilitatea 1-(σ2/ε2) baino handiagoa dela ere bai), non σ2 banakuntzaren bariantza den. Probabilitate-banakuntza zehatz bat ezarri ezin eta batezbestekoa eta bariantza soilik finkatu diren egoeretan probabilitateak hurbiltzeko baliatu ahal izateaz gainera, Txebixeven desberdintza teorema estatistiko garrantzitsuak frogatzeko erabiltzen da, hala nola zenbaki handien lege ahula. Konfidantza-tarteak eta horiek behar diren lagin-tamainuak finkatzeko ere erabiltzen da. Irenée-Jules Bienaymé estatistikaria izan zen desberdintza eta dagokion froga lehen aldiz plazaratu zuena 1853 urtean, bereziki beste gai zenbait garatzen zituen artikulu batean egin bazuen ere. Desberdintzaren berezko balioaz jabetu eta zabaldu zuena, ordea, Pafnuti Txebixev matematikaria izan zen 1867 urtean, desberdintzari buruzko berariazko artikulu batean. Hori dela eta, historialari gehienen irizpideari jarraiki, desberdintzaren meritua Txebixevi ematen zaio gehienetan.
Eduki-taula |
Txebixeven desberdintzaren formula [aldatu]
Batezbestekotik zehazten den distantzia desbideratze estandarraren terminoetan jartzen den formulak bi aldaera desberdin ditu. Bietan ez dago inongo lehentasun ordenarik eta bata zein bestea erabil daiteke kasu guztietan, batzuetan erosotasunez formularen aldaera bat bestea baino egokiagoa izan badaiteke ere.
Lehen aldaera [aldatu]
itxaropena eta
bariantza finitua dituen probabilitate banakuntza batean,
- muturretako probabilitaterako,
- batezbestekoaren inguruko tarte simetriko bati dagokion probabilitaterako, muturretako balioek (aurreko adierazpenean) aurkako gertakizuna osatzen dutela kontuan hartuz,
Bigarren aldaera [aldatu]
Itxaropenerako distantzia desbideratze estandarraren unitatetan neurtzen bada, hau da, ε=kσ bihurtuz soilik, Txebixeven desberdintza honela geratzen da:
- muturretako probabilitaterako,
- batezbestekoaren inguruko tarte simetriko bati dagokion probabilitaterako,
ADIBIDEA
Zorizko aldagai baten itxaropena 2000 eta bariantza 100 izanik, zenbatekoa da itxaropenetik 200 baino gutxiago desbideratzeko, hau da, X 1800-2200 bitartean suertatzeko probabilitatea?
Beraz, eskatutako probabilitatea 0.75 baino handiagoa da.
Desberdintzaren bigarren aldaera erabiliz, berriz:
Tarte nabarmenak, banakuntza normalarekin alderatuz [aldatu]
Honako taula honetan, Txebixeven desberdintzak k balio zenbaitetarako
probabilitateak zehazten dira,
zorizko aldagai normal estandar batean (non itxaropena eta bariantza 0 eta 1 diren, hurrenik hurren) eta U(0,1) banakuntza uniforme jarraitu batean (non itxaropena eta bariantza 0.5 eta 0.2886 diren, hurrenik hurren) suertatuko liratekeen probabilitate zehatzekin batera.
-
-
k balioa Txebixeven desberdintza (1/k2) Banakuntza normala U(0,1) banakuntza uniformea 1 ≥0 0.6827 0.5772 1.25 ≥0.36 0.7887 0.7215 1.5 ≥0.55 0.8664 0.8658 2 ≥0.75 0.9545 1 2.5 ≥0.84 0.9876 1 3 ≥0.889 0.9973 1 4 ≥0.9375 0.99994 1
-
Aurreko emaitzetan ohartzekoa da Txebixeven desberdintzaren zehaztasuna handiagoa dela k balio handietarako, betiere bi probabilitate-banakuntza zehatz horiekin alderaturik.
Desberdintzaren frogapenak [aldatu]
Lehen frogapena [aldatu]
Txebixeven lehen aldaerako formula frogatuko da. Horretarako bariantzaren definiziotik abiatu behar da.
balio baterako eta X zorizko aldagai jarraitu baterako:
-
(1)
Azken integralean,
Beraz, (1) adierazpenera itzuliz,
-
(2)
Eta, azkenik, (1) garapenaren abiapuntua eta (2) garapenaren bukaerako adierazpena lotuz:
Zorizko aldagai diskretu baterako modu berean frogatzen da, integralaren ordez batukaria eta f(x) dentsitate-funtzioaren ordez p(x) probabilitate-funtzioa ezarriz.
Markoven desberdintzan oinarritutako frogapena [aldatu]
aldagaia sortuz,
aldagairako Markoven desberdintza balia daiteke, balio ez negatiboak hartu eta bere itxaropen matematikoa, definizioz X aldagaiaren bariantza alegia, existitzen baita. Beraz,
Beste alde batetik,
betetzen denez:
Beraz,
Hirugarren frogapen sinple bat [aldatu]
Ondorengo frogapenak ez du kontuan hartzen banakuntza jarraitua edo diskretua den eta ez du baliatzen Markoven desberdintza.[2]
x aldagaian oinarrituta, zorizko aldagai berri hau sortzen da:
Orduan,
![y \leq (x-\mu_X)^2 \rightarrow E[Y]=\sum yp(y)=k^2\sigma_X^2P[|x-\mu_x| \geq k\sigma_X]+0 \times P[|x-\mu_x| < k\sigma_X]=k^2\sigma_X^2P[|x-\mu_x| \geq k\sigma_X] \leq E[(X-\mu_X)^2]=\sigma_X^2](http://upload.wikimedia.org/math/8/1/2/812562538819927f6f5e0b15a7a59bf2.png)
Hasierako eta bukaerako adierazpenak
adierazpenekin zatituz, Txebixeven desberdintza eskuratzen da:
Txebixeven desberdintzaren aldaerak [aldatu]
Banakuntza simetrikoak [aldatu]
Itxaropenaz eta bariantzaz gainera, banakuntza simetrikoa dela ezartzen bada, mutur bakar baterako probabilitatea ezar daiteke, hurbildutako probabilitatea zati bi eginez:
Aplikazioak [aldatu]
Probabilitate banakuntza batetik itxaropena eta bariantza ezagutzen direnerako probabilitate-tarteak eratzeaz gainera, Txebixeven desberdintzak beste zenbait aplikazio ditu.
Konfiantza-tarteak [aldatu]
Parametro bati buruzko konfiantza-tarteak erabiltzen da, zenbateslearen lagin banakuntzari buruz itxaropena, konfidantza-tartea eratzeko parametroaren balioarekin bat etorri behar duena (hau da, zenbateslea alboragabea izan behar da) eta bariantza soilik ezagunak direnean. Konfidantza tarte jakin bat eratzeko jaso beharreko lagin-tamainua kalkulatzeko ere erabil daiteke.
Populazio baten batezbestekoari buruzko konfiantza-tartea [aldatu]
Populazio guztietarako lagin-batezbestekoaren itxaropena eta desbideratze estandarra hauek dira, non
populazio-batezbestekoa den eta n lagin-tamainua:
Populazioa normala denean, gainera, lagin-batezbestekoa banakuntza normalari jarraiki banatzen da eta beraz, konfiantza-tartea eratzeko banakuntza normalean oinarritu behar da. Lagin-tamainua handia denean (oro har, n>30) ere erabiliko da banakuntza normala tartea eratzeko, limitearen teorema zentrala erabiliz, lagin-batezbestekoa normal banatzen baita kasu horretan. Beste kasu guztietan beraz, populazioa normaltzat jo ezin denean eta lagin-tamainua txikia denean alegia, populazio-batezbestekoari buruzko konfiantza-tartea eratzeko Txebixeven desberdintza erabili behar da, arestian zehaztutako itxaropena eta bariantza baliatuz:
Hortik konfiantza-tarte hau eratzen da,
konfiantza-mailakoa:
Adibidez, konfiantza-maila arruntetarako honela eratuko lirateke tarteak:
-
-
Konfiantza maila (
)
Konfiantza-tartea 0.8 2.23 
0.9 3.16 
0.95 4.47 
0.99 10 
-
Populazio-proportzio bati buruzko konfiantza-tarteak [aldatu]
Egoera guztietan
lagin proportzioaren itxaropena eta desbideratzen estandarra hauek dira, non p populazio-proportzioa den eta n lagin-tamainua:
Gainera, lagin-tamainua handia denean (oro har, n>30) lagin-proportzioa banakuntza normalaren bitartez hurbil daiteke eta orduan konfiantza-tartea gutxi gorabehera zehatza era daiteke. Lagin-tamainua txikia denean, konfiantza-tartea eratzeko lagin-proportzioaren jatorriko banakuntza den banakuntza binomiala har daiteke oinarritzat, Clopper-Pearson tartea eratzeko ondoren. Beste soluzio bat, tarte zabalagoak (baina bide batez, zuhurragoak ere bai) ematen dituen arren, Txebixeven desberdintza erabiltzea da, arestiko itxaropena eta desbideratzeak erabiliz:
Konfiantza maila modu zuhur batez finkatzearren, p proportzio ezjakintasunean,
adierazpenak balio minimoa hartzen duela pentsatu behar da: hori
adierazpenaren gehienezko balioa betetzen denean gertatzen da, kontuan hartuz p probabilitatea 0 eta 1 balioen artean egon behar dela. Beraz,
Hortik, konfiantza-tarte hau eratzen da:
-
, non konfiantza
den.
Ondorengo taulan, lagin-tamainu zenbaitetarako (lagin-tamainua 30 edo handiagoa denean, hurbilketa normala erabil daiteke) eta gutxieneko ohiko konfiantza-mailetarako sortuko liratekeen tarteak azaltzen dira, aurreko formulatik abiatuta:
-
-
Lagin-tamainua / Konfiantza-maila %80 %90 %95 %99 n=3 

- - n=5 

- - n=10 


- n=15 


- n=20 


- n=25 


-
-
Ikusten denez, Txebixeven desberdintzak oso konfiantza-tarte zabalak ematen ditu populazio-proportziorako, proportzioa [0,1] bitarteko balioak hartzen dituela kontuan hartuz. %99ko konfiantza-mailarako ezin da inongo tarterik zehaztu, kasu guztietan [0,1] mugetatik kanpo geratzen baita.
Zenbaki handien legea [aldatu]
Txebixeven desberdintza zenbaki handien lege ahula frogatzeko erabiltzen da, zeinak batezbesteko aritmetiko sinpleak populazioko batezbesteko edo itxaropen matematikotik distantzia batetik harago urruntzeko probabilitatea, laginaren tamainua handitu ahala, zerorantz doala baieztatzen duen:
Txebixeven desberdintzaren doitasuna [aldatu]
k-mugako banakuntzak [aldatu]
Txebixeven desberdintzak ezartzen duen probabilitate-muga hobezina dela esan daiteke, probabilitate-mugaren balioarekin bat datorren probabilitate-banakuntza bati buruzko probabilitate zehatza existitzen delako. Txebixeven probabilitate-muga zehazki betetzen duten banakuntzak k-mugako banakuntzak direla esaten da. Hain zuzen, oinarrian honelakoak dira Txebixeven desberdintzaren k-mugako banakuntzak:
-
-
x p(x) -1 
0 
1 
-
Arestiko probabilitate-banakuntzan itxaropena eta desbideratze estandarra
eta
hurrenik hurren direla jakinik eta Txebixeven desberdintza aplikatuz:
Probabilitate zehatza Txebixeven desberdintzaren mugaraino doi-doi heltzen da:
Froga daiteke aurreko probabilitate-banakuntzetarako burutzen den edozein y=mx+b motako aldagai aldaketen ondorioz sortutako probabilitate-banakuntza berriak ere k balio bererako k-mugako banakuntzak direla. Hortik, x k-mugako banakuntza orori, estandartuz, hau da, z=(x-μ)/σ aldaketa eginez, k-mugako banakuntza estandar (batezbestekoa 0 eta desbideratzea 1 dituena, alegia) bakarra dagokiola froga daiteke.
Froga daiteke, beste alde batetik ez dagoela k-mugako probabilitate-banakuntza jarraiturik.[3]
k-bildutako banakuntzak [aldatu]
k-bildutako banakuntzetan probabilitateak, k balio jakin baterako, Txebixeven desberdintzak ezarritako probabilitate-mugatik urrutien dauden banakuntzak dira. Adibidez, Txebixeven desberdintzak P[80<X<120]≥0.60 betetzen dela ezartzen duen kasuetarako, k-bildutako banakuntzan P[80<X<120]=1 betetzen da. Arestiko atal batean, U(0,1) banakuntza uniforme jarraitua k=2 baliotik gorako tarteetarako k-bildutako banakuntza da. Zehatzago, probabilitate-banakuntza bat k-bildutakoa dela esaten da
, hots,
betetzen denean.
Itxaropenetik batez besteko desbideratzea dela ezartzen duen desbideratze estandarraren definizioan oinarrituz, argi dago ez dagoela k<1 balio baterako k-bildutako banakuntzarik: probabilitate-masa guztia ezin da bildu
baino estuagoa den tarte batean,
parametroak itxaropenetik batez besteko desbideratzea adierazten duelako. Hala ere, badira ia k-bildutako-banakuntzak direnak.[3] Probabilitate-banakuntza hau definitzen bada, non
eta
betetzen diren:
-
-
x p(x) -1 
0 
1 
-
-
, zeinen limitea 1 den, n infiniturantz joan ahala.
Beste alde batetik, k-bildutako banakuntza izatetik neurri jakin batean hurbil dauden banakuntzak ere gara daitezke, baina oro har funtzio konplexuak dira, batere balio praktikorik ez dutenak.[3]
Erreferentziak [aldatu]
- ↑ (Ingelesez) Hogg, Robert V.; Craig, Allen T. (1995), Introduction to Mathematical Statistics, 58-59. orr., http://maxwell.ciencias.ubiobio.cl/~drisso/libros/Statistics/Hogg%20Craig%20Introduction%20to%20Mathematical%20Statistics.pdf
- ↑ (Ingelesez) Yeh, Rui Zong (1973), Modern Probability Theory.
- ↑ a b c (Ingelesez) Bias, Peter; Hedman, Shawn; Rose, David (2010), «Boundary Distributions with Respect to Chebyshev's Inequality», Journal of Mathematics and Statistics, http://thescipub.com/html/10.3844/jmssp.2010.47.51







(1)
(2)![\sigma^2 \geq \epsilon^2 P[|x-\mu| \geq \epsilon] \rightarrow P[|x-\mu| \geq \epsilon] \leq \frac{\sigma^2}{\epsilon^2}](http://upload.wikimedia.org/math/8/b/4/8b447815e5b20ecec8b8fd928c55450a.png)
![P(Y \geq k^2E[Y]) \leq \frac{1}{k^2}](http://upload.wikimedia.org/math/c/a/8/ca81d420e27aa9d73edc84e959aac413.png)
![P(Y \geq k^2E[Y])=P(\ (X-E[X])^2 \geq k^2\sigma_X^2\ )=P(|X-E[X]| \geq k\sigma_X)](http://upload.wikimedia.org/math/0/3/b/03bcdeedc4e9df7bad95dbb41ca523d6.png)
![P(|X-E[X]| \geq k\sigma_X) \leq \frac{1}{k^2}](http://upload.wikimedia.org/math/b/9/b/b9b0b22e68dbb6714227460dabc1a1ac.png)

![P[|x-\mu_x| \geq k\sigma_X] \leq \frac{1}{k^2}](http://upload.wikimedia.org/math/9/f/2/9f2059b862e01ba9207663f0288a7156.png)
![\forall x_0< \mu\ ; P[X<x_0] \leq \frac{\sigma^2}{2(\mu-x_0)^2}](http://upload.wikimedia.org/math/9/0/e/90e783694ad036a5e043e6d47e3e56d1.png)
![\forall x_0> \mu\ ; P[X>x_0] \leq \frac{\sigma^2}{2(x_0-\mu)^2}](http://upload.wikimedia.org/math/9/1/2/91286a533b28d6e2dd85cb28b257fed2.png)
![\mu_{\overline{x}}=E[\overline{x}]=\mu](http://upload.wikimedia.org/math/6/4/5/6455bc8db6f03afa1f67dbed9fa1dc4b.png)
![\sigma_{\overline{x}}=var[\overline{x}]=\frac{\sigma}{\sqrt{n}}](http://upload.wikimedia.org/math/e/e/4/ee4d398386802745cc44cb7fca2128f9.png)
![P[|\overline{x}-\mu|<k\sigma] \geq 1-\frac{1}{k^2}](http://upload.wikimedia.org/math/9/2/3/923833fe1ef20d8d70359cabfd6990a2.png)

)




![\mu_{\hat{p}}=E[\hat{p}]=p](http://upload.wikimedia.org/math/2/d/f/2df3c7c2f29d93108851d4a511676e05.png)
![\sigma_{\hat{p}}=var[\hat{p}]=\sqrt{\frac{p(1-p)}{n}}](http://upload.wikimedia.org/math/0/c/4/0c42f30bdf9b282cd714299b3c742cd4.png)
![P[|\hat{p}-p|<\epsilon] \geq 1-\frac{\sigma^2}{\epsilon^2} = 1-\frac{p(1-p)}{n \epsilon^2}](http://upload.wikimedia.org/math/5/8/7/587dd73ce5bde2763438421b285804ea.png)
![P[|\hat{p}-p|<\epsilon] \geq 1-\frac{1}{4n \epsilon^2}](http://upload.wikimedia.org/math/8/b/2/8b22ad64337a51efa2b64ee0aa566b8f.png)
, non konfiantza
den.















![P[|X-\mu|<k\sigma]=P[|X|<1] \leq 1-\frac{1}{k^2}](http://upload.wikimedia.org/math/a/3/7/a3799dc0fd8a94e9c625cb7256a04c30.png)
![P[|X|<1]=P[X=0]=1-\frac{1}{k^2}](http://upload.wikimedia.org/math/2/0/8/208ac26b8f4d7d5dbcba26d9e857c8c5.png)


, zeinen