Erregresio logistiko

Wikipedia(e)tik
Hona jo: nabigazioa, Bilatu

Estatistikan, erregresio logistikoa edo logit eredua gertakizun baten probabilitatea aurresateko erabiltzen den erregresio-teknika bat da, aldagai independente zenbaitetan oinarrituta kurba logistiko bat egokituz. Adibidez, erregresio logistikoa pertsona batek aldi batean bihotzekoak jota izateko probabilitatea zenbatesteko erabil daiteke, bere adina, pisua eta errentzen duen jakinda. Alderantziz, probabilitate zehatz baterako, beste aldagai batek hartu behar duen balioa zenbatesteko ere erabil daiteke. Adibidez, gaixotasun bat ez garatzeko probabilitatea %99 izan dadin, farmako batetik hartu beharreko dosia zein izan behar den kalkula daiteke erregresio logistikoaren bitartez, dosi ezberdinetarako gaixotasun garatu duten pertsonen kopuruari buruzko datuak erabiliz.

Planteamendua[aldatu | aldatu iturburu kodea]

Kurba logistikoari dagokion funtzioa hau da:


f(z)=\frac{1}{1+e^{-z}}


Azaldu beharreko aldagaia p\, probabilitate bat denez, honela idatz daiteke:


p=\frac{1}{1+e^{-z}}


Aldi berean:


1-p=\frac{e^{-z}}{1+e^{-z}}


Arestiko bi adierazpenak zatituz:


\frac{p}{1-p}=\frac{\frac{1}{1+e^{-z}}}{\frac{e^{-z}}{1+e^{-z}}}=\frac{1}{e^{-z}}=e^z


Logaritmoak hartuz:


ln{\frac{p}{1-p}}=ln\ e^z=z


z\, aldagai independentearen balioa gertakizunaren probabilitatea azaltzeko erabili diren aldagai guztien balioak funtzio lineal batez kalkulatzen da: z=\beta_0+\beta_1x_1+\cdots+\beta_kx_k.

Beraz:


ln{\frac{p}{1-p}}=\beta_0+\beta_1x_1+\cdots+\beta_kx_k


Azken adierazpen honetako koefizienteak erregresio-eredu sinple batez zenbatets daitezke.