Box-Cox aldakuntza

Wikipedia(e)tik
Hona jo: nabigazioa, Bilatu

Estatistikan, Box-Cox aldakuntza aldagai bakarreko datu multzo bat banaketa normalera egokitzeko aldakuntza da: funtzio baten bitartez, jatorrizko datuak beste datuetara bihurtzen dira, banaketa normalera egokituagoak izango direlako helburuz.

Jatorrizko datuak x eta datu aldatuak x^{(\lambda)} izanik, honela definitzen da aldakuntza:


x^{(\lambda)}=
\left\{
\begin{matrix} 
\frac{(x+m)^\lambda-1} {\lambda} & \lambda \ne 0 & x>-m \\ 
ln(x+m) & \lambda=0 & m>0
\end{matrix}
\right.

non \lambda datuetan oinarrituz zenbatesten den parametroa den, aldakuntza parametroa alegia. x+m balio guztiak positibo egiten dituen m balioa aukeratu behar da. Beraz, m=0, datu guztiak positiboak badira, eta bestela, datu txikienaren balio absolutua izango da, datu negatiborik badago.

Aldakuntza parametroaren zenbatespena[aldatu | aldatu iturburu kodea]

Datuak banaketa normalera egokitzen dituen \lambda parametroa honela zenbatetsi daiteke:


  • ondoren, L(\lambda)=-\frac{n}{2}\text{ln}\sum(z_i(\lambda)-\overline{x}(\lambda))^2 adierazpena maximizatzen duen \lambda izango da aldakuntza parametro egokiena, zehatzago, normaltasunerako parametroaren egiantz handieneko zenbateslea.