La distribucion t de Student

Pocket

En esta seccion, introduciremos la distribucion t de Student. Esta distribucion is usada en la estimacion de intervalos para calcular la media de una poblacion cuando la varianza de la poblacion no es conocida y cuando el tamanyo de la muestra es pequenyo (i.e. no mas de 30 elementos u observaciones).

La distribucion t de Student se define como

\displaystyle f(t)=\frac{\Gamma(\frac{m+1}{2})}{\sqrt{m\pi}\Gamma(\frac{m}{2})}\Bigl(1+\frac{t^2}{m}\Bigr)^{-\frac{m+1}{2}}.

En esta expression, \Gamma(x) denota la funcion Gamma y  m indica el numero de grados de libertad.

Como veremos mas adelante, el numero de grados de libertad m esta relacionado con el tamanyo de la muestra n en la estimacion del intervalo.

Aunque esta ecuacion parece complicada y compleja, no sera usada a menudo. En su lugar, usaremos la tabla de la distribucion t o cualquier otro software or paquete de estadistica como Excel.

 

La distribucion t de Student tendera a la distribucion normal cuando los grados de libertad m se incrementan. De hecho, cuando los grados de libertad son suficientemente grandes (m>30), la distribucion t es muy similar a la distribucion normal. Esta propiedad representa la principal diferencia entre el tipo 2, introducido anteriormente,  el tipi 3 en la estimacion de intervalos. Ademas, cuando los grados de libertad m decrecen, la cola de la distribucion t se convierte en una distrucion de cola “gorda” ( al menos de mas grosor que la esperada por una distribucion normal) en ambos lados de el horizontal (en la direccion positiva y negativa).

En lo que sigue, explicaremos un teorema importante para la distribucion t. Sea \mu la media de la poblacion, \bar{X} la media de la muestra, s la media de la distribucion estandar, y n el tamanyo de la muestra.  Entonces, podemos demostrar que el valor definido por \displaystyle t=\frac{\bar{X}-\mu}{\frac{s}{\sqrt{n}}} es equivalente a la distribution t con grados de libertad  m=n-1.

Este teorema se usa en el tipo 3 de estimacion de intervalos (i.e. estimar la media de una poblacion cuando la varianza de la poblacion es no conocida y ademas el tamanyo de la muestra es pequenyo) .

Recordemos que el caso anterior, el tipo 2, se diferencia de este en que el tamanyo de la muestra n es grande (mas de 30 elementos) y el valor t se aproximaria al de la distribucion normal. En la proxima pagina, explicaremos el tipo 3 usando este teorema. Entonces tendremos tomas las tecnicas necesarias para presentar un ejemplo numerico concrete y usar el tipo 3 para predecir una estimacion de intervalos con datos reales.

Los comentarios están cerrados.