Covarianza y Matriz de Covarianza

Pocket

La Covarianza es una metrica usada para investigar la relacion entre dos variables bidimensionales (X_i,Y_i)~(i=1,2,3,\cdots,n). Esta metrica se usa tambien para calcular el coeficiente de correlacion que se explicara en la pagina siguiente.

La covarianza C(X,Y) se define como sigue:

\displaystyle Cov(X,Y)=\frac{1}{n}\sum_{i=1}^n(X_i-\bar{X})(Y_i-\bar{Y})  

Aqui, \bar{X} y \bar{Y} son las medias de las secuencias de datos (X_i~(i=1,2,3,\cdots,n) y Y_i~(i=1,2,3,\cdots,n)), respectivamente.

Como podemos ver en esta definicion, C(X,X) se corresponde con la varianza V[X], con el set de datos X_i~(i=1,2,3,\cdots,n).

\displaystyle Cov(X,X)=\frac{1}{n}\sum_{i=1}^n(X_i-\bar{X})^2 = V[X]  

Si tenemos un set de datos m-dimensional (multidimensional con m-dimensiones) (X_i^1,X_i^2,\cdots,X_i^m)~(i=1,2,3,\cdots,n), podemos calcular la covarianza para cada par de las m variables. Entonces, calculadas todas las covarianzas posibles, podemos construir una matrix m \times m, donde cada elemento es una varianza. Esta matriz se denomina Matriz de Covariancia.

El elemento (p,q) de la matriz de covarianza viene dado por la siguiente expresion \Sigma_{pq}:

\displaystyle \Sigma_{pq}=Cov(X^p,Y^q)=\frac{1}{n}\sum_{i=1}^n(X_i^p-\bar{X^p})(X_i^q-\bar{X^q})  

Los elementos diagonales de la matriz de covarianza V[X^p] son iguales a la varianza de cada variable X_i^p~(i=1,2,3,\cdots,n).

Es conocido, sin embargo, que el coeficiente de correlacion explicado en la pagina siguiente es usado mas frequentemente que esta matriz de covarianza.

Los comentarios están cerrados.