Covarianza y Matriz de Covarianza

La Covarianza es una metrica usada para investigar la relacion entre dos variables bidimensionales [latex](X_i,Y_i)~(i=1,2,3,\cdots,n)[/latex]. Esta metrica se usa tambien para calcular el coeficiente de correlacion que se explicara en la pagina siguiente.

La covarianza [latex]C(X,Y)[/latex] se define como sigue:

[latex size=2]\displaystyle Cov(X,Y)=\frac{1}{n}\sum_{i=1}^n(X_i-\bar{X})(Y_i-\bar{Y})[/latex]
 

Aqui, [latex]\bar{X}[/latex] y [latex]\bar{Y}[/latex] son las medias de las secuencias de datos ([latex]X_i~(i=1,2,3,\cdots,n)[/latex] y [latex]Y_i~(i=1,2,3,\cdots,n)[/latex]), respectivamente.

Como podemos ver en esta definicion, [latex]C(X,X)[/latex] se corresponde con la varianza V[X], con el set de datos [latex]X_i~(i=1,2,3,\cdots,n)[/latex].

[latex size=2]\displaystyle Cov(X,X)=\frac{1}{n}\sum_{i=1}^n(X_i-\bar{X})^2 = V[X][/latex]
 

Si tenemos un set de datos m-dimensional (multidimensional con m-dimensiones) [latex](X_i^1,X_i^2,\cdots,X_i^m)~(i=1,2,3,\cdots,n)[/latex], podemos calcular la covarianza para cada par de las m variables. Entonces, calculadas todas las covarianzas posibles, podemos construir una matrix [latex]m \times m[/latex], donde cada elemento es una varianza. Esta matriz se denomina Matriz de Covariancia.

El elemento (p,q) de la matriz de covarianza viene dado por la siguiente expresion [latex]\Sigma_{pq}[/latex]:

[latex size=2]\displaystyle \Sigma_{pq}=Cov(X^p,Y^q)=\frac{1}{n}\sum_{i=1}^n(X_i^p-\bar{X^p})(X_i^q-\bar{X^q})[/latex]
 

Los elementos diagonales de la matriz de covarianza [latex]V[X^p][/latex] son iguales a la varianza de cada variable [latex]X_i^p~(i=1,2,3,\cdots,n)[/latex].

Es conocido, sin embargo, que el coeficiente de correlacion explicado en la pagina siguiente es usado mas frequentemente que esta matriz de covarianza.