Una matriz de inercia diagonal

Hemos visto que existe una forma sencilla de obtener la matriz de inercia respecto a una base ortonormal cualquiera cuando se conocen dos cosas: la matriz de inercia respecto a la base canónica -a la que llamamos V– y los vectores que conforman la nueva base ortonormal –W1,…,Wk-. En efecto, si disponemos los vectores de la nueva base como las columnas de una matriz -a la que llamaremos W– basta con aplicar la fórmula V*=W’VW para obtener la matriz de inercia V* respecto a la base W.

Hemos visto también que las matrices V y V* son semejantes, es decir, son en esencia la misma matriz aunque referida a distintas bases.

Pues bien, en esta ocasión vamos a encontrar otra matriz semejante tanto a V como a V* que tiene la propiedad de ser una matriz diagonal. Se entiende por matriz diagonal aquella cuyos elementos situados fuera de la diagonal principal son todos nulos.

En efecto. Consideremos la matriz de inercia V y sus vectores propios. Como la matriz V es simétrica y semidefinida positiva, los valores propios serán no negativos y si los valores propios son todos distintos entre sí, los vectores propios de V -a los que llamamos u1,…,uk– forman una base ortonormal.

Vamos a calcular la matriz de inercia referida no a la base canónica sino a la base ortonormal constituida por los vectores propios de V. Bastará con aplicar la fórmula V*=W’VW pero, en este caso, la matriz W tendrá como columnas no vectores de una base ortonormal arbitraria sino los vectores de la base ortonormal formada por los vectores propios de V.

Es muy sencillo comprobar que la matriz resultante es una matriz diagonal y que los elementos de la diagonal principal son los valores propios de la matriz V en orden descendente. En efecto, los elementos de la diagonal principal serán de la forma u’jVuj pero como uj es vector propio de V podrán escribirse como u’jljuj=lju’juj=lj. Los elementos situados fuera de la diagonal principal serán de la forma u’iVuj y como uj es vector propio de V dicha expresión será igual a u’iljuj=lju’iuj=0, ya que los vectores propios de V son ortogonales.

Hemos encontrado que si reunimos los vectores propios de la matriz V y los escribimos como las columnas de una matriz kxk, a la que llamamos U tendremos que VD=U’VU -donde el subindice D se refiere al carácter diagonal de la matriz VD-. Es decir, la existencia de la matriz U, invertible, es la que hace semejantes a las matrices V y VD.

Pero, cabe preguntarse: ¿esto que hemos demostrado para la matriz de inercia V, referida a la base canónica, se cumplirá también para una matriz de inercia referida a otra base ortonormal arbitraria W1,…,Wk? En efecto: si tenemos en cuenta que dado que la matriz W -la que recoge como columnas los vectores de la nueva base ortonormal- es una matriz ortonormal nos daremos cuenta de que el producto WW’=I. Si aprovechamos esta expresión y la introducimos convenientemente en la anterior VD=U’VU tenemos que VD=U'(WW’)V(WW’)U=(U’W)(W’VW)(W’U)=(U’W)V*(W’U). Hemos encontrado que a pesar de que la matriz de inercia de la que partamos no sea la referida a la base canónica sino la referida a una base ortonormal cualquiera W1,…,Wk cuando expresamos dicha matriz de inercia V* respecto a la base formada por sus vectores propios -recuérdese que si U es la matriz que recoge los vectores propios de V entonces W’U es la matriz que recoge los vectores propios de V*– el resultado es una matriz de inercia diagonal -de hecho, es la misma matriz de inercia diagonal-.

Las matrices V, V* y VD son semejantes entre sí. Son, en esencia, la misma matriz simétrica, la misma forma cuadrática, pero expresada respecto a distintos sistemas de referencia:

  • V está expresada respecto a la base canónica.
  • V* está expresada respecto a una base arbitraria W1,…,Wk
  • VD está expresada respecto a la base ortonormal constituida por los sucesivos ejes de inercia.

Por ser semejantes, las matrices anteriores comparten ecuación característica y, por ende, valores propios y traza. De hecho, la traza de las tres matrices anteriores es la inercia total de la nube de individuos respecto al punto de referencia pero la forma de repartir esta inercia es diferente ya que los sucesivos elementos de la diagonal principal en cualquiera de estas matrices recogen la inercia a lo largo de los sucesivos vectores que conforman la base respecto a la que están calculadas. Siendo esto así:

  • V reparte la inercia total entre los vectores de la base ortonormal canónica, es decir, los elementos de la diagonal principal de V expresan la inercia a lo largo de cada una de las variables originales.
  • V* reparte la inercia total entre los vectores de la base W1,…,Wk.
  • VD reparte la inercia total entre los vectores de la base ortonormal formada por los ejes de inercia. Es decir, los elementos de la diagonal principal de VD -que son los valores propios de V- expresan la inercia a lo largo de los sucesivos ejes de inercia.

Naturalmente, por la propia definición de eje de inercia, el reparto que VD hace de la inercia total concentra la inercia en los primeros ejes de inercia en detrimento de los últimos. Ese es, precisamente, el objetivo último del análisis factorial.

El proceso de diagonalización que se ha presentado no siempre es posible. Sólo lo es cuando la matriz de inercia V -o en general V*- es diagonalizable -es decir, semejante a una matriz diagonal-. No todas las matrices simétricas son diagonalizables. Una matriz es diagonalizable si y sólo si la suma de las dimensiones de sus espacios propios coincide con la dimensión de la matriz. Una condición suficiente aunque no necesaria para que una matriz sea diagonalizable es que sus valores propios sean todos distintos entre sí. Este requisito no siempre se cumple en el caso de las matrices de inercia aunque en las aplicaciones prácticas no suele constituir un problema.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: