Los ejes de inercia son independientes de la base ortonormal elegida

Como hemos visto en los post anteriores, la matriz de inercia de un conjunto de individuos respecto a un punto depende de la base ortonormal elegida como sistema de referencia pero los valores propios de las matrices de inercia del mismo conjunto de individuos respecto al mismo punto de referencia comparten los valores propios -y en cierto sentido, salvo un cambio de base, también los vectores propios-.

Esto es así porque las matrices V y V* son matrices semejantes. Es decir, existe una matriz invertible P tal que V*=P-1VP. En efecto, como ya se ha visto, V*=W’VW y como la matriz W es ortonormal W-1=W’.

Las matrices semejantes comparten ciertos invariantes. Entre ellos se encuentran el rango, el determinante, la traza, los valores propios y la ecuación característica.

Comprobemos que, en efecto, la ecuación característica de V y de V* son idénticas:

La ecuación característica de V* es det(V*-kI)=0. Pero V*=W’VW, luego la matriz anterior se puede escribir como W’VW-kI. Ahora bien, W’W=I, luego W’IW=I por lo que la expresión anterior se puede reescribir como W’VW-W’kIW. Ahora, sacando factor común podemos escribir W'(V-kI)W.

Como W’, V-kI y W son matrices cuadradas de dimensión k tenemos que el determinante del producto de matrices es igual al producto de los determinantes, es decir det(W'(V-kI)W)=det(W’)det(V-kI)det(W). Como W-1=W’, det(W’)det(W)=1, luego det(V*-kI)=det(V-kI), como queríamos demostrar. De aquí se deduce como corolario inmediato que los valores propios de V y de V* son los mismos.

Las matrices de inercia V son matrices simétricas semidefinidas positivas, es decir, dado cualquier vector w de Rk el escalar w’Vw es siempre mayor o igual que cero. Esto lo podemos ver fácilmente desde dos puntos de vista:

  • Desde el punto de vista del análisis de datos, la expresión w’Vw es la inercia a lo largo de la dirección del vector w -siempre que éste sea unitario- o un múltiplo positivo de ella. Naturalmente, por la propia definición de inercia -como una suma de cuadrados de distancias ponderadas por la masa de los individuos-, w’Vw no puede ser negativo.
  • Por otra parte, es sencillo comprobar que si A es una matriz nxk cuyos elementos son números reales la matriz A’A es una matriz semidefinida positiva. En efecto, si u es un vector cualquiera de Rk u’A’Au=(Au)'(Au). Au es un vector nx1 cuyos elementos son z1,…,zn y (Au)'(Au)=z1²+…+zn² que es necesariamente mayor o igual que cero. Las matrices de inercia son de la forma A’A. Por ejemplo, V=B’B y, de modo más general, V*=W’VW=W’B’BW=(BW)'(BW).

Una matriz es semidefinida positiva si y sólo si sus valores propios son todos mayores o iguales que cero. Naturalmente este es el caso de las matrices de inercia.

Como sabemos, a cada matriz simétrica se le puede asignar una forma cuadrática que tiene el mismo carácter que la matriz. Así, podemos entender la inercia a lo largo de un vector como una forma cuadrática definida sobre el conjunto de todos los vectores en Rk que es semidefinida positiva.

Sea qI(u) la forma cuadrática que a cada vector unitario u de Rk le hace corresponder la inercia de cierto conjunto de individuos a lo largo de su dirección. Sabemos que qI(u)=u’Vu, donde V es la matriz de inercia respecto a la base canónica -representada por el subíndice I-. Si deseamos expresar la misma forma cuadrática respecto a otra base ortonormal -por ejemplo W– podemos apoyarnos en el hecho de que W es una matriz ortonormal y que, por tanto WW’=I. Tendremos que qI(u)=u’Vu=u'(WW’)V(WW’)u=(u’W)(W’VW)(W’u)=qW(W’u). En esta expresión, el vector u expresado como tal respecto de la base canónica se ha convertido en el vector W’u respecto a la base W y la matriz de inercia V respecto a la base canónica se ha convertido en la matriz de inercia V*=W’VW. Ambas matrices, V y V* corresponden, sin embargo, a la misma forma cuadrática, solo que referidas a diferentes bases ortonormales.

En resumen:

  • La inercia a lo largo de un vector u de Rk cuando dicho vector y la matriz de inercia están referidos a la base canónica es qI(u)=u’Vu. Esta inercia es la misma que qW(W’u). La expresión de la matriz de inercia cambia -de V a W’VW-; la expresión del vector cambia -de u a W’u- pero siguen siendo en esencia la misma matriz de inercia y el mismo vector, sólo que referidos a diferentes bases ortonormales.
  • Las matrices de inercia V y W’VW son semejantes y en consecuencia comparten ecuación característica y valores propios. Así, el cálculo de la cantidad de inercia explicada a lo largo de los ejes de inercia es independiente de la expresión concreta de la matriz de inercia y será la misma sea cual sea la base ortonormal elegida.
  • Si uj es el j-ésimo eje de inercia referido a la base canónica y la inercia a lo largo de el es lj, también será lj la inercia a lo largo de W’uj cuando esta inercia se calcula respecto de la base ortonormal W. En otras palabras, si uj es la dirección del j-ésimo eje inercia respecto a la base canónica W’uj es el j-ésimo eje de inercia respecto a la base W. Pero uj y W’uj son en realidad el mismo vector sólo que expresado en función de dos sistemas de referencia -dos bases ortonormales- diferentes.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: