Las dos caras de una misma moneda

Ha quedado claro que el procedimiento de encontrar los valores y los vectores propios de la matriz V -o de cualquier matriz semejante a ella- proporciona los ejes de inercia de la nube de individuos así como la inercia explicada a lo largo de cada uno de estos ejes.

Efectivamente, la matriz V -o cualquiera semejante a ella- recoge la inercia de los individuos y proporciona un método sencillo para determinar las direcciones básicas de la nube que conforman.

No obstante, es posible considerar otro punto de vista que, en ocasiones, puede simplificar los cálculos que hay que realizar. Para presentar este nuevo punto de vista debemos ver la matriz de datos no como un conjunto de n individuos en un espacio de k variables sino al contrario: como un conjunto de k variables situadas en el espacio generado por los individuos, esto es, Rn.

En efecto, si consideramos que la matriz B recoge las coordenadas de los individuos respecto al punto de referencia corregidas por las raíces cuadradas de sus masas, podemos definir la j-ésima variable como la j-ésima columna de la matriz B. Así, la j-ésima variable -a la que llamaremos Yj– es un vector columna cuyos componentes son los n valores que los individuos toman en la j-ésima variable -corregidos para que el origen coincida con el punto de referencia- y ajustados con la raíz cuadrada de la masa del individuo. Las k variables se encuentran situadas en el espacio Rn. Se acepta que la masa de todas las variables es unitaria.

Una vez cambiado el punto de vista -no hablamos ya de puntos-individuo en el espacio de las variables sino de puntos-variable en el espacio de los individuos; además, todos los puntos-variable tienen masa unitaria- podemos comenzar por definir conceptos análogos a los que se presentaron para la nube de individuos pero en esta ocasión para la nube de variables.

  • La inercia de una variable respecto al origen de coordenadas vendrá dada por el producto de la masa de la variable por el cuadrado de su distancia al origen. Es decir, la inercia de una variable respecto al origen será el cuadrado de su módulo. Merece la pena hacer un comentario sobre el sentido que tiene el origen de coordenadas en el espacio Rn de los individuos. Una variable que se encontrara situada en el origen -es decir, una variable nula– sería aquella para la que todos los individuos presentan un valor idéntico al valor del punto de referencia. En otras palabras, todos los individuos toman el mismo valor en la variable nula y este valor coincide con el valor que toma la variable en el punto de referencia. En el caso de que el punto de referencia fuera el centro de gravedad de la nube de indiviudos, una variable nula -y por extensión, el origen de coordenadas del espacio Rn– representan una variable que no cambia, es decir, una constante. Naturalmente la inercia del conjunto de variables respecto al origen de coordenadas es la suma de todas las inercias. Es muy fácil demostrar que la inercia total de las variables es la misma que la inercia total de los individuos. Esto pone de manifiesto que se trata de dos representaciones alternativas de la misma realidad.
  • Por otra parte, la inercia de una variable a lo largo de una dirección unitaria w de Rn vendrá dada por el cuadrado del producto escalar de la variable por el vector unitario, es decir, (w’Yj)2. Análogamente, la inercia del conjunto de variables respecto al origen de coordenadas en la dirección w vendrá dada por la suma de las inercias para todas las variables. Es muy sencillo demostrar que esta inercia del conjunto de variables a lo largo de la dirección w viene dada por w'(BB‘)w, expresión que recuerda a la obtenida para la inercia de los individuos a lo largo de la dirección u: u'(BB)u.

A la matriz V=BB la llamamos matriz de inercia pero ahora debemos concretar más. V=BB es la matriz de inercia de los individuos respecto al origen -y respecto a la base ortonormal canónica-. A la matriz BB‘ la llamaremos gamma y es la matriz de inercia de las variables respecto al origen de coordenadas del espacio Rn. Recordemos que la matriz V nos proporciona -en su diagonal principal- una descomposición de la inercia total entre las variables originales. Análogamente, la matriz gamma nos proporciona -en su diagonal principal- una descomposicón de la inercia total entre los individuos.

Como la inercia total de los individuos y las variables es la misma (y dicha inercia debe aparecer en la traza de las matrices V y gamma respectivamente) resulta obvio que las matrices V y gamma comparten traza. Pero esto no es lo único que comparten:

  • Los valores propios no nulos de las matrices V y gamma son los mismos. Concretando más: como la inercia es una forma cuadrática semidefinida positiva -y esto es de aplicación tanto para la inercia de las variables como para la de los individuos- sabemos que los valores propios de gamma y de V son no negativos. Como V es una matriz de dimensión k puede tener a lo sumo k valores propios no nulos (pongamos que tiene k1 valores propios no nulos y k2 valores propios nulos). Por su parte, gamma -de dimensión n- puede tener a lo sumo n valores propios no nulos (pongamos que tiene n1 valores propios no nulos y n2 nulos). Pues bien, k1=n1<=min(k,n) es el número de valores propios no nulos de V y de gamma y estos k1=n1 valores propios coinciden en ambas matrices.
  • Calculados los vectores propios w1,w2,…,wn1 correspondientes a los n1=k1 valores propios no nulos de la matriz gamma existe una fórmula -llamada fórmula de transición- para obtener los vectores propios u1,…,uk1 correspondientes a los k1=n1 valores propios no nulos de la matriz V. En otras palabras: aunque por el momento los vectores propios de la matriz gamma no son de nuestro interés -veremos más adelante que sí tienen cierta interpretación- son un medio para obtener los vectores u1,…,uk1, que son los ejes de inercia de la nube de individuos.

En resumen: para obtener los valores y los vectores propios de la matriz V -que son los que de verdad nos interesan- y así conocer los ejes de inercia de la nube de individuos y la inercia explicada a lo largo de cada uno de ellos existen dos procedimientos:

  • El procedimiento directo, que consiste en obtener los valores propios de V (matriz de dimensión k) y, a partir de ellos, los vectores propios correspondientes a los valores propios no nulos: u1,…,uk1 .
  • El procedimiento indirecto, que consiste en obtener los valores propios de gamma (matriz de dimensión n) y, a partir de ellos, los vectores propios correspondientes a los valores propios no nulos: w1,…,wn1. Una vez obtenidos estos vectores propios, que en principio carecen de interpretación directa, se emplean las fórmulas de transición para calcular los vectores propios de V: u1,…,uk1.

¿Cuál de los dos caminos es más recomendable? La respuesta es bien sencilla: el paso más trabajoso en el procedimiento para el cálculo de los ejes de inercia es la obtención de los valores y los vectores propios de una matriz cuadrada De hecho, it is well known that the computational complexity of matrix diagonalization scales with O(n3). Debemos, por tanto, elegir entre trabajar con la matriz V (de dimensión k) o la matriz gamma (de dimensión n). Naturalmente, si el número de individuos n del problema es mayor que el número de variables k optaremos por trabajar con la matriz de los individuos -que tiene dimensión k-; si, por el contrario, el número de variables k es mayor que el número de individuos n trabajaremos con la matriz de inercia de las variables, gamma -que tiene dimensión n-. En este último caso, el inconveniente de tener que utilizar las fórmulas de transición para calcular los vectores propios de V queda más que compensado por el hecho de tener que obtener los valores y los vectores propios de una matriz de menor dimensión, tal y como resulta evidente por la complejidad cúbica de la tarea de diagonalizar una matriz.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: