La mejor fotografía

Hemos visto ya que la matriz de inercia V recoge -fijada la base ortonormal, que por defecto será la canónica- toda la información referida a las masas de los individuos así como a las distancias de éstos respecto al punto de referencia. Hemos visto también que dada una dirección cualquiera del espacio -expresada en forma de vector u, que debe ser unitario- la inercia del conjunto de individuos a lo largo de dicha dirección viene dada por la expresión u’Vu.

La pregunta a la que ahora tratamos de responder es la siguiente: ¿cuál es la dirección del espacio Rk a lo largo de la cual la inercia de los individuos es máxima? Esta pregunta es equivalente a la siguiente: ¿cuál es la dirección del espacio Rk a lo largo de la cual las proyecciones de los individuos -ponderadas por su masa- quedan globalmente más separadas de la proyección del punto de referencia? En cierta manera tratamos de determinar cuál es la dirección en la que se produce el máximo alargamiento de la nube de individuos. A esa dirección del espacio a lo largo de la cual se maximiza la inercia la llamaremos eje principal de inercia.

Es muy fácil demostrar que el eje principal de inercia de un conjunto de individuos respecto a un punto de referencia es un vector propio de la matriz V. Asimismo, la inercia a lo largo del eje principal de inercia es el valor propio que corresponde a dicho vector propio. Por tanto:

Dado un conjunto I de individuos en el espacio Rk y un punto de referencia P situado en Rk, si V es la matriz de inercia de I respecto al punto P, el eje principal de inercia de I respecto a P es el vector propio correspondiente al mayor valor propio de la matriz V.

El segundo eje de inercia es aquella dirección del espacio que siendo perpendicular al eje principal de inercia satisface la condición de que la inercia a lo largo de él es máxima. El segundo eje de inercia es aquella dirección del espacio ortogonal al primer eje de inercia que recoge el máximo alargamiento de la nube de individuos. Se demuestra, igualmente, que el segundo eje de inercia es un vector propio de la matriz V y que la inercia a lo largo de él es el valor propio asociado a dicho vector propio. Lógicamente, la inercia a lo largo del segundo eje no puede ser mayor que la inercia a lo largo del eje principal de inercia.

En general, el j-ésimo eje de inercia es aquella dirección del espacio que siendo perpendicular a los ejes de inercia 1,2,…, j-1 satisface la condición de que la inercia a lo largo de él es máxima. Se demuestra que el j-esímo eje de inercia es un vector propio de la matriz V y que la inercia a lo largo de él es el valor propio asociado a dicho vector propio. La inercia a lo largo del j-ésimo eje de inercia no puede ser mayor que la inercia a lo largo de los ejes 1,2,…, j-1.

Llegamos de este modo al siguiente teorema:

Dado un conjunto I de individuos en el espacio Rk y un punto de referencia P situado en Rk, si V es la matriz de inercia de I respecto al punto P, el j-ésimo eje de inercia de I respecto a P es el vector propio correspondiente al j-ésimo valor propio de la matriz V considerando dichos valores propios ordenados de mayor a menor.

Es sabido que los valores propios de una matriz simétrica son todos reales y que los vectores propios son ortogonales dos a dos. Así, si cada eje de inercia lo expresamos mediante un vector unitario en su correspondiente dirección obtendremos una base ortonormal alternativa a la canónica respecto a la que poder expresar las coordenadas de los individuos.

La particularidad de esta representación alternativa de los individuos es que, a pesar de que la inercia total es independiente de la base ortonormal elegida, si se opta por la base ortonormal que constituyen los vectores propios de la matriz V se garantiza que la inercia se desplaza hacia los primeros componentes de la base en detrimento de los últimos. Expresado de forma más clara: la base ortonormal constituida por los vectores propios de la matriz V ordenados en función del valor propio asociado cumple que:

  • el primer vector propio -el eje principal de inercia- es la dirección del espacio a lo largo de la cual la inercia de los individuos es máxima. La proyección de los individuos sobre este eje es la mejor representación unidimensional de la nube de individuos -en el sentido de que es la que más los distingue-.
  • una vez descontada la inercia a lo largo del eje principal de inercia, el segundo vector propio -el segundo eje de inercia- es de entre todas las direcciones del espacio perpendiculares al eje principal de inercia aquella a lo largo de la cual la inercia de los individuos es máxima. La proyección de los individuos sobre el plano generado por la base ortonormal constituida por el primer y el segundo ejes de inercia es la mejor representación bidimensional de la nube de individuos -en el sentido de que es la que mejor permite diferenciar unos de otros-.
  • en general, una vez descontada la inercia a lo largo de los ejes 1,2,…, j-1, el j-ésimo vector propio -el j-ésimo eje de inercia- es de entre todas las direcciones del espacio perpendiculares a los ejes 1,2,…, j-1 aquella a lo largo de la cual la inercia de los individuos es máxima. La proyección de los individuos sobre el espacio generado por la base ortonormal constituida por los ejes 1,2,…, j es la mejor representación j-dimensional de la nube de individuos -en el sentido de que es la que mejor permite diferenciar unos de otros-.

Este fenómeno permite prescindir de aquellas dimensiones a lo largo de las cuales la inercia explicada es muy pequeña y centrarse solamente en las dimensiones que acumulan la mayor cantidad de inercia.

En resumen, la mejor fotografía -en el sentido de representación en dos dimensiones- del objeto k-dimensional que es, en realidad, la nube de individuos será aquella que los representa sobre la base ortonormal formada por el primero y el segundo ejes de inercia. La calidad de esta fotografía será tanto mejor cuanto mayor sea la proporción de la inercia total que quede recogida en estos dos primeros ejes.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: