Descomponiendo la inercia

Seguimos dándole vueltas al concepto de inercia. Y es que lo que más nos interesa es descomponerla, es decir, deteminar a qué se debe que esa inercia exista.

La inercia es una medida de la dispersión del conjunto de individuos respecto a un punto -muy habitualmente su centro de gravedad- pero ¿es posible descomponer esa inercia y asignarla a diferentes individuos? La respuesta a esta pregunta es afirmativa y se deduce de propia definición de inercia de un conjunto de individuos como suma de las inercias de cada uno de los individuos. Sin embargo, aunque esta descomposición de la inercia puede ser interesante en algunas aplicaciones de análisis de datos nos centramos ahora en la descomposición de la inercia según otro criterio.

Es evidente que la dispersión de los individuos en relación con un punto se debe a que dichos individuos tienen diferentes coordenadas respecto a la base elegida en el espacio de las variables. Por ejemplo, si suponemos que los individuos están situados en el plano y la base del espacio vectorial es la base canónica, la inercia se debe a que los individuos tienen diferentes coordenadas “horizontales” y “verticales”. ¿Qué habrá que hacer para descomponer la inercia en “inercia horizontal” e “inercia vertical”? Pues muy sencillo: basta con proyectar los individuos y el punto respecto al que se quiere calcular la inercia sobre cada uno de los dos ejes -el horizontal y el vertical- y después calcular la inercia sustituyendo los individuos originales por sus proyecciones. El cálculo de las proyecciones de los individuos y del punto de referencia sobre los ejes horizontal y vertical es trivial ya que se consigue considerando simplemente la primera y segunda coordenadas respectivamente.

Claramente, la suma de la “inercia vertical” y la “inercia horizontal” es la inercia total. Hemos obtenido de esta manera una descomposición de la inercia en dos sumandos: la inercia a lo largo del eje horizontal y la inercia a lo largo del eje vertical.

Pero, la base canónica no es la única base posible en el plano. De hecho existen infinitas bases ortonormales además de la canónica. ¿Qué ocurre si hemos elegido una base ortonormal distinta de la canónica? Pues no hay cambios: tendremos que calcular las proyecciones de los individuos y del punto de referencia sobre los distintos ejes y sustituir los individuos originales por dichas proyecciones. Para el cálculo de las proyecciones puede ser de gran utilidad recurrir al producto escalar.

La gracia del asunto está en que si la base elegida es ortonormal – a pesar de que no sea la canónica- la suma de las inercias a lo largo de los dos ejes coincidirá con la inercia total. Obviamente, la forma en que esta inercia se reparte entre los dos ejes dependerá de cuál sea la base ortonormal elegida pero la suma de las inercias permanecerá constante.

Llegamos así a la siguiente generalización:

Si tenemos un conjunto de n individuos sobre los que se han medido k variables podemos representar a dichos individuos como un conjunto de n puntos en el espacio vectorial Rk. Dado un punto p del espacio Rk y una base ortonormal de dicho espacio, la inercia total de los individuos respecto al punto p es igual a la suma de las inercias de los individuos respecto al punto p a lo largo de cada uno de los vectores de la base ortonormal.

Se deduce de lo anterior que la descomposición de la inercia entre los distintos componentes de una base ortonormal depende de la base ortonormal elegida pero la suma de las inercias es constante e igual a la inercia total.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: