Introducción al análisis factorial

Este post debería haber aparecido hace un par de meses como introducción a la serie sobre análisis factorial pero como lo he escrito ahora… 

El análisis factorial surgió en las primeras décadas del siglo XX a partir de los trabajos pioneros de Pearson y Hotelling, entre otros. El análisis factorial es una técnica de interdependencia y de reducción de la dimensionalidad.

En efecto, a diferencia del modelo de regresión en el que existe una clara diferencia entre la variable cuyo valor promedio se desea predecir –la variable dependiente- y aquellas que van a contribuir a este objetivo –las variables independientes-, en el caso del análisis factorial no existe tal división de roles entre las variables: dicho más claramente, en el análisis factorial no tiene sentido la clasificación de las variables en dependiente e independientes. En esta técnica de análisis de datos todas las variables sirven para explicar cualquiera de ellas; las variables se explican unas a otras. El análisis factorial constituye un método para detectar la estructura de relación entre el conjunto de todas las variables.

El análisis factorial se clasifica dentro de los métodos descriptivos –en oposición a los métodos inferenciales-. No nos ocuparemos, por tanto, de si se dan o no las condiciones para generalizar a la población nuestros hallazgos. Es más, no nos preocuparemos siquiera de si el conjunto de datos de que disponemos constituyen una población o una muestra. El objetivo que se persigue cuando se aplica un análisis factorial a un conjunto de datos es el de obtener una representación –normalmente gráfica- de dichos individuos en relación con las variables que se han medido en ellos. Esa representación de los individuos en el espacio de las variables –o viceversa- nos llevará al concepto de “nube de individuos” –o de variables-. Estas nubes son objetos multidimensionales: en concreto, la nube de individuos es un objeto situado en un espacio vectorial de dimensión igual al número de variables. Dado que el tamaño de las tablas de datos con las que es habitual trabajar en las aplicaciones prácticas es elevado –es normal encontrarse con tablas de datos de miles de individuos y de cientos de variables- la representación gráfica de la nube de individuos puede resultar confusa –imaginemos un conjunto de miles de puntos en un espacio de cientos de dimensiones-. En esta situación es del máximo interés encontrar aquellas “fotografías” de la nube de individuos que mejor la representen. Esta es la idea que se pretende transmitir cuando se afirma que el análisis factorial es una técnica de reducción de la dimensionalidad. En efecto, el análisis factorial permitirá detectar cuáles son los mejores puntos de vista para obtener representaciones interpretables de la nube de individuos a cambio de la mínima pérdida de información.

El análisis factorial no es, en realidad, una única técnica. Es el nombre que se da a una familia de técnicas que tienen las características más arriba mencionadas: un enfoque descriptivo; el objetivo de estudiar la estructura de interrelación entre las variables y la busqueda de representaciones simplificadas del conjunto de individuos. Dependiendo de la naturaleza de los datos de partida la técnica de análisis factorial empleada será diferente. En concreto:

  • Utilizaremos el análisis de componentes principales (ACP) cuando los datos de que disponemos se refieran a variables de naturaleza cuantitativa.
  • Emplearemos el análisis de correspondencias (AC) cuando dispongamos de una tabla de contingencia con dos variables de clasificación–o tabla de doble entrada-.
  • La técnica de análisis factorial a emplear cuando nos encontremos con tablas de contingencia con más de dos variables de clasificación será el análisis de correspondencias múltiple (ACM). El ACM se puede entender como una generalización del AC –o éste como un caso particular de aquél-.
  • Cuando deseemos considerar variables de naturaleza cuantitativa clasificadas en diferentes grupos –por ejemplo en función de mediciones efectuadas en diferentes momentos del tiempo- emplearemos el análisis factorial múltiple (AFM).

A pesar de que todas estas técnicas presentan muchas particularidades, todas ellas comparten un núcleo común al que vamos a llamar análisis factorial general. El concepto básico –sobre el que se construye toda la teoría- es el de inercia.

3 respuestas a Introducción al análisis factorial

  1. murci dice:

    Al fin! Waiting for the next post…

  2. patricia borrego mora dice:

    Hola
    Requiero utilizar análisis factorial de un examen de certificación en ginecología
    No se si efectivamente se deba hacer para determinar la validez del instrumento
    No entiendo si cada una de las áreas a evaluar son factores ( ejem atención del primer, segundo y tercer trimestre del embarazo)
    Cada puntuación obtenida por dada sustentante en cada área evaluada
    Me puede orientar por favor

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: