La objetividad de la Estadística

Muy curioso me resultó el intercambio que mantuve el otro día con un colega del IAIF de la Universidad Complutense durante el 11º Congreso de EUNIP que se celebró en el campus donostiarra de la Universidad de Deusto -organizado por la ESTE y por el Instituto Vasco de Competitividad-.

En pocas palabras, mi colega confería -y defendía a capa y espada- un carácter cuasi-angélico a las técnicas de análisis de datos cuantitativos. En su opinión -en pocas palabras- cualquier resultado de aplicar un procedimiento estadístico a un conjunto de datos es científicamente incontestable ya que en ese procedimiento no ha intervenido el “contaminante” pensamiento humano. Como la conferencia se celebró en inglés -en ese international english que todos más o menos entendemos- mi colega decía “we did not make any choices. Our results are not biased since these are the factors that resulted from a factor analysis“.

En mi opinión nada más lejos de la realidad. Al aplicar un análisis factorial “we have to make lots of choices and we’d better make the right ones“:

  • Deben elegirse las variables que se van a analizar y esta elección va a afectar de forma radical al resultado y la interpretación de dicho resultado. Nuestro colega del IAIF argumentaba que el hecho de que 10 de las 40 variables regionales que habían elegido para su análisis estuvieran medidas en valores absolutos -y, por tanto, indujeran una correlación espuria entre ellas debida al factor tamaño de la región- no tenía ninguna importancia ya que finalmente todas esas variables se resumían en un único factor. Lo que se le olvidó comentar es que ese factor “accounted for 30% of global variance“. Tampoco se mostró dispuesto a mostrar los resultados de un análisis cluster efectuado sobre estos datos en el que la C.A. de Andalucía se situaba en el ranking de innovación por encima de la C.F. de Navarra -¡sencillamente increíble para cualquiera que conozca la realidad!-. Era una buena ocasión para recordar que cuando los resultados de un análisis de datos son contrarios a la intuición o al conocimiento experto sobre el fenómeno analizado lo más probable es que se haya cometido algún error -bien en los datos, bien en la técnica-.
  • Debe elegirse la técnica concreta de análisis factorial que resulta más conveniente: componentes principales, correspondencias, factorial múltiple… Aplicar siempre la técnica que se conoce en vez de la más apropiada lleva a errores. Por cierto, ¿por qué todo el mundo aplica una rotación varimax a los resultados de un análisis factorial?
  • Hay que escoger entre hacer un análisis ponderado o no ponderado. ¿Tiene sentido conferir el mismo peso a La Rioja que a Cataluña? Yo creo que no. Sin embargo todo el mundo sigue realizando análisis no ponderados. ¿Por qué?
  • La decisión quizás más subjetiva de todas es la interpretación del significado de los factores resultantes. Al tratarse de una técnica descriptiva hay que interpretar los resultados y esto es, necesariamente, subjetivo.

En resumen, las técnicas de análisis de datos cuantitativos son una gran ayuda para la obtención de información y para la reducción de la incertidumbre pero sólo funcionan bien cuando se toman decisiones y, sobre todo, cuando estas decisiones no están excesivamente erradas.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: