La Estadística es cosa de locos

septiembre 19, 2008

Hoy he asistido a una defensa de tesis doctoral en mi facultad. El doctorando -ahora ya doctor- es un alto cargo de una entidad financiera y todos los miembros del tribunal han alabado -en mi opinión muy merecidamente- su capacidad para conciliar sus elevadas responsabilidades laborales con sus actividades de investigación.

Lo que me ha gustado mucho menos ha sido el comentario de dos de los miembros del tribunal al señalar como muy loable el esfuerzo que le debía de haber supuesto al doctorando dejar de lado los modos y maneras propios de la empresa y zambullirse en las costumbres propias de los investigadores y, en particular, en esas complicadas técnicas estadísticas tan alejadas de la práctica habitual de la alta dirección de las entidades financieras.

En mi opinión -y estoy seguro de que es el caso del nuevo doctor- los altos directivos de las empresas -en general- y de las entidades financieras -en particular- deberían ser personas dotadas de elevadas habilidades y competencias en el análisis de datos. Me parece además muy grave que estas opiniones sean vertidas en un tribunal de tesis doctoral por académicos que deberían estar de acuerdo con esta postura. Quizás todo esto sea tan solo un paso más en el arrinconamiento y desprecio que los métodos cuantitativos vienen sufriendo en los últimos años -y si no, a los nuevos planes de estudio de LADE ADE me remito-.


La objetividad de la Estadística

septiembre 18, 2008

Muy curioso me resultó el intercambio que mantuve el otro día con un colega del IAIF de la Universidad Complutense durante el 11º Congreso de EUNIP que se celebró en el campus donostiarra de la Universidad de Deusto -organizado por la ESTE y por el Instituto Vasco de Competitividad-.

En pocas palabras, mi colega confería -y defendía a capa y espada- un carácter cuasi-angélico a las técnicas de análisis de datos cuantitativos. En su opinión -en pocas palabras- cualquier resultado de aplicar un procedimiento estadístico a un conjunto de datos es científicamente incontestable ya que en ese procedimiento no ha intervenido el “contaminante” pensamiento humano. Como la conferencia se celebró en inglés -en ese international english que todos más o menos entendemos- mi colega decía “we did not make any choices. Our results are not biased since these are the factors that resulted from a factor analysis“.

En mi opinión nada más lejos de la realidad. Al aplicar un análisis factorial “we have to make lots of choices and we’d better make the right ones“:

  • Deben elegirse las variables que se van a analizar y esta elección va a afectar de forma radical al resultado y la interpretación de dicho resultado. Nuestro colega del IAIF argumentaba que el hecho de que 10 de las 40 variables regionales que habían elegido para su análisis estuvieran medidas en valores absolutos -y, por tanto, indujeran una correlación espuria entre ellas debida al factor tamaño de la región- no tenía ninguna importancia ya que finalmente todas esas variables se resumían en un único factor. Lo que se le olvidó comentar es que ese factor “accounted for 30% of global variance“. Tampoco se mostró dispuesto a mostrar los resultados de un análisis cluster efectuado sobre estos datos en el que la C.A. de Andalucía se situaba en el ranking de innovación por encima de la C.F. de Navarra -¡sencillamente increíble para cualquiera que conozca la realidad!-. Era una buena ocasión para recordar que cuando los resultados de un análisis de datos son contrarios a la intuición o al conocimiento experto sobre el fenómeno analizado lo más probable es que se haya cometido algún error -bien en los datos, bien en la técnica-.
  • Debe elegirse la técnica concreta de análisis factorial que resulta más conveniente: componentes principales, correspondencias, factorial múltiple… Aplicar siempre la técnica que se conoce en vez de la más apropiada lleva a errores. Por cierto, ¿por qué todo el mundo aplica una rotación varimax a los resultados de un análisis factorial?
  • Hay que escoger entre hacer un análisis ponderado o no ponderado. ¿Tiene sentido conferir el mismo peso a La Rioja que a Cataluña? Yo creo que no. Sin embargo todo el mundo sigue realizando análisis no ponderados. ¿Por qué?
  • La decisión quizás más subjetiva de todas es la interpretación del significado de los factores resultantes. Al tratarse de una técnica descriptiva hay que interpretar los resultados y esto es, necesariamente, subjetivo.

En resumen, las técnicas de análisis de datos cuantitativos son una gran ayuda para la obtención de información y para la reducción de la incertidumbre pero sólo funcionan bien cuando se toman decisiones y, sobre todo, cuando estas decisiones no están excesivamente erradas.


Sesión de introducción a R

julio 7, 2008

La mañana de hoy la he dedicado a presentar a los investigadores del Instituto Vasco de Competitividad el entorno de programación R. Dejo aquí una copia de la presentación (PowerPoint de 5,1 Mb) y de la práctica que hemos realizado.


Charlas on line sobre visualización de datos

mayo 2, 2008

A través del blog information aesthetics me he enterado de que están disponibles las charlas sobre visualización de datos de Ben Fry, Hans Rosling -fundador de gapminder- y Jonathan Harris -entre otros-. En mi opinión, muy interesantes.


Curso de doctorado sobre metodología cuantitativa

febrero 5, 2008

Durante esta semana estoy impartiendo un módulo de metodología cuantitativa en el curso de doctorado “Metodología de la investigación científica” de la ESTE (Universidad de Deusto) a unos alumnos provenientes de ITESM (México). Aquí están las transparencias que les he repartido y que están basadas en el texto de Hernández-Sampieri.


Charla sobre el modelo lineal generalizado

enero 29, 2008

El pasado viernes día 25 me tocó organizar una sesión para los investigadores del Instituto Vasco de Competitividad acerca del Modelo Lineal Generalizado (MLG). Suponiendo un conocimiento básico del Modelo de Regresión Lineal Múltiple tratamos los siguientes temas:

  • Concepto de función link.
  • Algunos modelos de MLG: logit, probit, tobit, regresión Poisson,…
  • Cómo incluir variables cualitativas entre las explicativas.
  • Cómo evaluar el efecto de una variable cualitativa.
  • Cómo modelizar un efecto de interacción entre las variables explicativas.
  • Dificultades en la interpretación de los coeficientes en modelos con interacción y posibles soluciones.

Aquí está disponible la documentación que les entregué y aquí algunas bases de datos con ejemplos.


Proyecto Visualizar de Medialab Prado

noviembre 14, 2007

Al parecer el asunto de la visualización de datos está empezando a tomar fuerza en nuestro entorno más inmediato. Medialab Prado es un…

programa del Área de Las Artes del Ayuntamiento de Madrid que tiene su origen en el Medialab creado en el Centro Cultural Conde Duque en el año 2002. Está orientado a la producción, la investigación y la difusión de la cultura digital y del ámbito de confluencia entre arte, ciencia y tecnología.

Uno de los proyectos incluidos dentro de este programa es el llamado proyecto Visualizar que se concibe como…

un proceso de investigación abierto y participativo en torno a la teoría, las herramientas y las estrategias de visualización de información. El 23 de noviembre se celebrará el Seminario de visualización de datos aplicada a la comunicación.


Gráficos dinámicos para presentar indicadores estadísticos

noviembre 3, 2007

El Instituto Nacional de Estadística Italiano y la OCDE organizaron el pasado marzo un seminario de título Dynamic graphics for presenting statistical indicators cuyo objetivo era “…conseguir que los indicadores estadísticos fueran comprensibles y atractivos para el público actual”. Se pretendía “…identificar buenas prácticas y formular recomendaciones que permitan a las organizaciones avanzar en este importante campo”.


Measuring and fostering the progress of societies

noviembre 3, 2007

El pasado mes de junio se celebró en Estambul el Second OECD World Forum on Statistics, Knowledge and Policy con el tema Measuring and fostering the progress of societies. Esta es la agenda (contiene enlaces a los papers y a las presentaciones).

Uno de los resultados más importantes del forum fue la llamada declaración de Estambul, por la que los firmantes -OCDE, Comisión Europea, Organización de la Conferencia Islámica, ONU, Programa de las Naciones Unidas para el Desarrollo y el Banco Mundial- se comprometen a:

medir e impulsar el desarrollo de las sociedades en todas sus dimensiones con el fin último de mejorar las decisiones políticas, la democracia y el bienestar de los ciudadanos


Seguir

Recibe cada nueva publicación en tu buzón de correo electrónico.