La paradoja de Simpson

Supongamos que la DGT ha lanzado una campaña para concienciar a la población de los peligros que supone conducir ebrio y que desea medir la eficacia de dicha campaña. Con ese fin la policía realiza controles de alcoholemia a 600 conductores antes de la emisión de los anuncios y a otros 600 tras dicha emisión. Los resultados son los siguientes:

  • De los 600 conductores a los que se realiza el control de alcoholemia antes de la campaña, 130 (21,66%) presentan una tasa de alcohol superior al límite permitido; de los 600 conductores a los que se realiza el control de alcoholemia tras la campaña, 140 (23,33%) presentan una tasa de alcoholemia superior al límite. Conclusión: la campaña ha sido un fracaso.

Alguien en la DGT decide investigar los datos con mayor profundidad y comprueba que si se considera de manera separada a los hombres y a las mujeres las cifras podrían indicar otra cosa:

  • En efecto: antes de la emisión se interceptó a 500 conductoras, de las que 100 (un 20%) dieron positivo. Tras la campaña se realizó el control de alcoholemia a 100 conductoras, de las que 15 (un 15%) dieron positivo. Entre las conductoras, la proporción de positivos ha disminuido por lo que la campaña puede considerarse un éxito.
  • En cuanto a los hombres, antes de la campaña se realizó un control de alcoholemia a 100 conductores, de los que 30 (un 30%) dieron positivo. Tras la emisión de los anuncios se realizaron controles de alcoholemia a 500 conductores, de los que 125 (un 25%) dieron positivo. Entre los hombres también ha disminuido la proporción de positivos, por lo que la campaña puede considerarse un éxito entre los hombres.

(Nótese que las 100 mujeres unidas a los 30 hombres que dan positivo antes de la emisión constituyen los 130 conductores que dan positivo a los que se alude en el primer párrafo de los resultados. Análogamente ocurre con las 15 mujeres y los 125 hombres que dan positivo tras la campaña).

¿Cómo es posibe que si realizamos un análisis separando los datos por sexo la campaña sea un éxito pero cuando los agrupamos la campaña sea un fracaso? En realidad, ¿qué podemos decir acerca de la eficacia de la campaña? ¿Qué está pasando?

3 Responses to La paradoja de Simpson

  1. Galo Sánchez dice:

    Es muy de agradecer lo fácil que usted lo explica para que se entienda con claridad meridiana.

  2. Galo Sánchez dice:

    Yo creo que el muestreo no fue aleatorio, porque la baseline de antes de la campaña tiene 500 mujeres y 100 varones (en total 600 conductores). La baseline desués de la campaña tiene 100 mujeres y 500 varones (en total 600 conductores).
    Colijo que el muestreo no fue aleatorio porque hay una enorme diferencia entre el % de mujeres y % de varones entre las baseline pre y post-campaña. Las muestras no son representativas para inferir causalidad.

Replica a Galo Sánchez Cancelar la respuesta