La paradoja de Simpson

Supongamos que la DGT ha lanzado una campaña para concienciar a la población de los peligros que supone conducir ebrio y que desea medir la eficacia de dicha campaña. Con ese fin la policía realiza controles de alcoholemia a 600 conductores antes de la emisión de los anuncios y a otros 600 tras dicha emisión. Los resultados son los siguientes:

De los 600 conductores a los que se realiza el control de alcoholemia antes de la campaña, 130 (21,66%) presentan una tasa de alcohol superior al límite permitido; de los 600 conductores a los que se realiza el control de alcoholemia tras la campaña, 140 (23,33%) presentan una tasa de alcoholemia superior al límite. Conclusión: la campaña ha sido un fracaso.

Alguien en la DGT decide investigar los datos con mayor profundidad y comprueba que si se considera de manera separada a los hombres y a las mujeres las cifras podrían indicar otra cosa:

En efecto: antes de la emisión se interceptó a 500 conductoras, de las que 100 (un 20%) dieron positivo. Tras la campaña se realizó el control de alcoholemia a 100 conductoras, de las que 15 (un 15%) dieron positivo. Entre las conductoras, la proporción de positivos ha disminuido por lo que la campaña puede considerarse un éxito.
En cuanto a los hombres, antes de la campaña se realizó un control de alcoholemia a 100 conductores, de los que 30 (un 30%) dieron positivo. Tras la emisión de los anuncios se realizaron controles de alcoholemia a 500 conductores, de los que 125 (un 25%) dieron positivo. Entre los hombres también ha disminuido la proporción de positivos, por lo que la campaña puede considerarse un éxito entre los hombres.

(Nótese que las 100 mujeres unidas a los 30 hombres que dan positivo antes de la emisión constituyen los 130 conductores que dan positivo a los que se alude en el primer párrafo de los resultados. Análogamente ocurre con las 15 mujeres y los 125 hombres que dan positivo tras la campaña).

¿Cómo es posibe que si realizamos un análisis separando los datos por sexo la campaña sea un éxito pero cuando los agrupamos la campaña sea un fracaso? En realidad, ¿qué podemos decir acerca de la eficacia de la campaña? ¿Qué está pasando?

This entry was posted on sábado, 6 de octubre de 2007 at 5:31 pm and is filed under estadística. You can follow any responses to this entry through the RSS 2.0 feed. You can leave a response, or trackback from your own site.

3 Responses to La paradoja de Simpson

La Fracción Endemoniada « matemaTICs dice:

junio 8, 2009 a las 7:25 pm

[…] https://jjgibaja.wordpress.com/2007/10/06/la-paradoja-de-simpson/ […]

Responder
Galo Sánchez dice:

marzo 7, 2010 a las 11:18 am

Es muy de agradecer lo fácil que usted lo explica para que se entienda con claridad meridiana.

Responder
Galo Sánchez dice:

marzo 7, 2010 a las 11:52 am

Yo creo que el muestreo no fue aleatorio, porque la baseline de antes de la campaña tiene 500 mujeres y 100 varones (en total 600 conductores). La baseline desués de la campaña tiene 100 mujeres y 500 varones (en total 600 conductores).
Colijo que el muestreo no fue aleatorio porque hay una enorme diferencia entre el % de mujeres y % de varones entre las baseline pre y post-campaña. Las muestras no son representativas para inferir causalidad.

Responder

Análisis y comunicación de datos cuantitativos