Modelos con interacción (II)

En un post anterior comentábamos cómo interpretar los coeficientes de los modelos de regresión en los que se incluyen interacciones entre las variables explicativas. En este caso vamos a ver un ejemplo numérico.

Los datos están, naturalmente, preparados para poner de manifiesto el error que se puede cometer si no somos cuidadosos en nuestras interpretaciones. Las variables son las siguientes:

  • RENTA (en euros)
  • AHORRO (en euros)
  • HIPOTECA (0=no, 1=sí)
  • RENTCENT (la variable RENTA centrada)
  • RENTHIPO (producto de RENTA e HIPOTECA)
  • RENTCENTHIPO (producto de RENTCENT e HIPOTECA)

El primer paso que vamos a dar es la elaboración de un diagrama de dispersión, colocando en el eje de abscisas la variable RENTA (la explicativa) y en el de ordenadas la variable AHORRO (la dependiente). Además, vamos a distinguir a los sujetos con un color diferente según tengan o no hipoteca. El resultado es el siguiente:

En un primer vistazo al diagrama de dispersión observamos que existe una relación directa entre la renta de las personas y su ahorro (siempre según estos datos que, recordemos, son ficticios). Se observa, además, un comportamiento claramente diferente si se debe hacer frente al pago de una hipoteca. Parece razonable, por lo tanto, proponer un modelo que explique la variable AHORRO a partir de las variables RENTA e HIPOTECA. El resultado del ajuste de un modelo lineal es el siguiente:

Modelo 1

Modelo
Coeficientes no estandarizados Coeficientes estandarizados t Sig.
B Error típ. Beta
1 (Constante) 20,869 2,121
9,838 ,000
RENTA ,149 ,008 ,817 18,596 ,000
HIPOTECA -16,673 1,583 -,463 -10,531 ,000
a Variable dependiente: AHORRO

El coeficiente de la variable RENTA (0,149 con un p-valor de 0,000) nos indica que existe un efecto positivo de la renta tanto para quienes tienen hipoteca como para quienes no la tienen. De modo opuesto, el coeficiente de HIPOTECA (-16,673, con un p-valor de 0,000) nos indica que, el hecho de tener que hacer frente a una hipoteca hace que el ahorro promedio descienda en aproximadamente 17 unidades. En resumen, existe un efecto positivo de la renta y un efecto negativo de la hipoteca sobre el ahorro.

Si continuamos con el análisis del diagrama de dispersión, pronto nos daremos cuenta de que nos conviene considerar un posible efecto interacción entre las variables explicativas. Esto lo pone de manifiesto el hecho de que la nube de dispersión de los 0’s -quienes no tienen hipoteca- presenta una inclinación mayor que la de los 1’s -quienes sí tienen hipoteca-. Sería lógico, por tanto, considerar un modelo en el que las variables explicativas sean RENTA, HIPOTECA y su interacción, que viene recogida en la variable RENTHIPO. El resultado del ajuste de dicho modelo es el siguiente:

Modelo 2

Modelo
Coeficientes no estandarizados Coeficientes estandarizados t Sig.
B Error típ. Beta
1 (Constante) 8,874 1,470
6,036 ,000
RENTA ,203 ,006 1,110 33,584 ,000
HIPOTECA 5,472 1,999 ,152 2,737 ,009
RENTHIPO -,100 ,008 -,727 -12,121 ,000
a Variable dependiente: AHORRO

Los resultados nos muestran que no estabamos errados. Existe un efecto de interacción ya que el coeficiente de la variable RENTHIPO lleva asociado un p-valor de 0,000. Sin embargo, hay un resultado sorprendente: el coeficiente de la variable HIPOTECA es ahora positivo y, además, está acompañado de un p-valor realmente bajo. ¿Va a resultar que quienes tienen hipoteca ahorran más?. En cuanto a la renta podemos estar tranquilos ya que el signo de su coeficiente es, como esperábamos, positivo.

La respuesta a la pregunta anterior es NO. Veamos cómo debemos interpretar el coeficiente de la variable HIPOTECA en este modelo con interacción. Se trata del efecto sobre el ahorro cuando se pasa de no tener hipoteca a sí tenerla pero sólo en el caso de que la renta sea nula . En otras palabras, se trata de la diferencia entre las ordenadas en el origen de las rectas de regresión para quienes sí tienen hipoteca y para quienes no la tienen. Pero, ¿el hecho de que para una renta nula el efecto de la hipoteca sea positivo sobre el ahorro nos puede llevar a afirmar que el efecto de la hipoteca –para cualquier nivel de renta– es positivo? ¿No sería mejor tomar como punto de referencia otro valor más representativo de la renta en lugar de considerar el efecto de la hipoteca en el caso de que la renta sea nula?

La variable RENTCENT nos va a proporcionar una posible solución. Para calcular esta variable hemos restado de cada valor de la renta el promedio para todos los individuos en dicha variable de modo que la variable RENTCENT es la RENTA centrada -su media es 0-. En otras palabras, para cada individuo la variable RENTCENT mide su desviación en euros respecto a la renta promedio. Para considerar la interacción de esta nueva variable con la variable HIPOTECA hemos construido la variable RENTCENTHIPO, como producto de RENTCENT e HIPOTECA.

A continuación estimamos un modelo lineal para predecir la renta de los individuos a partir de las variables RENTCENT, HIPOTECA y RENTCENTHIPO. El resultado es el siguiente:

Modelo 3

Modelo
Coeficientes no estandarizados Coeficientes estandarizados t Sig.
B Error típ. Beta
1 (Constante) 53,756 ,579
92,836 ,000
HIPOTECA -16,651 ,812 -,462 -20,518 ,000
RENTCENT ,203 ,006 1,110 33,584 ,000
RENTCENTHIPO -,100 ,008 -,401 -12,121 ,000
a Variable dependiente: AHORRO

Comparemos estos dos últimos modelos:

  • La variable RENTCENT tiene en el modelo 3 el mismo coeficiente que la variable RENTA en el modelo 2. Su interpretación es, en ambos casos, clara: es el efecto sobre el ahorro de un incremento de una unidad en la renta cuando no se tiene que pagar hipoteca.
  • El efecto de interacción (RENTHIPO y RENTCENTHIPO) tiene el mismo coeficiente en ambos modelos. En ambos casos se trata del efecto adicional que sobre el ahorro tiene un incremento de una unidad en la renta en el caso en que sí hay que hacer frente a una hipoteca. Como se ve, el efecto adicional es negativo (lo vemos gráficamente en la menor pendiente de la nube de individuos correspondiente a los 1’s).
  • La diferencia entre estos dos modelos está en el coeficiente de la variable HIPOTECA. En el modelo 2 (con la renta medida en euros), el coeficiente recoge el efecto que sobre el ahorro tiene pasar de no tener una hipoteca a sí tenerla en el caso de que la renta sea nula. Como ya hemos comentado este coeficiente tiene una dudosa interpretación. Sin embargo, en el modelo 3 (con la renta medida como desviaciones respecto al promedio) el coeficiente de la variable HIPOTECA recoge el efecto de tener una hipoteca cuando RENTCENT es nulo, es decir, cuando la variable RENTA toma el valor promedio. Así, se ve que el efecto de tener que hacer frente a una hipoteca sobre el ahorro es, cuando la renta es la renta promedio, negativo. El coeficiente, que en el modelo 2 es positivo y estadísticamente significativo -pero carente de interpretación- pasa a ser , en el modelo 3, negativo y significativo y tiene, además, una interpretación económica mucho más simple.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: