Modelos de respuesta cualitativa y overfitting

Si la variable cuyo comportamiento deseamos predecir o modelizar es de naturaleza cualitativa, una de las técnicas a nuestra disposición es el análisis discriminante. Bajo este nombre se agrupan una serie de técnicas que se caracterizan por proporcionar una -o varias, si la variable no es dicotómica- funciones que permiten asignar a los individuos a las distintas modalidades de la variable cualitativa.

El análisis discriminante -que es una técnica de clasificación supervisada– presenta el problema de overfitting, que consiste en una sobrevaloración de la capacidad predictiva de los modelos obtenidos: en esencia, no tiene sentido evaluar la calidad del modelo sobre los datos que han servido para construirlo ya que esta práctica nos lleva a ser demasiado optimistas acerca de su calidad. ¿Qué puede pues hacerse para evaluar la calidad de un modelo predictivo como el análisis dicriminante?

  • Una opción es emplear alguna técnica de validación cruzada.
  • Otra opción es dividir la muestra global en dos partes, una muestra llamada de aprendizaje -que servirá para la estimación de las funciones discriminantes- y una muestra test -que se empleará para evaluar la calidad del modelo obtenido a través de la muestra de aprendizaje-.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: