Apuntes (breves) sobre la función lineal discriminante

May 23, 2008

Ya estamos llegando al final del cuatrimestre y las fuerzas flaquean. No me ha quedado más remedio que recurrir a material elaborado en años anteriores para explicar el tema del análisis discriminante. Aquí dejo unos apuntes muy sencillitos.


Modelos de respuesta cualitativa y overfitting

abril 27, 2008

Si la variable cuyo comportamiento deseamos predecir o modelizar es de naturaleza cualitativa, una de las técnicas a nuestra disposición es el análisis discriminante. Bajo este nombre se agrupan una serie de técnicas que se caracterizan por proporcionar una -o varias, si la variable no es dicotómica- funciones que permiten asignar a los individuos a las distintas modalidades de la variable cualitativa.

El análisis discriminante -que es una técnica de clasificación supervisada– presenta el problema de overfitting, que consiste en una sobrevaloración de la capacidad predictiva de los modelos obtenidos: en esencia, no tiene sentido evaluar la calidad del modelo sobre los datos que han servido para construirlo ya que esta práctica nos lleva a ser demasiado optimistas acerca de su calidad. ¿Qué puede pues hacerse para evaluar la calidad de un modelo predictivo como el análisis dicriminante?

  • Una opción es emplear alguna técnica de validación cruzada.
  • Otra opción es dividir la muestra global en dos partes, una muestra llamada de aprendizaje -que servirá para la estimación de las funciones discriminantes- y una muestra test -que se empleará para evaluar la calidad del modelo obtenido a través de la muestra de aprendizaje-.