Para problemas de clasificación, si las probabilidades predictivas para los casos de prueba están muy cerca de 0 o 1, entonces esto “huele” a exceso de equipamiento.
El modelo ajustado, en este caso, dice que es casi 100% seguro de las asignaciones de clase para todos los casos de prueba.
¿Por qué “huele” a exceso de equipamiento? El modelo es potencialmente demasiado confiado . Imagine a un médico especializado tratando de clasificar una enfermedad rara para un paciente. Incluso él / ella no puede decir con confianza “Puedo decir con casi 100% de certeza que una persona tiene la enfermedad”. Por otro lado, este modelo demasiado confiado cree que sabe mejor; ¡Es casi 100% seguro de que el paciente tiene la enfermedad!
- ¿Qué clases debo tomar en Georgia Tech si quiero ser un científico de datos?
- ¿Puede un ingeniero de pruebas convertirse en un científico de datos?
- ¿Cómo debo prepararme para programar preguntas en una entrevista de ciencia de datos?
- ¿Cuál es su rutina diaria cuando trabaja como científico de datos?
- ¿Vale la pena dejar un trabajo de desarrollador web a tiempo completo por valor de $ 65,000 para un pasante de ciencia de datos?
Tenga en cuenta que esta respuesta aquí proporciona un “olor” particular de sobreajuste, es decir, un signo de sobreajuste potencial. Este “olor” por sí solo no sustituye los procedimientos formales de prueba como la validación cruzada (como ya se señaló).
Pregunta respondida: “Como científico de datos, ¿cómo puede” oler “un modelo demasiado ajustado?”