Métricas Principales
El modelo de clasificación de neumonía alcanzó los siguientes resultados en el conjunto de test:80% Accuracy
Precisión general en datos nunca vistos durante el entrenamiento
93% AUC-ROC
Excelente capacidad para distinguir entre casos normales y neumonía
96% Sensibilidad
Detecta casi todos los casos de neumonía (solo 3.33% de falsos negativos)
Frase para la presentación:
“Nuestro modelo alcanzó 80% de accuracy en datos nunca vistos, con un AUC-ROC de 0.93, lo que indica excelente capacidad para distinguir entre casos normales y neumonía.”
Interpretación de Gráficas
Cada gráfica en la carpetaresults/ cuenta una parte importante de la historia del modelo.
1. training_history.png
Historial de Entrenamiento
Qué muestra:
- Evolución del accuracy durante el entrenamiento
- Comparación entre train y validation
- Progreso epoch por epoch
- “El modelo mejora con cada época”
- Observar si hay overfitting (train sube mucho más que validation)
- La curva muestra el aprendizaje progresivo del modelo
2. confusion_matrix.png
Matriz de Confusión
Qué muestra:
- 122 casos NORMAL clasificados correctamente
- 377 casos PNEUMONIA clasificados correctamente
- Distribución de errores: falsos positivos y falsos negativos
- Total: 499 predicciones en test
- Accuracy = (122 + 377) / 540 = 80%
- El modelo es mejor detectando neumonía que descartándola
3. roc_curve.png
Curva ROC
Qué muestra:
- AUC (Area Under Curve) = 0.93
- Relación entre sensibilidad y especificidad
- Capacidad discriminativa del modelo
- AUC = 1.0 sería perfecto
- AUC = 0.5 sería aleatorio
- AUC = 0.93 es “Excelente capacidad discriminativa”
- 0.90 - 1.00: Excelente
- 0.80 - 0.90: Bueno
- 0.70 - 0.80: Aceptable
- 0.60 - 0.70: Pobre
“El AUC de 0.93 indica que el modelo tiene excelente capacidad para distinguir entre casos normales y neumonía. Esto es comparable a muchos sistemas de apoyo al diagnóstico médico.”
4. predictions.png
Predicciones de Ejemplo
Qué muestra:
- Ejemplos visuales de clasificaciones
- Imágenes reales con sus predicciones
- Casos correctos e incorrectos
- Permite ver qué patrones detecta el modelo
- Muestra casos donde el modelo tiene confianza alta/baja
- Ejemplos concretos de aciertos y errores
Significancia Clínica
La Importancia de la Alta Sensibilidad
96% de Sensibilidad
¿Qué significa?
- De cada 100 casos de neumonía, el modelo detecta 96
- Solo 3-4 casos de neumonía pasan desapercibidos
- Minimiza los falsos negativos (el error más peligroso en medicina)
“Lo más importante: el modelo tiene 96% de sensibilidad, es decir, detecta casi todos los casos de neumonía. En medicina es mejor tener falsos positivos que perder un caso real.”Contexto médico:
- Un falso negativo = paciente con neumonía no detectada → alto riesgo
- Un falso positivo = verificación adicional → bajo riesgo
- El modelo prioriza no perder casos reales
Aplicación Práctica
Uso en Screening Inicial
Fortalezas del sistema:
- Alta sensibilidad (96.67%) → Detecta casi todas las neumonías
- AUC alto (0.93) → Buena capacidad discriminativa
- Útil para screening inicial en centros de atención primaria
- Puede priorizar casos urgentes
- Screening rápido y consistente
- Falsos positivos requieren verificación médica
- Solo clasifica 2 clases (no distingue viral vs bacteriana)
- Herramienta de apoyo, NO diagnóstico definitivo
- Requiere validación clínica adicional para uso hospitalario
Comparación: Validación vs Test
Explicación de la Diferencia
Validación (95%):
- Datos vistos durante el entrenamiento
- El modelo ajusta hiperparámetros basándose en estos datos
- Rendimiento más optimista
- Datos completamente nuevos
- Nunca vistos por el modelo
- Refleja el rendimiento real en producción
“El 95% era en validación (datos que el modelo veía durante entrenamiento). El 80% es en test (datos completamente nuevos). Esto es normal y demuestra que el modelo generaliza bien.”Una caída de 15 puntos porcentuales es aceptable y muestra que el modelo no tiene overfitting severo.
Resumen para Memorizar
Los Números Clave
Memoriza estos tres números:
- 80% - Accuracy en test (datos nunca vistos)
- 93% - AUC-ROC (capacidad discriminativa excelente)
- 96% - Sensibilidad (detecta casi todas las neumonías)