Clasificación de Gliomas HGG/LGG con Inteligencia Artificial Explicable

Sistema de diagnóstico asistido por IA utilizando ResNet-50 y validación mediante Grad-CAM++ para clasificación confiable de tumores cerebrales

Resumen del Proyecto

La clasificación preoperatoria de gliomas en Alto Grado (HGG) y Bajo Grado (LGG) es un paso crítico para la planificación terapéutica. Sin embargo, la evaluación humana mediante Imágenes de Resonancia Magnética (MRI) presenta variabilidad significativa.

Este proyecto presenta un modelo de clasificación basado en arquitectura ResNet-50, modificado para procesar las 4 modalidades de MRI (T1, T1ce, T2, FLAIR) del dataset BraTS 2020. El modelo alcanzó una capacidad de discriminación excepcional, con un balanced accuracy (exactitud balanceada) de 0.98 en el conjunto de prueba.

Enfoque Técnico

Arquitectura ResNet-50

Figura 1: Diagrama esquemático de la arquitectura ResNet-50 adaptada para 4 canales de entrada

🧠

Arquitectura ResNet-50

Red neuronal residual de 50 capas adaptada para procesar 4 canales de entrada (T1, T1ce, T2, FLAIR) en lugar de los 3 canales RGB estándar. Uso de fine-tuning completo para especialización en clasificación de gliomas.

🔬

Dataset BraTS 2020

Utilización del benchmark internacional BraTS (Brain Tumor Segmentation Challenge) que incluye 4 modalidades de MRI y máscaras de segmentación ground-truth de 3 zonas tumorales: núcleo necrótico, edema y realce.

🎯

Preprocesamiento Avanzado

Normalización Z-score basada en estadísticas globales del conjunto de entrenamiento. Slices 2D de 240×240 píxeles co-registradas y apiladas en tensores de 4 canales para entrada al modelo.

Optimización AdamW

Entrenamiento de todos los parámetros del modelo usando el optimizador AdamW con regularización de peso desacoplada, permitiendo actualización de todas las capas convolucionales para especialización.

🔍

IA Explicable (XAI)

Implementación de Grad-CAM++ para generar mapas de atención que validan que el modelo se enfoca en regiones biológicamente relevantes (núcleo necrótico y tumor realzado) y no en artefactos.

📊

Validación Cuantitativa

Análisis cuantitativo de la energía de atención del heatmap sobre sub-regiones tumorales (NCR, ED, ET), confirmando empíricamente que el modelo aprende a localizar áreas patológicas relevantes.

Resultados Destacados

0.9982

AUC (Area Under Curve)

1223

True Positives (HGG)

118

True Negatives (LGG)

98.2%

Balanced Accuracy

Matriz de Confusión

El modelo clasificó correctamente 1223 casos HGG (Verdaderos Positivos) y 118 casos LGG (Verdaderos Negativos). Solo presentó 2 casos de Falsos Positivos (LGG clasificados como HGG) y 31 casos de Falsos Negativos (HGG clasificados como LGG), demostrando una excelente capacidad de discriminación en un conjunto de prueba de 1374 muestras.

Validación con IA Explicable

El análisis Grad-CAM++ reveló que el modelo desarrolla automáticamente la capacidad de localizar las regiones tumorales. Para casos HGG, la atención se alinea fuertemente con las regiones de Tumor Realzado (ET) y Núcleo Necrótico (NCR). En contraste, los casos LGG muestran atención más difusa, principalmente concentrada en la región de Edema Peritumoral (ED), lo cual es consistente con la patofisiología conocida de los gliomas.

Resultados Destacados

0.9982

AUC (Area Under Curve)

98.2%

Balanced Accuracy

1374

Muestras Evaluadas

33

Errores Totales

🎯 Rendimiento Excepcional

El modelo clasificó correctamente 1223 casos HGG (Verdaderos Positivos) y 118 casos LGG (Verdaderos Negativos). Solo presentó 2 Falsos Positivos y 31 Falsos Negativos, alcanzando un AUC de 0.9982 que rivaliza con el desempeño de expertos humanos, mientras proporciona consistencia y reproducibilidad superiores.

✅ Validación con IA Explicable

El análisis Grad-CAM++ reveló que el modelo desarrolla automáticamente la capacidad de localizar las regiones tumorales. Para casos HGG, la atención se alinea fuertemente con las regiones de Tumor Realzado (ET) y Núcleo Necrótico (NCR). En contraste, los casos LGG muestran atención más difusa, principalmente concentrada en la región de Edema Peritumoral (ED), lo cual es consistente con la patofisiología conocida de los gliomas.

Ejemplos de Modalidades MRI

Visualización de las 4 modalidades de resonancia magnética y las segmentaciones de zonas tumorales utilizadas para entrenar el modelo

Glioma de Alto Grado (HGG)

FLAIR HGG

FLAIR

T1ce HGG

T1ce

T2 HGG

T2

T1 HGG

T1

Núcleo HGG

Núcleo

Edema HGG

Edema

Realce HGG

Realce

Tumor Completo HGG

Tumor Completo

Núcleo Edema Realce

Glioma de Bajo Grado (LGG)

FLAIR LGG

FLAIR

T1ce LGG

T1ce

T2 LGG

T2

T1 LGG

T1

Núcleo LGG

Núcleo

Edema LGG

Edema

Realce LGG

Realce

Tumor Completo LGG

Tumor Completo

Núcleo Edema Realce

Métricas de Desempeño

Análisis cuantitativo del rendimiento del modelo durante entrenamiento y evaluación

Matriz de Confusión

Matriz de Confusión

1223 True Positives (HGG) y 118 True Negatives (LGG). Solo 2 Falsos Positivos y 31 Falsos Negativos en 1374 muestras.

Curva ROC

Curva ROC

AUC de 0.9982, indicando capacidad de discriminación casi perfecta entre HGG y LGG.

Curva de Accuracy

Balanced Accuracy

Convergencia entre training y validation cerca de 1.0, demostrando aprendizaje efectivo sin overfitting.

Curva de Loss

Loss (CrossEntropy)

Disminución drástica del error con valores bajos y cercanos entre training y validation.

Mapas de Explicabilidad (Grad-CAM++)

Visualización de las regiones de atención del modelo que validan su razonamiento clínicamente relevante

Ejemplos HGG - Atención en Núcleo Necrótico y Tumor Realzado

HGG Grad-CAM++ 1 HGG Grad-CAM++ 2 HGG Grad-CAM++ 3 HGG Grad-CAM++ 4 HGG Grad-CAM++ 5 HGG Grad-CAM++ 6

Los heatmaps muestran que el modelo concentra su atención en las regiones de Tumor Realzado (rojo) y Núcleo Necrótico (azul), características patológicas clave de los gliomas de alto grado.

Ejemplos LGG - Atención Difusa en Edema Peritumoral

LGG Grad-CAM++ 1 LGG Grad-CAM++ 2 LGG Grad-CAM++ 3 LGG Grad-CAM++ 4 LGG Grad-CAM++ 5 LGG Grad-CAM++ 6

Para casos LGG, la atención del modelo es más difusa y se concentra principalmente en la región de Edema Peritumoral (verde), consistente con la naturaleza más infiltrativa y menos agresiva de estos tumores.

Impacto Clínico y Aplicaciones

🏥 Diagnóstico Asistido

El sistema proporciona una segunda opinión objetiva y reproducible para radiólogos, reduciendo la variabilidad inter-observador en la interpretación de imágenes MRI. La alta precisión (AUC 0.9982) lo convierte en una herramienta confiable para apoyo en la toma de decisiones clínicas.

⚕️ Planificación Terapéutica

La clasificación preoperatoria precisa entre HGG y LGG es fundamental para determinar la agresividad del tratamiento (cirugía, radioterapia, quimioterapia). Este sistema permite una planificación más informada y potencialmente mejores resultados para los pacientes.

🔬 Transparencia y Confianza

A diferencia de modelos "caja negra", la validación mediante Grad-CAM++ demuestra que las predicciones se basan en características biológicamente relevantes. Esta transparencia aumenta la confianza clínica y facilita la adopción en entornos hospitalarios.

🌐 Escalabilidad y Transferencia

La metodología desarrollada es transferible a otros problemas de clasificación médica por imagen: detección de neumonía en radiografías, clasificación de lesiones cutáneas, gradación de retinopatía diabética, entre otros. El framework de IA explicable es aplicable a cualquier dominio que requiera confianza en las decisiones del modelo.

Detalles Técnicos de Implementación

📊 Modalidades de MRI Utilizadas

  • T1: Secuencia ponderada en T1, proporciona gran detalle anatómico con líquidos oscuros
  • T1ce: T1 con realce de contraste (Gadolinio), ilumina partes activas del tumor con barrera hematoencefálica comprometida
  • T2: Secuencia ponderada en T2, sensible a patologías donde líquidos aparecen brillantes
  • FLAIR: Recuperación de inversión atenuada en fluidos, similar a T2 pero suprime señal de LCR para visualizar edema peritumoral

🎯 Zonas Tumorales Segmentadas

  • Núcleo (NCR): Región central no viable y necrótica del tumor
  • Edema (ED): Inflamación (acumulación de líquido) en tejido cerebral sano circundante
  • Realce (ET): Parte activa y viable del tumor, identificada por captación del contraste en T1ce

🔧 Stack Tecnológico

Deep Learning

PyTorch, ResNet-50, Transfer Learning, Fine-tuning

Explicabilidad

Grad-CAM++, Saliency Maps, Attention Visualization

Procesamiento

NumPy, Z-score Normalization, Image Co-registration

Evaluación

ROC-AUC, Confusion Matrix, Balanced Accuracy

Hallazgos Clave de la Investigación

💡 Aprendizaje Autónomo de Localización

El modelo, entrenado únicamente con etiquetas de clasificación a nivel de imagen (HGG/LGG), desarrolló automáticamente la capacidad de localizar las regiones tumorales sin supervisión explícita de segmentación. Este es un hallazgo significativo que demuestra capacidades emergentes del deep learning.

✅ Razonamiento Clínicamente Coherente

La validación cuantitativa confirmó que las predicciones del modelo se basan en sub-regiones biológicamente relevantes (Núcleo Necrótico y Tumor Realzado para HGG; Edema Peritumoral para LGG), alineándose con el conocimiento patológico establecido.

🎓 Contribución Científica

Este trabajo demuestra que la alta precisión y la explicabilidad validada no son objetivos mutuamente excluyentes. El enfoque dual de rendimiento excepcional (AUC 0.9982) más interpretabilidad rigurosa representa un avance hacia sistemas de IA médica confiables y adoptables clínicamente.

Aplicaciones Industriales Más Amplias

Aunque demostrado en neuro-oncología, este framework es transferible a múltiples industrias

🏥

Radiología General

Detección de neumonía en radiografías de tórax, clasificación de nódulos pulmonares, identificación de fracturas óseas. Cualquier tarea de clasificación por imagen médica se beneficia de este enfoque de IA explicable.

👁️

Oftalmología

Gradación de retinopatía diabética, detección de glaucoma, clasificación de degeneración macular relacionada con la edad (AMD). La explicabilidad es crucial para confianza clínica en diagnóstico oftalmológico automatizado.

🔬

Patología Digital

Clasificación de biopsias histopatológicas, gradación de cáncer de próstata (Gleason score), detección de metástasis en ganglios linfáticos. El modelo puede adaptarse a imágenes de microscopía con ajustes mínimos.

🏭

Manufactura

Inspección de calidad visual automatizada, detección de defectos en líneas de producción, clasificación de componentes electrónicos. La explicabilidad permite entender qué características constituyen un defecto.

🌾

Agricultura de Precisión

Detección de enfermedades en cultivos mediante imágenes de drones, clasificación de frutas/vegetales por madurez, identificación de plagas. Los mapas de atención ayudan a validar que el modelo detecta síntomas reales.

🚗

Inspección Automotriz

Detección de daños en vehículos, clasificación de defectos de pintura, análisis de desgaste de componentes. La trazabilidad de decisiones es importante para seguros y reclamaciones de garantía.

Ventajas Competitivas de la Metodología

🎯

Precisión Excepcional

AUC de 0.9982 rivaliza con el desempeño de expertos humanos, mientras proporciona consistencia y reproducibilidad que supera la variabilidad inter-observador humana.

🔍

Transparencia Total

Grad-CAM++ proporciona visualización intuitiva de las regiones que influyen en cada predicción, permitiendo que médicos validen y confíen en las decisiones del sistema.

Procesamiento Rápido

Una vez entrenado, el modelo clasifica imágenes en milisegundos, permitiendo integración en flujos de trabajo clínicos sin interrupciones ni demoras significativas.

🔄

Transferibilidad

La arquitectura y metodología son fácilmente adaptables a nuevos problemas de clasificación por imagen con minimal fine-tuning, reduciendo tiempo y costo de desarrollo.

📈

Mejora Continua

El modelo puede ser reentrenado con nuevos datos para mejorar continuamente, adaptándose a variaciones en protocolos de adquisición o poblaciones de pacientes.

¿Tiene un Desafío Similar?

Podemos adaptar esta metodología probada a su problema específico de clasificación por imagen, ya sea en salud, manufactura, agricultura u otra industria

Consultoría Gratuita Descargar Paper Completo

Especificaciones Técnicas Detalladas

Dataset

  • 📊 Fuente: BraTS 2020 Challenge
  • 🏥 Pacientes: 369 (293 HGG, 76 LGG)
  • 🖼️ Slices: 240×240 píxeles, 2D
  • 📷 Modalidades: 4 (T1, T1ce, T2, FLAIR)
  • ✂️ División: 70% train, 15% val, 15% test

Arquitectura

  • 🏗️ Modelo: ResNet-50 modificado
  • 📥 Input: 240×240×4 (4 canales)
  • 🔢 Capas: 50 (9+12+18+9+2)
  • ⚙️ Parámetros: ~25M trainables
  • 📤 Output: Binario (HGG/LGG)

Entrenamiento

  • 🎯 Optimizador: AdamW
  • 📉 Loss: CrossEntropy
  • ⏱️ Epochs: ~100 con early stopping
  • 🔄 Estrategia: Fine-tuning completo
  • 💾 Batch size: 16-32

Evaluación

  • 📊 AUC: 0.9982
  • Accuracy: 97.6%
  • 🎯 Precision: 99.8% (HGG)
  • 🔍 Recall: 97.5% (HGG)
  • ⚖️ Balanced Acc: 98.2%