OncoAgent: IA oncológica open‑source y privada

Resumen

OncoAgent es un sistema de soporte a la decisión clínica para oncología, 100% open source y diseñado para operar on‑premises, eliminando la dependencia de APIs de nube. Combina una arquitectura de dos niveles de modelos LLM finamente ajustados, una topología multi‑agente implementada con LangGraph, una canalización Corrective RAG en cuatro etapas sobre más de 70 guías de alto nivel (NCCN, ESMO) y un validador de seguridad en tres capas que aplica una política estricta de Zero‑PHI.

¿Por qué importa para hospitales y sistemas de salud?

La oncología es un área clínica con enorme densidad de información y cambios frecuentes en las guías. Los riesgos de recomendaciones que no estén ancladas a evidencia son altos. Además, en contextos con fuertes requerimientos de soberanía de datos —como muchos hospitales y sistemas públicos en América Latina— la posibilidad de ejecutar inferencia y entrenamiento localmente sin enviar datos a APIs externas es una ventaja operacional y regulatoria importante.

OncoAgent busca responder a tres limitaciones habituales de soluciones comerciales: reducir las alucinaciones no fundamentadas, permitir despliegue on‑premises por razones de privacidad y evitar arquitecturas monolíticas que se saturan ante casos complejos con comorbilidades múltiples.

Arquitectura general y principios de diseño

El sistema se construyó alrededor de tres principios:

Descomposición arquitectónica: el razonamiento clínico se reparte en ocho nodos especializados dentro de LangGraph, cada uno con funciones acotadas y auditable.
Generación respaldada: todas las salidas se anclan a una base de conocimiento vectorizada mediante una canalización de recuperación y verificación en cuatro etapas.
Soberanía de hardware: entrenamiento e inferencia se ejecutan nativamente en AMD Instinct MI300X con ROCm, posibilitando despliegue local sin exfiltración de datos.

La topología de ocho nodos es: Router → Ingestion → Corrective RAG → Specialist ↔ Critic → HITL Gate → Formatter → END, con rutas de fallback y un bucle de reflexión de hasta dos iteraciones. El estado del sistema se guarda inmutable para mantener un rastro de auditoría completo.

Enrutamiento por complejidad y tiering de modelos

Antes de invocar al especialista, OncoAgent calcula una puntuación de complejidad S mediante un modelo aditivo ponderado:

S = w_cancer + w_stage + w_mutations + w_treatment

Donde los pesos definidos incluyen ejemplos como: cáncer raro (+0.40), primario desconocido (+0.30), estadio IV (+0.25), presencia de ≥2 mutaciones (+0.30), entre otros. El umbral de decisión es S ≥ 0.5 → Tier 2; S < 0.5 → Tier 1.

Tier 1 está pensado para triage rápido y usa un modelo optimizado para velocidad de ~9B parámetros.
Tier 2 atiende casos de razonamiento profundo con un modelo de ~27B parámetros.

El preimpresion de validación reportada en el proyecto muestra, por ejemplo, que un caso de carcinoma pancreático estadio IV con mutaciones KRAS y BRCA2 obtuvo S = 0.80, por lo que fue dirigido correctamente al Tier 2. Además, los clínicos pueden anular la ruta cuando lo consideren necesario.

Corrective RAG y anclaje a guías

OncoAgent emplea una canalización Corrective RAG en cuatro etapas que opera sobre una colección curada de más de 70 guías de nivel clínico (NCCN, ESMO). Dado que la precisión terminológica es crítica en oncología, la solución incorpora re‑rankers cross‑encoder y embeddings hipotéticos (HyDE) para resolver ambigüedades y sinónimos médicos, garantizando que la generación esté fundada en documentos relevantes.

El sistema también incluye una etapa de calificación documental (CRAG) posterior al “post‑fix” cuyo resultado reportado alcanzó una tasa de éxito del 100% y una confianza media de RAG de 2.3+, según el preprint técnico.

Multi‑agentes, reflexión y seguridad humana (HITL)

OncoAgent sintetiza patrones de multi‑agente de vanguardia: separación de ganchos de seguridad deterministas, gestión estructurada de llamadas a herramientas y memoria por sesión, junto con bucles de auto‑corrección inspirados en Reflexion. Hay un gate de HITL (Human‑in‑the‑Loop) obligatorio para salidas de alta complejidad o baja confianza, lo que introduce una intervención humana antes de recomendaciones críticas.

Complementando esto, la plataforma aplica un validador de seguridad en tres capas que implementa una política de Zero‑PHI estricta, evitando que información identificable del paciente sea incluida en las salidas.

Entrenamiento, hardware y rendimiento

Los modelos fueron afinados vía QLoRA sobre un corpus de 266,854 casos oncológicos reales y sintéticos generado con el marco Unsloth. El entrenamiento se llevó a cabo en hardware AMD Instinct MI300X con 192 GB de HBM3. Gracias a técnicas como sequence packing, fue posible completar el fine‑tuning de todo el dataset en aproximadamente 50 minutos, lo que los autores describen como una aceleración de throughput de 56× frente a generación basada en APIs.

Todo el stack de entrenamiento e inferencia corre sobre ROCm y herramientas open source, lo que permite la ejecución local en instalaciones hospitalarias y evita la dependencia de proveedores de nube.

Implicaciones prácticas y consideraciones para Latinoamérica

Para sistemas de salud en América Latina, OncoAgent ofrece dos ventajas relevantes: la posibilidad de mantener control local sobre datos sensibles y la trazabilidad auditable de las decisiones al estar cada componente desacoplado y almacenando estado inmutable. Esto facilita evaluaciones de cumplimiento y revisiones clínicas posteriores.

Sin embargo, desplegar y operar una pila como la descrita requiere capacidades técnicas y de infraestructura (p. ej., aceleradores compatibles y personal con experiencia en ML y seguridad), por lo que la adopción institucional debería planificarse con pilotos, capacitación y gobernanza clínica clara.

Conclusión

OncoAgent propone una solución integral para soporte de decisión en oncología que prioriza el enraizamiento en guías validadas, la descomposición del razonamiento en nodos auditable y la privacidad mediante ejecución local. Al combinar multi‑agentes, Corrective RAG, QLoRA y un enfoque de seguridad robusto, el proyecto se posiciona como una alternativa open‑source para instituciones que requieren control total sobre sus datos clínicos. El siguiente paso lógico para adoptantes en la región es evaluar integraciones piloto con equipos clínicos y la capacidad operativa para mantener infraestructura y procesos HITL.