Nemotron 3.5: seguridad multimodal y personalizable

Introducción

Las exigencias de seguridad en sistemas de IA han evolucionado: ya no basta con clasificar texto en inglés. Las plataformas modernas deben evaluar interacciones complejas que combinan texto, imágenes y respuestas del asistente, además de aplicar políticas que varían por industria y jurisdicción. Nemotron 3.5 Content Safety responde a esa necesidad consolidando capacidades multimodales, multilingües y personalizables en un solo modelo optimizado para despliegue empresarial.

En este artículo explico las mejoras clave de Nemotron 3.5, su arquitectura base y cómo estas características facilitan la adopción en entornos regulados o con requisitos de auditoría, un punto relevante para equipos técnicos y responsables de seguridad en América Latina.

Unificación de la evaluación multimodal

Una de las limitaciones habituales en seguridad de contenido es evaluar por separado texto, imagen y respuesta del asistente. Nemotron 3.5 recibe en una sola ventana de contexto el pedido del usuario, una imagen opcional y la respuesta del asistente, y emite un veredicto único que considera la interacción completa.

Esto cierra un vacío importante: muchas violaciones de política solo se evidencian cuando se combinan elementos —por ejemplo, una instrucción textual que, junto con una imagen, facilita identificación de una persona o ubicación—. Evaluar todo el contexto en una sola pasada reduce falsos negativos y simplifica las arquitecturas de filtro en línea.

Cobertura lingüística global

Nemotron 3.5 mantiene la cobertura explícita en 12 idiomas: inglés, francés, español, alemán, chino, japonés, coreano, árabe, hindi, ruso, portugués e italiano. Además, aprovecha la capacidad de generalización del modelo base Gemma 3 para operar en modo zero-shot en cerca de 140 idiomas.

Para despliegues en regiones donde los corpus entrenados son escasos —como ciertas lenguas de África, del sudeste asiático o lenguajes escandinavos— esto significa que pueden obtenerse capacidades razonables sin necesitar afinamientos separados. En el contexto latinoamericano, la presencia explícita del español y el portugués facilita implementaciones en productos para mercados hispanohablantes y Brasil.

Aplicación de políticas personalizadas

La novedad arquitectónica más relevante de Nemotron 3.5 es la posibilidad de enviar una especificación de política personalizada junto con la entrada. En la práctica, esto permite que el modelo razone sobre reglas específicas de una empresa: un chatbot médico, una app educativa para niños o un asistente financiero pueden exigir taxonomías y umbrales distintos.

En lugar de depender exclusivamente del catálogo interno de categorías, el modelo interpreta políticas en lenguaje natural durante la inferencia y adapta su veredicto. Esa flexibilidad es crítica para organizaciones que operan bajo distintos marcos regulatorios o con requisitos internos de riesgo.

Trazas de razonamiento (THINK Mode) y auditabilidad

Nemotron 3.5 ofrece un modo opcional de razonamiento explicable llamado THINK mode. Cuando se activa, el modelo emite una traza paso a paso de su razonamiento antes de entregar la etiqueta final (seguro/no seguro) y, de ser pertinente, las categorías de violación.

Un ejemplo ilustrativo (parafraseado del material técnico): el usuario solicita orientación para obtener una sustancia controlada sin receta; la respuesta del asistente detalla pasos concretos y menciona un mercado en línea; la imagen adjunta muestra la fachada de una farmacia. El modelo concluye que la interacción es insegura respecto a las categorías Criminal Planning/Confessions y Controlled Substances; la foto aporta contexto locacional pero no modifica el veredicto.

THINK mode aporta transparencia y facilita la auditoría humana, útil para equipos de cumplimiento y revisores internos. Cuando la latencia es crucial, puede desactivarse para regresar al veredicto binario de baja latencia.

Conjunto de datos de seguridad multimodal

A diferencia de muchas iniciativas de código abierto que no publican sus conjuntos de entrenamiento, Nemotron 3.5 se acompaña de su Safety Dataset. Este recurso multimodal y multilingüe incluye las trazas de razonamiento que se emplearon para entrenar el modelo.

Publicar el dataset es un hito relevante: en el espacio multimodal, las imágenes y videos a menudo provienen de fuentes con licenciamiento restrictivo, lo que dificulta la reproducibilidad. Contar con un corpus explícito facilita evaluación externa, comparaciones y ajustes por parte de equipos locales que requieren entender sesgos y límites del modelo antes de su puesta en producción.

Arquitectura y modos de inferencia

Nemotron 3.5 se construye sobre Google Gemma 3 4B IT (4B parámetros), que ofrece una ventana de contexto de 128K tokens y capacidades avanzadas de razonamiento visión-lenguaje. NVIDIA realiza un afinamiento mediante un adaptador LoRA que implementa el comportamiento de clasificación de seguridad sin inflar el modelo, manteniéndolo viable para despliegue en GPUs con 8GB o más de VRAM.

La interfaz de inferencia soporta tres modos:

Modo 1: veredicto binario de baja latencia (ej. Usuario: seguro / Respuesta: insegura).
Modo 2: veredicto binario más categorías violadas (incluye etiquetas como Violencia, Criminal Planning/Confessions).
Modo 3: THINK mode, que incluye la traza de razonamiento y el veredicto final.

El modelo utiliza la taxonomía Aegis 2.0, que agrupa 13 categorías principales alineadas con el marco MLCommons y añade 10 subcategorías de mayor granularidad. Esta alineación facilita comparaciones con otras soluciones abiertas y cerradas evaluadas sobre datasets basados en Aegis.

Por qué el razonamiento importa en entornos empresariales

Incorporar razonamiento explícito no es solo una cuestión de explicar decisiones; es una herramienta para adaptar la clasificación al contexto y a políticas específicas. Para empresas reguladas —salud, finanzas, educación— la capacidad de justificar por qué una interacción fue marcada y cómo se aplicó una política es esencial para cumplimiento, mitigación de riesgo y revisión humana.

Además, las trazas permiten crear flujos híbridos donde el modelo actúa como primer filtro y los revisores humanos solo inspeccionan casos con razonamientos complejos o impacto alto.

Integración y consideraciones para América Latina

Para equipos en América Latina, Nemotron 3.5 ofrece ventajas operativas: soporte nativo para español y portugués, generalización a lenguas menos representadas y modos de inferencia adaptables según necesidades de latencia y auditoría. La publicación del dataset facilita la evaluación local de sesgos, un paso clave antes de desplegar en mercados con características demográficas y regulatorias propias.

Al desplegar, conviene considerar: la definición clara de políticas locales (normativas sobre protección de datos, regulación sanitaria y contenidos), la arquitectura de revisión humana y pruebas de rendimiento en infraestructuras GPU disponibles en la región.

Conclusión

Nemotron 3.5 consolida un enfoque pragmático para seguridad de contenido: evaluación multimodal en un único pase, cobertura lingüística amplia, políticas personalizables y trazas de razonamiento auditables. Estas características hacen al modelo adecuado para implementaciones empresariales que requieren cumplimiento y transparencia, y la publicación del dataset permite a los equipos técnicos validar y adaptar la herramienta a contextos locales.

Para responsables de producto y seguridad en América Latina, Nemotron 3.5 representa una opción interesante para modernizar filtros y sistemas de moderación, especialmente en escenarios donde la combinación de texto e imagen y la necesidad de cumplimiento normativo son factores críticos.