Cómo PwC y AWS automatizan la extracción de insights en contratos con IA

PwC desarrolló AIDA sobre AWS para convertir contratos no estructurados en datos accionables mediante reglas, plantillas y modelos de lenguaje. La solución acelera la búsqueda de cláusulas, permite consultas en lenguaje natural con citas y facilita integraciones con sistemas de gestión documental.

Por Redaccion TD
Cómo PwC y AWS automatizan la extracción de insights en contratos con IA

El problema: contratos largos, esfuerzos manuales

Los equipos legales, de cumplimiento y de compras dedican una cantidad considerable de tiempo a revisar contratos extensos donde la información clave suele estar enterrada en lenguaje no estructurado. A medida que el volumen de acuerdos crece, buscar cláusulas específicas y validar términos se vuelve menos escalable: los métodos basados en palabras clave o patrones funcionan en algunos casos, pero suelen fallar al ofrecer resultados consistentes y reproducibles.

En este contexto, muchas organizaciones están explorando enfoques basados en inteligencia artificial que combinan grandes modelos de lenguaje (LLMs) con flujos de extracción automatizados. PwC creó AIDA (AI‑driven annotation) sobre la infraestructura de AWS para ofrecer precisamente eso: extracción estructurada de insights contractuales y consultas en lenguaje natural con soporte de citas a la fuente.

¿Qué es AIDA y qué aporta?

AIDA es una solución diseñada para transformar documentos no estructurados en datos estructurados y consultables, con el objetivo de acelerar el acceso y la reutilización de información crítica de contratos. La propuesta de valor central incluye:

  • Extracción basada en reglas y plantillas definidas por el usuario.
  • Consultas en lenguaje natural que devuelven respuestas contextuales apoyadas por citas vinculadas a los documentos origen.
  • Integración con sistemas externos, como gestores de contratos y repositorios documentales, para recuperar origenes y entregar resultados.

Según implementaciones de clientes, AIDA ha logrado reducir el tiempo de revisión manual de contratos hasta en 90%, acelerando ciclos de decisión y permitiendo a equipos enfocarse en análisis de mayor valor.

Capacidades clave

Extracción por plantillas y reglas

AIDA permite crear plantillas y reglas de extracción personalizadas que se aplican de forma masiva a miles de contratos. Esto asegura consistencia en cómo se identifican y normalizan términos contractuales (por ejemplo, fechas, obligaciones, derechos de licencia) y facilita la exportación de esos datos a sistemas analíticos o ERPs.

Chat a nivel de documento

Los usuarios pueden hacer preguntas en lenguaje natural sobre un contrato individual y recibir respuestas que incluyen citas directas a los fragmentos relevantes del documento. Esto reduce la necesidad de recorrer manualmente párrafos largos para comprobar el significado o el alcance de una cláusula.

Chat global entre documentos

Además de consultas sobre contratos individuales, AIDA permite preguntas que abarcan múltiples documentos dentro de un proyecto. Por ejemplo, se puede pedir un resumen de todas las excepciones a una cláusula estándar a través de una cartera de acuerdos, recibiendo respuestas consolidadas con referencias a cada contrato correspondiente.

Arquitectura y seguridad — cómo funciona sobre AWS

AIDA está construida sobre servicios nativos de AWS y componentes integrados para ofrecer escalabilidad, seguridad y trazabilidad. Algunos elementos destacados del diseño son:

1) Seguridad en el borde y control de acceso

El tráfico de usuario pasa por un perímetro de seguridad que incluye AWS WAF para filtrado de amenazas y un balanceador de carga de red que enruta las solicitudes a un proxy inverso (NGINX). NGINX gestiona la terminación TLS, el enrutamiento y la aplicación de políticas antes de enviar las peticiones a contenedores en Amazon ECS.

La autenticación se integra con Amazon Cognito y proveedores de identidad empresariales (por ejemplo, Microsoft Entra ID, Okta) para gestionar el acceso a escala. AIDA también aplica controles de acceso granulados a nivel de aplicación y de proyecto, de modo que los administradores puedan delegar y limitar permisos según roles.

2) Almacenamiento y cifrado

Los documentos cargados, los resultados de OCR y metadatos se guardan en Amazon S3, aprovechando su durabilidad y costo eficiente para manejar grandes volúmenes de contratos. Los datos estructurados, configuraciones y los insights extraídos se persisten en Amazon RDS para facilitar consultas e integraciones.

AIDA cifra datos en tránsito (TLS 1.2 o superior) y utiliza cifrado en reposo (por ejemplo, SSE‑S3 para objetos en S3 y cifrado en RDS) para proteger información sensible.

3) Modelado y procesamiento

La solución combina extracción basada en reglas con capacidades de LLM (por ejemplo, mediante Amazon Bedrock) para interpretar lenguaje legal complejo y generar respuestas en lenguaje natural. Esto permite que AIDA identifique conceptos contractuales que no siempre son detectables con expresiones regulares o búsquedas por palabra clave.

Observabilidad y gobernanza

El flujo incluye trazabilidad sobre qué reglas y modelos procesaron cada elemento, facilitando auditoría y revisión humana. Dado que AIDA procesa información contractual potencialmente sensible, PwC y AWS recomiendan configurar salvaguardas y flujos de revisión humana antes de depender legalmente de resultados automatizados.

Casos de uso y relevancia para América Latina

AIDA se adapta a distintos sectores y competencias: legal, cumplimiento, compras, inmuebles y medios. En Media & Entertainment, por ejemplo, la solución ayuda a extraer derechos de licencia (broadcast, streaming, teatral, derivados) para acelerar decisiones sobre spin‑offs, secuelas y distribución global; un estudio importante redujo su tiempo de investigación de derechos en 90%.

Para organizaciones en América Latina, la automatización de revisión contractual puede traducirse en respuestas más rápidas a oportunidades de negocio, menor riesgo operativo y mejor cumplimiento de condiciones regulatorias locales. Empresas inmobiliarias, distribuidoras de contenido y equipos de compras pueden beneficiarse al integrar AIDA con sus sistemas existentes.

Consideraciones de cumplimiento y buenas prácticas

  • Responsabilidad del cliente: AIDA ofrece capacidades técnicas, pero los clientes deben configurar y operar la solución para cumplir sus obligaciones legales y de privacidad locales.
  • Revisión humana: AIDA debe complementar, no reemplazar por completo, la revisión humana, especialmente cuando se toman decisiones legales o comerciales críticas.
  • Datos sensibles y residencia: evaluar requisitos locales de protección de datos y políticas de residencia de datos antes de procesar información contractual confidencial.

Conclusión

La combinación de reglas, plantillas y modelos de lenguaje con una arquitectura segura en AWS permite a AIDA convertir contratos en activos de datos consultables. Para equipos legales, de cumplimiento y compras en América Latina, este enfoque ofrece una vía práctica para reducir tiempos de revisión, mejorar la consistencia en la extracción de términos y acelerar la toma de decisiones, siempre incorporando controles de gobernanza y supervisión humana.

Si su organización evalúa automatizar el análisis contractual, conviene considerar tanto la capacidad técnica como las implicaciones de cumplimiento local, definir plantillas y reglas claras, y planear una fase de validación humana para asegurar resultados confiables.

Fuente original: AWS ML Blog