Incrusta una vista en vivo de un agente AI en tu app React con Amazon Bedrock AgentCore
Integrar una vista en vivo del navegador que controla un agente AI mejora la confianza y el control de los usuarios. Con Amazon Bedrock AgentCore y su componente BrowserLiveView puede mostrar la sesión del agente directamente en su app React sin infraestructura de streaming adicional.
Introducción
Cuando las aplicaciones delegan navegación y manipulación de páginas a agentes AI, los usuarios necesitan visibilidad y control sobre lo que esos agentes hacen. Amazon Bedrock AgentCore incluye un componente llamado BrowserLiveView que permite incrustar una transmisión en vivo del navegador del agente dentro de una aplicación React. Esto aporta transparencia en tiempo real y reduce la incertidumbre que genera la automatización autónoma.
En este artículo explico cómo funciona la integración, qué ventajas aporta para equipos y organizaciones (especialmente en contextos de supervisión y cumplimiento), y qué requisitos y consideraciones técnicas deben tener en cuenta los equipos de desarrollo y producto.
¿Por qué incluir una vista en vivo dentro de su aplicación?
Una transmisión embebida ofrece varios beneficios clave:
- Confianza del usuario: observar la navegación, las búsquedas y el llenado de formularios en tiempo real confirma que el agente está actuando correctamente.
- Supervisión y control humano: en procesos sensibles (manejo de cuentas, datos personales, trámites regulatorios) un supervisor puede observar y, si es necesario, intervenir sin salir de la aplicación.
- Evidencia visual para auditorías: la grabación de sesiones junto con la reproducción en consola facilita revisiones posteriores y soporte para cumplimiento.
- Menos latencia y menor complejidad operativa: el streaming DCV se transmite directamente desde la infraestructura de Amazon Bedrock AgentCore al navegador del usuario, evitando que el servidor de la aplicación tenga que enrutar video.
Para equipos en América Latina, donde la regulación en sectores como banca, salud y telecomunicaciones exige trazabilidad y control, esta capacidad facilita operar con agentes automáticos sin sacrificar cumplimiento.
Arquitectura y flujo general
La integración se apoya en tres componentes principales:
-
Cliente (React): incluye el componente BrowserLiveView del SDK TypeScript de Amazon Bedrock AgentCore. Recibe una URL prefirmada SigV4 y abre una conexión WebSocket para recibir el stream DCV. El renderizado y la interfaz se ejecutan aquí.
-
Servidor de aplicación: actúa como orquestador del ciclo de vida de la sesión del agente. Inicia sesiones en Amazon Bedrock AgentCore, ejecuta las llamadas de razonamiento del agente (por ejemplo, mediante la Amazon Bedrock Converse API) y genera las URLs presignadas SigV4 que autorizan el acceso temporal al stream.
-
AWS Cloud (Amazon Bedrock AgentCore Browser y servicios Bedrock): hospeda los navegadores en entornos aislados, proporciona el endpoint de automatización (Playwright CDP) y el endpoint de streaming Live View (DCV).
Puntos clave del flujo de datos:
- El cliente envía prompts y consulta el estado al servidor de aplicación mediante REST.
- El servidor usa la Amazon Bedrock Converse API para razonamiento con el modelo (en el ejemplo del original se mencionó Anthropic Claude, aunque Live View es agnóstico al modelo).
- El servidor controla el navegador remoto mediante Playwright/CDP en Amazon Bedrock AgentCore Browser.
- El stream DCV de Live View se conecta directamente desde Amazon Bedrock AgentCore al navegador del usuario, sin pasar por el servidor de la aplicación; el servidor solo genera la URL prefirmada.
Esta separación reduce latencia y carga en la infraestructura propia.
Requisitos y consideraciones de seguridad
Antes de empezar, asegúrese de tener:
- Node.js 20 o superior.
- Una cuenta AWS en una región que soporte Amazon Bedrock AgentCore Browser.
- Credenciales AWS con permisos para AgentCore Browser; Live View (pasos de visualización) requiere únicamente permisos de AgentCore.
- Acceso a un modelo de AI para conducir el agente si necesita razonamiento (el ejemplo usa Amazon Bedrock Converse API, que requiere permisos adicionales).
Buenas prácticas de seguridad:
- Use credenciales temporales (AWS IAM Identity Center o AWS STS). No utilice claves de acceso de larga duración.
- Aplique el principio de menor privilegio en las políticas IAM.
- Limite la duración de las URLs prefirmadas SigV4 para reducir riesgos.
Integración en React: experiencia y simplicidad
El BrowserLiveView del SDK TypeScript facilita la integración: según la documentación oficial, basta con incrustar el componente en su aplicación React —el SDK abstrae la conexión DCV— con apenas unas pocas líneas de JSX y la URL prefirmada obtenida desde su servidor. El cliente mantiene una conexión WebSocket persistente que recibe el stream DCV directamente desde Amazon Bedrock AgentCore.
El proceso típico en la app es:
- Solicitar al servidor la URL prefirmada para la sesión Live View.
- Renderizar el componente BrowserLiveView con esa URL.
- Mostrar controles de UI (por ejemplo, botón para iniciar/pausar la visualización, indicadores de estado, o enlaces a la reproducción de sesión almacenada en S3).
No es necesario que su infraestructura gestione la transmisión de video, lo que simplifica la arquitectura y reduce costos operativos.
Orquestación del agente y modelos
El servidor de aplicación hace dos cosas principales:
- Orquesta la sesión del agente en Amazon Bedrock AgentCore (crear sesión, ejecutar acciones del navegador mediante Playwright/CDP).
- Genera la URL SigV4 prefirmada que el cliente usará para acceder al Live View.
Si su flujo requiere razonamiento del agente (por ejemplo, interpretar instrucciones del usuario y decidir acciones en la web), puede integrar la Amazon Bedrock Converse API u otro servicio de modelos. En la publicación de referencia se emplea Anthropic Claude como ejemplo, pero Live View no depende de ningún modelo específico: puede usar cualquier proveedor o framework de agentes que prefiera.
Casos de uso relevantes para organizaciones en Latinoamérica
- Atención al cliente: supervisión en tiempo real de agentes automáticos que realizan gestiones en portales de clientes.
- Banca y Fintech: verificación visual de acciones en portales de usuario para auditorías internas y prevención de errores en operaciones sensibles.
- Soporte técnico y operaciones: reproducción y revisión de sesiones para resolver incidencias con evidencia visual.
- Procesos regulatorios: aportar trazabilidad visual en flujos que requieren evidencia de cumplimiento.
En todos estos casos, la posibilidad de grabar sesiones en Amazon S3 y revisarlas posteriormente complementa la observación en tiempo real.
Buenas prácticas y consideraciones finales
- Diseñe la UI para que la vista en vivo sea clara y accesible, con controles de privacidad y alertas cuando el agente accede a datos sensibles.
- Combine la observación en vivo con registros y grabaciones para un historial completo.
- Controle el alcance de los agentes mediante políticas y validaciones antes de ejecutar acciones críticas.
Conclusión
Embedar una vista en vivo de las acciones de un agente AI dentro de su app React mejora la confianza del usuario, facilita la supervisión humana y apoya requisitos de cumplimiento. Amazon Bedrock AgentCore ofrece la infraestructura necesaria para hacerlo sin que su equipo tenga que operar un sistema de streaming propio: su servidor genera la URL SigV4 y el stream DCV llega directo al navegador del usuario. Al final del proceso, es posible disponer de una aplicación de ejemplo lista para clonar y ejecutar que demuestra todo el flujo.
Si su organización en América Latina está evaluando despliegues de agentes AI en producción, considerar una capa de observabilidad visual como Live View ayuda a equilibrar automatización, confianza y cumplimiento.
Fuente original: AWS ML Blog