#vakra

VAKRA: el benchmark que mide cómo razonan y fallan los agentes en entornos empresariales

VAKRA propone un entorno ejecutable con miles de APIs locales y colecciones de documentos para probar si los agentes pueden completar flujos multi‑paso en escenarios tipo empresa. El benchmark no solo mide habilidades aisladas, sino la capacidad de encadenar herramientas, seleccionar APIs relevantes y combinar evidencia de múltiples fuentes.

16 de abril de 2026