Inteligencia Artificial 7 min lectura
VAKRA: el benchmark que mide cómo razonan y fallan los agentes en entornos empresariales
VAKRA propone un entorno ejecutable con miles de APIs locales y colecciones de documentos para probar si los agentes pueden completar flujos multi‑paso en escenarios tipo empresa. El benchmark no solo mide habilidades aisladas, sino la capacidad de encadenar herramientas, seleccionar APIs relevantes y combinar evidencia de múltiples fuentes.