Inteligencia Artificial 6 min lectura
ITBench‑AA: modelos frontera rinden por debajo del 50% en tareas SRE de Kubernetes
ITBench‑AA, creado junto a IBM, es el primer benchmark dedicado a tareas agenticas de IT empresarial. En la primera entrega sobre Site Reliability Engineering (SRE) para Kubernetes, los modelos más avanzados no alcanzan el 50% de rendimiento y muestran tradeoffs claros entre precisión, longitud de interacción y costo.