#modelos-de-lenguaje

Cómo enseñar a agentes de IA a hacer mejores preguntas usando 'Battleship'

Un equipo de CSAIL y SEAS transformó el clásico juego Battleship en un laboratorio para evaluar cómo los modelos de lenguaje formulan preguntas útiles. Aplicando inferencia Monte Carlo y autoformalización en Python, lograron que modelos pequeños compitieran y superaran a jugadores humanos en eficiencia de búsqueda.

4 de junio de 2026

Inteligencia Artificial 6 min lectura

Microsoft lanza MAI: modelos optimizados para razonamiento y código

Microsoft anunció dos nuevos modelos MAI: uno orientado al razonamiento y otro especializado en código para GitHub Copilot y VS Code. La compañía afirma un enfoque empresarial en datos y licencias, aunque los detalles públicos revelan una mezcla que incluye rastreos web masivos.

3 de junio de 2026

Inteligencia Artificial 5 min lectura

Por qué la IA de Google no sabe deletrear (y qué significa para la confianza en Search)

La nueva función de resultados generativos de Google ha mostrado errores básicos: cuenta letras mal y genera palabras mal escritas. Estas fallas no son bugs menores, sino reflejo de cómo los modelos de lenguaje procesan texto.

28 de mayo de 2026

Inteligencia Artificial 6 min lectura

Nemotron-Labs Diffusion: generación de texto a la velocidad de la luz para LLMs

NVIDIA presentó Nemotron-Labs Diffusion, una familia de modelos que combina generación autoregresiva y por difusión para acelerar la inferencia y permitir revisiones iterativas. Los modelos vienen en escalas de 3B, 8B y 14B y ofrecen modos de generación intercambiables que equilibran velocidad y precisión.

23 de mayo de 2026

Inteligencia Artificial 6 min lectura

Universal AI: la ruta accesible hacia la fluidez en inteligencia artificial

MIT Open Learning lanza Universal AI, un programa en línea y autodidacta diseñado para ofrecer formación práctica en IA a audiencias no técnicas. Incluye cursos básicos gratuitos, módulos sectoriales y un asistente AI para acompañar el aprendizaje.

14 de mayo de 2026

Inteligencia Artificial 6 min lectura

Quién decide qué te dice la IA: la apuesta de Campbell Brown

Campbell Brown, exjefa de noticias de Meta, fundó Forum AI para medir y mejorar la conducta de los grandes modelos en temas complejos como geopolítica, salud mental y selección de personal. Su enfoque combina expertos humanos y 'jueces' de IA para llevar a escala evaluaciones más precisas.

14 de mayo de 2026

Inteligencia Artificial 6 min lectura

Granite 4.1: así se diseñaron y entrenaron los nuevos LLMs

Granite 4.1 es una familia de modelos decoder‑only (3B, 8B, 30B) entrenada en ~15T tokens, con fine‑tuning supervisado y RL para mejorar instrucciones, código y razonamiento. Destaca la extensión de contexto a 512K tokens y la publicación bajo Apache 2.0.

1 de mayo de 2026

Inteligencia Artificial 5 min lectura

Enseñar a los modelos de IA a decir “no estoy seguro”

Investigadores del MIT identificaron por qué los modelos de razonamiento en IA tienden a mostrarse excesivamente seguros y propusieron RLCR, una técnica que enseña a los modelos a estimar su confianza. En pruebas, RLCR mejoró la calibración hasta en 90% manteniendo o aumentando la precisión.

23 de abril de 2026

Inteligencia Artificial 6 min lectura

Claude Opus 4.7: el salto de Anthropic para las tareas más difíciles

Anthropic lanzó Claude Opus 4.7, una versión orientada a resolver trabajos complejos y de largo plazo. Trae visión de alta resolución, mejores capacidades de código y memoria basada en archivos.

17 de abril de 2026

Inteligencia Artificial 6 min lectura

GLM-5.1: qué trae, cómo funciona y qué significa para la región

GLM-5.1 es la nueva apuesta de Z.ai: un gran modelo de lenguaje basado en un esquema Mixture-of-Experts que prioriza eficiencia, contexto largo y razonamiento. Este artículo explica su arquitectura, resultados de benchmark, vías de acceso y las implicaciones prácticas para la región.

12 de abril de 2026

Industria y Negocios 6 min lectura

Trustpilot apuesta por alianzas con IA mientras cae la búsqueda tradicional

Frente al crecimiento de agentes de compra impulsados por IA, Trustpilot busca colaborar con grandes comercios para que sus datos alimenten a modelos y asistentes. El movimiento refleja un cambio en cómo los consumidores inician su investigación de productos y obliga a replantear la estrategia de datos y marketing.

18 de marzo de 2026

Interfaz de Claude, el modelo de lenguaje de Anthropic

Modelos de Lenguaje 8 min lectura

Claude de Anthropic: el modelo de IA que está redefiniendo los estándares de la industria

Claude representa uno de los avances más significativos en modelos de lenguaje de gran escala. Analizamos su arquitectura, sus capacidades y por qué está cambiando la forma en que las empresas adoptan la IA.

20 de febrero de 2026