Principales anuncios de IA de Google en mayo 2026

Resumen ejecutivo

En mayo de 2026 Google presentó una serie de anuncios que marcan lo que la compañía denomina la era “agentic”: modelos y productos diseñados para actuar proactivamente, ejecutar flujos de trabajo complejos y crear contenido multimodal. Los protagonistas son Gemini 3.5, orientado a razonamiento avanzado y capacidades de acción, y Gemini Omni, que extiende la capacidad de Gemini para generar contenido a partir de entradas combinadas (texto, imagen, audio y video).

Además de los modelos, Google mostró cambios en Search para integrar agentes informativos de larga duración, una nueva experiencia en la app de Gemini, soluciones de compra unificada con Universal Cart, herramientas de salud y dispositivos pensados para estos agentes, como Googlebook y Fitbit Air. También se anunciaron iniciativas en música y exploración 3D conectando Project Genie con Street View.

Qué significa la “era agentic” y qué trae Gemini 3.5

Google define la era agentic como la transición de modelos que solo responden a consultas a sistemas que pueden tomar acciones en nombre del usuario: gestionar bandejas de entrada, programar citas, monitorizar información y ejecutar flujos de trabajo multietapa. Gemini 3.5 es la pieza central de este enfoque: combina capacidades de razonamiento de frontera con funciones para ejecutar acciones dentro de aplicaciones y entornos.

En la práctica, esto permite construir agentes que realizan tareas complejas y continúan trabajando en segundo plano. Para empresas y equipos en América Latina, esto abre posibilidades para automatizar procesos repetitivos, mejorar atención al cliente y acelerar tareas de análisis y generación de contenido, siempre que se evalúen adecuadamente las implicaciones de privacidad y gobernanza.

Gemini Omni: creación multimodal a partir de cualquier entrada

Gemini Omni amplía la propuesta al permitir la generación creativa a partir de entradas mixtas: texto, imágenes, audio y video. Google destaca la capacidad de Omni para generar video de alta calidad sustentado en el conocimiento del modelo.

Este avance apunta a flujos de trabajo creativos donde equipos de marketing, producción audiovisual y educadores pueden combinar distintos insumos para producir contenidos más rápidamente, aunque su adopción práctica dependerá de controles de uso responsable y la disponibilidad regional.

La app Gemini y asistentes proactivos

La app Gemini evoluciona de un asistente reactivo a un colaborador proactivo. Con una interfaz renovada, resúmenes diarios personalizados y funciones como Gemini Spark, la app puede gestionar correo, agendar citas y anticipar necesidades cotidianas. La promesa es un asistente disponible 24/7 que trabaja en segundo plano.

Para organizaciones, esto implica oportunidades para mejorar productividad personal y gestión del tiempo. Para tomadores de decisión en la región, es importante definir políticas claras sobre qué permisos se otorgan a agentes y cómo se protegen datos sensibles.

Búsqueda reinventada: agentes informativos, Antigravity y coding agentic en Search

Google presentó una actualización importante para Search que combina la web con capacidades generativas y agentes persistentes. Las novedades incluyen:

Agentes informativos en Search que monitorizan información en segundo plano y envían actualizaciones detalladas con enlaces para profundizar.
Integración de Antigravity y capacidades de codificación agentic de Gemini 3.5 Flash directamente en Search, permitiendo generar interfaces y visuales interactivos adaptados a consultas.
Nuevo cuadro de búsqueda inteligente, considerado el mayor cambio en más de 25 años.

Estas funciones posibilitan, por ejemplo, pedir a Search que genere una herramienta personalizada (como un panel o miniapp) que utilice datos en tiempo real — reseñas, mapas, clima — para tareas continuas. En el contexto latinoamericano, esto podría transformar cómo equipos construyen prototipos de productos y dashboards sin requerir desarrollos largos.

Universal Cart y experiencia de compra integrada

Universal Cart centraliza compras en Google: podrán añadirse productos desde Search, conversaciones con Gemini, YouTube o incluso Gmail, trabajando a través de comercios y servicios. La propuesta reduce fricción al comprar en múltiples canales y puede agilizar procesos de procurement o compras corporativas si se adopta con controles adecuados.

Hardware y espacio de agentes: Googlebook, Fitbit Air y Android Halo

Google mostró hardware diseñado para estas experiencias agentic:

Googlebook: un nuevo diseño de laptop construido desde cero para la inteligencia de Gemini, con herramientas como Magic Pointer para sugerencias contextuales, widgets personalizados y funciones cruzadas con teléfonos Android. Googlebook será fabricado por socios como Acer, Asus, Dell, HP y Lenovo.
Fitbit Air: el rastreador más pequeño de la línea, con sensores de alta fidelidad para seguimiento de salud y bienestar (frecuencia cardiaca 24/7, monitoreo de ritmo cardiaco con alertas de AFib, SpO2, variabilidad de la frecuencia cardiaca y sueño).
Android Halo: un nuevo espacio en el teléfono para ver el progreso de los agentes y recibir asistencia contextual sin interrumpir la actividad.

Estos dispositivos apuntan a integrar los agentes en el entorno personal y de trabajo, combinando productividad y bienestar.

Salud, ciencia y colaboración creativa

En salud, Google lanzó la nueva app Google Health para centralizar datos y ofrecer capacidades avanzadas de bienestar. Paralelamente, anunció una iniciativa que aplica ciencia cuántica avanzada y IA a las ciencias de la vida, buscando acelerar investigación (la comunicación no da más detalles operativos en este resumen).

En el terreno creativo, Google Flow Music se asoció con Believe para ofrecer a artistas y productores un colaborador de IA que ayuda en todo el proceso: desde ideas para letras y melodías hasta los toques finales de una canción. Esto propone nuevas dinámicas en la creación musical, útiles para la industria creativa en la región.

Exploración 3D: Project Genie y Street View

Combinando Project Genie con Street View, Google presentó una forma experimental de simular entornos 3D interactivos de lugares reales directamente desde el navegador. Esto puede tener aplicaciones en turismo, planificación urbana y educación, siempre que se consideren los permisos y límites de uso.

¿Qué deben considerar las organizaciones en América Latina?

Estas novedades traen oportunidades claras: automatización de tareas, generación de contenido multimodal, nuevas interfaces para datos y herramientas de salud conectadas. Sin embargo, para aprovecharlas con seguridad, las organizaciones deben:

Definir políticas de privacidad y gestión de datos para agentes automatizados.
Evaluar riesgos regulatorios y de cumplimiento según la jurisdicción local.
Capacitar equipos en uso responsable y en la supervisión humana necesaria para sistemas agentic.
Pilotos enfocados en casos de alto retorno y bajo riesgo antes de una adopción masiva.

Conclusión

Mayo de 2026 consolidó el giro de Google hacia agentes proactivos y creación multimodal con Gemini 3.5 y Gemini Omni, junto a una renovación de Search y nuevos dispositivos diseñados para estas experiencias. Para empresas y gobiernos en América Latina esto supone nuevas herramientas para productividad, salud y creatividad, pero su aprovechamiento requerirá decisiones estratégicas sobre gobernanza, privacidad y adopción gradual.

Mantener un enfoque práctico y regulado será clave para transformar estas capacidades en valor real para la región.