Google Eloquent: dictado AI offline y pulido de texto

¿Qué es Google AI Edge Eloquent?

Google lanzó de forma discreta una aplicación de dictado llamada “Google AI Edge Eloquent” disponible en iOS. La aplicación está pensada como una herramienta de dictado avanzada, orientada a convertir el habla natural en texto pulido, listo para uso profesional. Es gratuita para descargar y busca posicionarse frente a opciones emergentes de transcripción con IA como Wispr Flow, SuperWhisper y Willow.

La novedad clave de Eloquent es su enfoque “offline-first”: sus modelos de reconocimiento automático de voz (ASR) están basados en Gemma y pueden descargarse al dispositivo para procesar audio localmente. Esto permite dictar sin depender continuamente de conexión a Internet, aunque la app también ofrece modos que integran capacidades en la nube para mejorar la limpieza del texto.

Cómo funciona en la práctica

Al grabar en la app, la transcripción aparece en vivo. Cuando se pausa la grabación, Eloquent automáticamente filtra las muletillas —como “um” y “ah”— y corrige dudas o pequeñas autocorrecciones durante la frase para dejar un texto más claro y legible. Debajo del transcripto hay opciones para transformar el resultado: “Key points” (puntos clave), “Formal” (tono formal), “Short” (versión corta) y “Long” (versión extendida). Esas opciones permiten convertir un dictado bruto en distintos estilos según la necesidad.

El procesamiento local utiliza los modelos Gemma descargados; si el usuario activa el modo en la nube, Eloquent recurre a modelos Gemini basados en la nube para tareas de limpieza y pulido del texto. La app permite alternar entre ambos modos para priorizar privacidad y disponibilidad (modo local) o aprovechamiento de capacidades adicionales en la nube.

Funciones destacadas

Descarga de modelos ASR basados en Gemma para transcripción local.
Transcripción en tiempo real con limpieza automática al pausar la grabación.
Transformaciones de texto predefinidas: puntos clave, formal, corto y largo.
Importación opcional de palabras clave, nombres y jerga desde Gmail para mejorar el reconocimiento de términos específicos.
Posibilidad de añadir palabras personalizadas a un glosario.
Historial de sesiones de transcripción con búsqueda entre todos los registros.
Estadísticas por sesión: palabras dictadas en la última sesión, velocidad en palabras por minuto y total de palabras habladas.

Privacidad y modo offline: una ventaja en regiones con conectividad limitada

El enfoque offline-first es particularmente relevante en entornos donde la conectividad es intermitente o costosa. Al permitir que el reconocimiento se haga localmente, Eloquent reduce la necesidad de enviar audio a servidores externos, lo que puede mejorar la privacidad y reducir latencia.

Aun así, la app ofrece la opción de usar limpieza en la nube con modelos Gemini cuando el usuario lo elija. Esa flexibilidad significa que quienes requieran el máximo pulido del texto pueden beneficiarse de la potencia de la nube, mientras que usuarios preocupados por privacidad o por consumo de datos pueden mantener el procesamiento local.

Integración y futuro en Android

Aunque la versión inicial está disponible únicamente en iOS, la ficha en la App Store mencionaba características pensadas para Android, como integración con el teclado del sistema y un botón flotante para iniciar transcripciones desde cualquier pantalla, similar a lo que hacen algunas apps competidoras en ese ecosistema. Sin embargo, Google actualizó la ficha el 7 de abril, eliminando referencias a la app para Android y añadiendo que el teclado de iOS llegará pronto.

Esa secuencia sugiere que Google está probando la experiencia en iOS primero, posiblemente para iterar sobre funciones offline y de limpieza antes de ampliar el soporte. Según la propia observación del lanzamiento, si esta prueba resulta exitosa, podríamos ver mejoras en las funciones de transcripción integradas en Android en el futuro.

Competencia y tendencias en transcripción por IA

La aparición de Eloquent se inserta en una tendencia más amplia: a medida que los modelos de speech-to-text mejoran, proliferan aplicaciones que buscan ofrecer transcripciones más útiles, no solo literales. Herramientas como Wispr Flow y SuperWhisper ya ofrecen accesos rápidos y modos híbridos entre local y nube; Google llega con la ventaja de su experiencia en modelos a gran escala y la posibilidad de integrar vocabularios personalizados desde servicios como Gmail.

A la larga, si Eloquent cumple con lo prometido, podría influir en cómo los fabricantes y desarrolladores integran capacidades de dictado en sistemas operativos y aplicaciones de productividad.

¿Qué implica esto para Latinoamérica?

Para profesionales y equipos en América Latina, una app de dictado que funcione bien sin conexión puede ser especialmente útil: muchas regiones aún enfrentan conectividad irregular o planes de datos limitados. La capacidad de descargar modelos y procesar audio en el dispositivo reduce dependencia de la red y puede acelerar flujos de trabajo como la toma de notas, redacción de borradores y documentación en campo.

Además, la opción de importar jerga y nombres desde Gmail y agregar palabras personalizadas es valiosa en un contexto lingüístico diverso como el latinoamericano, donde aparecen con frecuencia términos propios, nombres locales y modismos que las soluciones genéricas pueden no reconocer correctamente.

En términos de privacidad, el procesamiento local puede ser preferible para empresas que manejan información sensible y que quieren minimizar la exposición de audio a servicios en la nube. No obstante, es importante que equipos de TI y compliance evalúen las políticas de datos y las condiciones de uso antes de desplegar la app en entornos corporativos.

Conclusión

Google AI Edge Eloquent es una apuesta interesante por llevar la transcripción avanzada al dispositivo móvil, con un enfoque práctico en el procesamiento local y herramientas de limpieza automatizada. Aunque por ahora está limitada a iOS y Google ha modificado la información pública sobre una versión para Android, la aplicación demuestra hacia dónde van las prioridades en este segmento: precisión, flexibilidad entre modos local/nube y transformación automática del texto.

Para usuarios y organizaciones en América Latina, Eloquent ofrece ventajas claras en escenarios con conectividad limitada y necesidades de privacidad. Habrá que observar cómo evoluciona la app y si Google decide expandirla o integrar sus capacidades en Android y otros productos de productividad.