#ocr

DPO más allá de chatbots: cómo solucionar la degeneración de texto en OCR

Un experimento reciente con DharmaOCR mostró que Direct Preference Optimization (DPO), usado tradicionalmente para alinear chatbots, también mitiga loops de repetición en tareas objetivas como OCR. Aplicado tras el fine-tuning supervisado, DPO redujo consistentemente la degeneración de texto en varios modelos.

4 de junio de 2026

Industria y Negocios 6 min lectura

Especialización vs escala: por qué un modelo pequeño puede ser la mejor decisión de compra en IA

Un experimento reciente de Dharma mostró que un modelo especializado de 3.000 millones de parámetros superó a varias APIs comerciales líderes en OCR para portugués brasileño, además de operar a una fracción del costo. Esto obliga a replantear la regla práctica de 'el más grande es el mejor' en decisiones de adquisición de IA.

24 de mayo de 2026

Inteligencia Artificial 6 min lectura

Cómo construyeron un OCR multilingüe rápido usando datos sintéticos

Crear un OCR de calidad exige enormes volúmenes de datos anotados; la generación sintética ofrece escala y etiquetas perfectas. Nemotron OCR v2 demuestra que, con buena renderización y diversidad, los modelos entrenados en datos sintéticos pueden ser precisos y muy rápidos.

18 de abril de 2026

Inteligencia Artificial 6 min lectura

Falcon Perception: un Transformer temprano para detección abierta y segmentación

Falcon Perception presenta un enfoque early-fusion que procesa parches de imagen y texto en una sola secuencia usando una máscara de atención híbrida y una interfaz de salida compacta. El diseño logra mejores métricas en tareas abiertas y simplifica arquitecturas modulares tradicionales.

1 de abril de 2026

Inteligencia Artificial 5 min lectura

Cómo Mistral Document AI en Microsoft Foundry transforma documentos en datos accionables

Las empresas enfrentan grandes volúmenes de documentos que frenan procesos clave. Mistral Document AI, disponible en Microsoft Foundry, combina OCR avanzado y comprensión de layout para extraer datos estructurados a escala.

17 de marzo de 2026