Machine Learning

Más allá de SMOTE: estrategias efectivas para clasificación desbalanceada

Machine Learning 7 min lectura

Más allá de SMOTE: estrategias efectivas para clasificación desbalanceada

Los problemas de clasificación desbalanceada son la norma en fraude, salud y churn. SMOTE fue la solución popular, pero en datos de producción falla con frecuencia. Este artículo presenta alternativas prácticas, métricas adecuadas y un marco de decisión para elegir la estrategia correcta.

12 de julio de 2026

Perfilado de atención en PyTorch: qué mirar y cómo optimizar

Machine Learning 6 min lectura

Perfilado de atención en PyTorch: qué mirar y cómo optimizar

Analizamos cómo el profiler de PyTorch revela los componentes de la atención y por qué una pequeña modificación —usar operaciones in-place— elimina copias innecesarias en GPU. Aplicable a modelos transformer y cargas de trabajo en producción.

10 de julio de 2026

Diseño de sistemas ML para entrevistas: enfoque práctico con un caso de feed

Machine Learning 5 min lectura

Diseño de sistemas ML para entrevistas: enfoque práctico con un caso de feed

Las entrevistas de diseño de sistemas ML exigen pensar más allá del modelo: datos, despliegue y ciclo de mejora. Aquí encontrará un enfoque claro y un caso práctico de ranking de feed.

20 de junio de 2026

Cómo la IA mejora el modelado de aleaciones metálicas y acelera la innovación

Machine Learning 5 min lectura

Cómo la IA mejora el modelado de aleaciones metálicas y acelera la innovación

Investigadores del MIT desarrollaron una estrategia que usa teoría de la información para crear conjuntos de entrenamiento más representativos, mejorando la precisión de modelos ML que simulan aleaciones metálicas. La técnica puede acelerar el diseño de materiales en industrias como aeroespacial, energía y semiconductores.

20 de junio de 2026

Más allá de LoRA: cómo elegir la técnica PEFT adecuada para su proyecto

Machine Learning 5 min lectura

Más allá de LoRA: cómo elegir la técnica PEFT adecuada para su proyecto

LoRA domina el ecosistema PEFT, pero ¿es siempre la mejor opción? En este artículo explicamos por qué no basta con seguir la tendencia y cómo evaluar técnicas alternativas según sus necesidades y recursos.

20 de junio de 2026

Cuando los generalistas superan a los especialistas: lecciones de IA en juegos de información imperfecta

Machine Learning 6 min lectura

Cuando los generalistas superan a los especialistas: lecciones de IA en juegos de información imperfecta

Investigadores del MIT y colaboradores presentan un benchmark que compara algoritmos para juegos de información imperfecta y encuentran que los métodos de policy gradient, más generales, obtienen mejor rendimiento que algoritmos teóricos especializados. El trabajo resalta la importancia de evaluaciones rigurosas y tiene implicaciones prácticas para agentes que toman decisiones en entornos con información parcial.

18 de junio de 2026

SageMaker Async ahora acepta payloads inline: menos complejidad y menor latencia

Machine Learning 5 min lectura

SageMaker Async ahora acepta payloads inline: menos complejidad y menor latencia

Amazon SageMaker AI Async Inference introduce soporte para enviar la carga útil directamente en la llamada InvokeEndpointAsync mediante el parámetro Body (máx. 128,000 bytes). Esto elimina el paso de subida a S3 y reduce latencia, costos y complejidad operativa.

18 de junio de 2026

Perfilado en PyTorch: de nn.Linear a un MLP fusionado

Machine Learning 6 min lectura

Perfilado en PyTorch: de nn.Linear a un MLP fusionado

Este artículo explica, con trazas de perfilador, por qué nn.Linear no genera kernels separados para multiplicación y suma, qué es un epílogo y cuándo torch.compile aporta beneficios. Incluye recomendaciones prácticas para experimentar con scripts de Hugging Face.

11 de junio de 2026

DPO más allá de chatbots: cómo solucionar la degeneración de texto en OCR

Machine Learning 5 min lectura

DPO más allá de chatbots: cómo solucionar la degeneración de texto en OCR

Un experimento reciente con DharmaOCR mostró que Direct Preference Optimization (DPO), usado tradicionalmente para alinear chatbots, también mitiga loops de repetición en tareas objetivas como OCR. Aplicado tras el fine-tuning supervisado, DPO redujo consistentemente la degeneración de texto en varios modelos.

4 de junio de 2026

Optimización de hiperparámetros en Amazon Nova Forge: guía práctica para evitar fallos costosos

Machine Learning 6 min lectura

Optimización de hiperparámetros en Amazon Nova Forge: guía práctica para evitar fallos costosos

Personalizar modelos con Amazon Nova Forge exige equilibrio: mejorar rendimiento en dominios específicos sin degradar capacidades generales. Esta guía explica los retos clave —como el olvido catastrófico y la sensibilidad de la tasa de aprendizaje— y ofrece estrategias para afinar hiperparámetros y evitar entrenamientos inútiles.

3 de junio de 2026

Machine Learning 6 min lectura

OlmoEarth v1.1: más eficiente para mapas ambientales a gran escala

OlmoEarth v1.1 es una familia de modelos para detección en imágenes satelitales que mantiene la precisión de la versión anterior mientras reduce hasta tres veces el costo de cómputo. El avance clave: disminuir la longitud de las secuencias de tokens y rediseñar cómo se representan las bandas de Sentinel-2.

20 de mayo de 2026

Fine-tuning de NVIDIA Cosmos Predict 2.5 con LoRA/DoRA para generación de videos de robots

Machine Learning 6 min lectura

Fine-tuning de NVIDIA Cosmos Predict 2.5 con LoRA/DoRA para generación de videos de robots

NVIDIA Cosmos Predict 2.5 permite generar videos física y temporalmente plausibles condicionados por texto, imágenes o clips. Este artículo explica cómo adaptar el modelo a dominios robóticos usando LoRA y DoRA para fine-tuning eficiente en recursos.

19 de mayo de 2026

Machine Learning 6 min lectura

Cómo acelerar la inferencia de LLM: batching asíncrono para eliminar tiempos muertos

El batching asíncrono rompe el patrón donde CPU y GPU se turnan y desperdician ciclos. En lugar de esperar a que termine una etapa para empezar la siguiente, se preparan batches en la CPU mientras la GPU está ocupada, reduciendo tiempos muertos y aumentando throughput.

16 de mayo de 2026

EMO: cómo preentrenar Mixture-of-Experts para lograr modularidad emergente

Machine Learning 5 min lectura

EMO: cómo preentrenar Mixture-of-Experts para lograr modularidad emergente

EMO es un modelo Mixture-of-Experts preentrenado end-to-end que logra que la modularidad emerja directamente de los datos. Permite usar únicamente el 12.5% de los expertos para una tarea dada y mantener desempeño cercano al modelo completo.

11 de mayo de 2026

Recompensas verificables y GRPO: mejorar RL en SageMaker AI

Machine Learning 6 min lectura

Recompensas verificables y GRPO: mejorar RL en SageMaker AI

Las señales de recompensa imperfectas pueden desviar el aprendizaje por refuerzo. En este artículo explicamos RL con recompensas verificables (RLVR), cómo combinarlo con GRPO y few-shot, y un caso práctico en SageMaker AI usando GSM8K y Qwen2.5-0.5B.

10 de mayo de 2026

Machine Learning 6 min lectura

Ajuste por refuerzo con LLM como juez: guía práctica para equipos de IA

El uso de modelos de lenguaje como jueces (RLAIF) acelera y hace más flexible el ajuste por refuerzo de modelos grandes. Aquí explicamos por qué elegir este enfoque, los pasos clave para implementarlo y consideraciones prácticas para entornos latinoamericanos.

1 de mayo de 2026

Reducir latencia en búsqueda semántica de video con distillación de modelos en Amazon Bedrock

Machine Learning 6 min lectura

Reducir latencia en búsqueda semántica de video con distillación de modelos en Amazon Bedrock

La distilación de modelos en Amazon Bedrock permite trasladar la inteligencia de enrutamiento de un modelo grande (Nova Premier) a uno pequeño (Nova Micro), reduciendo costos y latencia sin sacrificar precisión en búsquedas semánticas de video. Este artículo explica el flujo completo y su aplicabilidad para catálogos multimedia en América Latina.

19 de abril de 2026

Finetuning multimodal: cómo mejorar la recuperación de documentos visuales

Machine Learning 6 min lectura

Finetuning multimodal: cómo mejorar la recuperación de documentos visuales

Los modelos multimodales generales rinden bien en tareas diversas, pero no siempre son óptimos para casos específicos como la recuperación de páginas de documentos. Aquí explico cómo entrenar y afinar modelos multimodales en Sentence Transformers y muestro un ejemplo práctico con mejoras claras en VDR.

17 de abril de 2026

Personalizar Amazon Nova: diseñe funciones de recompensa escalables con AWS Lambda

Machine Learning 6 min lectura

Personalizar Amazon Nova: diseñe funciones de recompensa escalables con AWS Lambda

Las funciones de recompensa son el núcleo de la personalización por refuerzo para Amazon Nova. AWS Lambda ofrece una forma serverless y escalable para evaluar respuestas, orientar el aprendizaje y reducir la necesidad de millones de etiquetas manuales.

14 de abril de 2026

BERTopic explicado: de texto crudo a temas interpretables

Machine Learning 6 min lectura

BERTopic explicado: de texto crudo a temas interpretables

BERTopic combina embeddings de transformers, reducción de dimensionalidad, clustering y c-TF-IDF para generar temas más coherentes que los métodos tradicionales. Aquí explicamos su pipeline, cómo implementarlo paso a paso y qué considerar para proyectos en Latinoamérica.

11 de abril de 2026

Funciones de pérdida en Machine Learning: cómo elegir la adecuada

Machine Learning 6 min lectura

Funciones de pérdida en Machine Learning: cómo elegir la adecuada

Las funciones de pérdida dirigen el aprendizaje de los modelos: definen qué errores se penalizan y cómo. En esta guía revisamos las familias principales, sus propiedades y recomendaciones prácticas para proyectos en América Latina.

5 de abril de 2026

Mamba4: la alternativa más eficiente a Transformers para secuencias largas

Machine Learning 6 min lectura

Mamba4: la alternativa más eficiente a Transformers para secuencias largas

Mamba4 propone una arquitectura basada en State Space Models (SSMs) con un mecanismo selectivo que mantiene rendimiento competitivo y reduce costos computacionales frente a Transformers en secuencias largas. Es especialmente relevante para aplicaciones con recursos limitados o datos en streaming.

4 de abril de 2026

Acelera el fine‑tuning de LLMs con datos no estructurados usando SageMaker y S3

Machine Learning 6 min lectura

Acelera el fine‑tuning de LLMs con datos no estructurados usando SageMaker y S3

AWS integró SageMaker Unified Studio con buckets generales de S3 para facilitar el uso de datos no estructurados en ML. En este artículo explicamos cómo aprovechar esa integración para afinar Llama 3.2 11B Vision Instruct en una tarea de Visual Question Answering usando el dataset DocVQA.

29 de marzo de 2026