Machine Learning 6 min lectura
Finetuning multimodal: cómo mejorar la recuperación de documentos visuales
Los modelos multimodales generales rinden bien en tareas diversas, pero no siempre son óptimos para casos específicos como la recuperación de páginas de documentos. Aquí explico cómo entrenar y afinar modelos multimodales en Sentence Transformers y muestro un ejemplo práctico con mejoras claras en VDR.