#rendimiento

Perfilado en PyTorch: de nn.Linear a un MLP fusionado
Machine Learning 6 min lectura

Perfilado en PyTorch: de nn.Linear a un MLP fusionado

Este artículo explica, con trazas de perfilador, por qué nn.Linear no genera kernels separados para multiplicación y suma, qué es un epílogo y cuándo torch.compile aporta beneficios. Incluye recomendaciones prácticas para experimentar con scripts de Hugging Face.

Gemini 3.5 Flash: inteligencia de frontera a alta velocidad

Gemini 3.5 Flash: inteligencia de frontera a alta velocidad

Google presentó Gemini 3.5 Flash, un modelo orientado a ejecución práctica que prioriza la velocidad sin sacrificar capacidades multimodales. Sus fortalezas incluyen un enorme contexto, cuatro modos de 'pensamiento' y latencias muy bajas, lo que lo hace útil para prototipado rápido y flujos agentivos en entornos empresariales.