#inferencia

Por qué la apuesta de Nvidia con el chip Vera no es un detalle menor

Además de sus GPUs, Nvidia empuja una segunda línea de productos centrada en la inferencia: el chip Vera y la plataforma Vera Rubin. Jensen Huang dice que abrirán acceso a un mercado de US$200 mil millones y que Vera podría facturar US$20.000 millones este año fiscal. La gran pregunta es si la oferta podrá sostener la demanda.

vLLM V0 a V1: priorizar la corrección del backend antes de ajustar el objetivo RL

vLLM V0 a V1: priorizar la corrección del backend antes de ajustar el objetivo RL

La migración de vLLM V0 a V1 reveló una brecha entre la inferencia y el entrenamiento que afectaba métricas clave como clip rate, KL, entropía y recompensa. Al corregir primero el comportamiento del backend —logprobs procesados, defaults de runtime, actualizaciones en vuelo y proyección final en fp32— se restauró la paridad sin tocar el objetivo RL.