Nvidia Vera: la apuesta por la inferencia

Un anuncio que pasó por debajo del ruido de los resultados

Cuando Nvidia reportó ingresos de US$81.62 mil millones en el primer trimestre y dio una guía para el siguiente trimestre de US$91 mil millones —superando las expectativas de Wall Street— la noticia lógica fue el nuevo récord de ventas. Pero en la llamada con analistas el CEO Jensen Huang deslizó un punto estratégico que merece más atención: el nuevo procesador central Vera, que según él abre la puerta a un mercado de US$200 mil millones, completamente distinto del US$1 billón (US$1 trillion) que Nvidia ya proyecta para sus GPUs Blackwell y Rubin entre 2025 y 2027.

Huang añadió que espera que los ingresos por Vera alcancen los US$20 mil millones antes de que termine su año fiscal y que “espera que (Vera) sea el segundo mayor” contribuyente en ventas. Esa frase no es una nota al pie: es la señal de una nueva línea de combate para Nvidia.

¿Por qué Nvidia necesita una “segunda frente”?

La dinámica en la industria de chips para IA está cambiando. No se trata solo de entrenar modelos gigantes —donde las GPUs de Nvidia siguen dominando— sino cada vez más de servir esos modelos de forma masiva y en tiempo real: la fase de inferencia. Generar respuestas a escala, con latencia baja y costo por consulta bajo, se ha convertido en el campo donde rivales y clientes buscan ventajas competitivas.

Los grandes hyperscalers —Google, Amazon y Microsoft— se preparan para invertir colectivamente más de US$700 mil millones en infraestructura de IA este año (frente a aproximadamente US$400 mil millones en 2025). Al mismo tiempo, esos mismos clientes están desarrollando silicio propio (TPUs de Google, Trainium de Amazon) y empujan a Intel y AMD a posicionar CPUs como opción viable para cargas de inferencia. En resumen: la batalla por la inferencia puede desplazar parte de la demanda de GPUs hacia soluciones especializadas.

La respuesta de Nvidia a ese reto es Vera: un CPU diseñado para inferencia que, junto con los GPUs Rubin, conformará la plataforma Vera Rubin que se lanzará más adelante este año. La idea es ofrecer no solo GPUs para entrenamiento, sino una pila completa optimizada para servir modelos de IA.

¿Qué es Vera y de dónde viene la tecnología?

Vera se desarrolla con aportes de tecnología adquirida o licenciada a empresas especializadas. Nvidia incorporó tecnología de Groq —una startup enfocada en inferencia— mediante un acuerdo del que se informó tendría un valor cercano a US$17 mil millones. Esa experiencia se orienta precisamente a las características que exigen las cargas de inferencia: eficiencia por watt, latencia y coste por operación.

Combinado con los GPUs Rubin, el objetivo es dar a los clientes una opción integrada para todo el ciclo de vida de los modelos: entrenamiento a gran escala con GPUs y despliegue masivo con combinaciones optimizadas de CPU y GPU.

El talón de Aquiles: la oferta

Huang fue explícito sobre un riesgo real: la oferta. “Mi sensación es que estaremos limitados por la oferta durante toda la vida de Vera Rubin”, dijo en la llamada. Esa declaración es significativa: un producto que Nvidia proyecta como fuente importante de ingresos podría verse restringido por la capacidad de fabricación y por la disponibilidad de componentes críticos como memorias.

Para mitigar riesgos, Nvidia ha incrementado sus compromisos de suministro: los pagos comprometidos subieron a US$119 mil millones en el primer trimestre, desde US$95.2 mil millones en el trimestre anterior. Es un movimiento que refleja confianza en la demanda pero también nerviosismo ante posibles cuellos de botella en la cadena global de semiconductores.

Además, la compañía anunció un plan de recompra de acciones de US$80 mil millones y elevó su dividendo trimestral, señales financieras que buscan transmitir solidez mientras la presión sobre la oferta se mantiene.

Cómo ven los mercados y los inversores la jugada

A pesar de otra trimestral sólida, las acciones de Nvidia cayeron 1.6% en el mercado extendido tras el reporte. Analistas destacan que los buenos resultados ya están en el precio y la cuestión que persiste es la durabilidad del despliegue de IA hasta 2027 y 2028, sobre todo considerando la creciente competencia en inferencia de Google, Amazon, AMD e Intel.

Huang trató de responder a esas dudas con otro punto: hay un subconjunto creciente de clientes cloud específicos de IA cuya inversión ahora es comparable a la de los hyperscalers pero con un crecimiento intertrimestral más rápido. Su argumento es que Nvidia puede capturar crecimiento más allá de los grandes proveedores de la nube y que Vera es clave para esa expansión—siempre que la oferta lo permita.

Implicaciones para América Latina

¿Qué significa todo esto para la región latinoamericana? Algunas consideraciones prácticas:

Costos y disponibilidad: si Vera se convierte en un producto clave a nivel global pero enfrenta restricciones de suministro, es probable que los despliegues fuera de los centros principales de consumo (EE. UU., Europa, China) enfrenten demoras o precios más altos, al menos en las fases iniciales.
Competencia en la nube local: los proveedores de servicios en la nube regionales y empresas grandes que adoptan IA deberán evaluar si prefieren esperar acceso a la pila Vera Rubin o apoyarse en alternativas (GPUs, CPUs optimizadas, o servicios gestionados de los hyperscalers) para las cargas de inferencia.
Oportunidad para integradores y servicios gestionados: la complejidad de desplegar y operar infraestructuras orientadas a inferencia abre espacio para empresas locales que ofrezcan integración, optimización de costes y migración a soluciones nuevas.
Política y compra pública: gobiernos y grandes empresas públicas que planean modernizar servicios con IA deben considerar que la ventana de suministro puede ser un factor en sus calendarios y presupuestos.

Conclusión: más que un chip, una ofensiva estratégica

Vera no es solo otro producto dentro del catálogo de Nvidia; es la apuesta por consolidar una segunda línea de ingresos centrada en la inferencia, complementaria a su dominio en entrenamiento con GPUs. La cifra que Huang mencionó —un mercado total direccionable de US$200 mil millones y US$20 mil millones en ingresos por Vera este año fiscal— coloca a Nvidia en modo ofensivo.

Pero la clave no será solo la tecnología. La capacidad de la compañía para alinear la cadena de suministro con la demanda, la reacción de los hyperscalers y la eficacia de las alternativas de la competencia definirán si Vera se convierte en el segundo pilar que Nvidia imagina o en un recurso estratégico que se verá limitado por disponibilidad.

Para América Latina, la llegada de Vera y la carrera por la inferencia implican tanto oportunidades —mejores opciones de despliegue de IA a gran escala— como desafíos en materia de acceso y costos. Las empresas y gobiernos de la región deberían vigilar la evolución del suministro y preparar estrategias flexibles para incorporar estas nuevas opciones tecnológicas cuando estén disponibles.