La visión de NVIDIA para el futuro de la IA y los humanos digitales: Impulsando la próxima revolución industrial
La visión de Nvidia para el futuro de la IA y los humanos digitales: Impulsando la próxima revolución industrial Este artículo de blog cubre el discurso principal del CEO de Nvidia, Jensen Huang, en un evento reciente en Taiwán, donde compartió la ambiciosa visión de Nvidia para el futuro de la IA, los humanos digitales y la próxima ola de robótica y fábricas impulsadas por IA. El artículo destaca los avances de Nvidia en áreas como los modelos de lenguaje a gran escala, la IA generativa, los gemelos digitales y la IA física, así como sus últimas innovaciones de hardware como la arquitectura GPU Blackwell y la plataforma Omniverse. Proporciona una descripción general completa de la estrategia de Nvidia para impulsar la próxima revolución industrial impulsada por la IA.
24 de febrero de 2025

El CEO de Nvidia, Jensen Huang, presenta la visión de la compañía para el futuro de la inteligencia artificial, incluyendo humanos digitales, robots, Tierra 2.0 y fábricas de IA. Esta entrada de blog explorará estas tecnologías revolucionarias y su potencial para transformar las industrias.
El Foso Más Grande Posible: Las Bibliotecas de Aceleración de NVIDIA
Presentando Earth 2.0: El Gemelo Digital del Planeta de NVIDIA
El Big Bang de la IA: La IA Generativa y la Nueva Revolución Industrial
NIMS: Los Microservicios de Inferencia de IA de NVIDIA
El Auge de los Humanos Digitales
La Evolución de la Arquitectura y la Infraestructura de IA
Blackwell: La Arquitectura de GPU de Próxima Generación de NVIDIA
Inteligencia Artificial Física: Robots Impulsados por el Omniverse de NVIDIA
Conclusión
El Foso Más Grande Posible: Las Bibliotecas de Aceleración de NVIDIA
El Foso Más Grande Posible: Las Bibliotecas de Aceleración de NVIDIA
NVIDIA ha construido un increíble foso alrededor de su negocio a través de su extenso ecosistema de bibliotecas y marcos de aceleración. Algunos puntos clave:
-
NVIDIA ha creado más de 350 bibliotecas de aceleración específicas de dominio que permiten a los desarrolladores aprovechar la computación acelerada. Estos incluyen bibliotecas para aprendizaje profundo (cuDNN), simulación física (PhysX), litografía computacional (Litho), secuenciación de genes (cuPASA) y más.
-
Estas bibliotecas son fundamentales para hacer que la computación acelerada sea accesible para los desarrolladores. Sin ellas, la complejidad de portar algoritmos para que se ejecuten en GPU sería inmensa.
-
La separación entre el marco CUDA de bajo nivel y las bibliotecas específicas de dominio de alto nivel es lo que ha permitido la adopción generalizada de la computación acelerada. Es similar a la importancia de OpenGL para gráficos por computadora o SQL para el procesamiento de datos.
-
El extenso ecosistema de bibliotecas de NVIDIA ha creado un enorme foso alrededor de su negocio. Los desarrolladores están profundamente invertidos en estas bibliotecas, lo que hace que sea extremadamente difícil para los competidores irrumpir en el mercado.
-
La capacidad de expandir continuamente este ecosistema de bibliotecas y mantenerlo optimizado para el hardware más reciente es una ventaja competitiva clave para NVIDIA. Les permite mantenerse a la vanguardia y mantener su dominio en la computación acelerada.
En resumen, el extenso ecosistema de bibliotecas de aceleración de NVIDIA es un activo estratégico enorme que ha construido un foso increíblemente fuerte alrededor de su negocio. Este foso será muy difícil de superar para los competidores en un futuro previsible.
Presentando Earth 2.0: El Gemelo Digital del Planeta de NVIDIA
Presentando Earth 2.0: El Gemelo Digital del Planeta de NVIDIA
La idea de crear un gemelo digital de la Tierra, que NVIDIA llama "Tierra 2", es uno de los proyectos más ambiciosos que el mundo haya emprendido. El objetivo es simular la Tierra para predecir mejor el futuro de nuestro planeta, evitar desastres y comprender el impacto del cambio climático para que podamos adaptarnos mejor.
NVIDIA ha logrado avances significativos en esta área. Han desarrollado capacidades de simulación avanzadas que pueden modelar con precisión los patrones climáticos, el clima y otros fenómenos físicos. El gemelo digital de la Tierra se alimenta de modelos de IA que aprenden de grandes cantidades de datos, lo que les permite generar simulaciones muy realistas.
Durante la presentación, NVIDIA demostró cómo este gemelo digital se puede utilizar para predecir la trayectoria y el impacto de una tormenta que se acerca a Taiwán. Al ejecutar múltiples simulaciones, el sistema pudo proporcionar información sobre las incertidumbres en torno a la trayectoria de la tormenta y sus posibles efectos en la región.
Esta tecnología representa un gran avance en nuestra capacidad para comprender y responder a los desafíos que enfrenta nuestro planeta. Al crear un modelo digital integral de la Tierra, NVIDIA está permitiendo que científicos, responsables políticos y otros exploren el futuro de maneras que antes eran imposibles. A medida que las capacidades de este sistema continúen creciendo, tiene el potencial de transformar la forma en que abordamos los problemas globales como el cambio climático, los desastres naturales y la gestión de recursos.
El Big Bang de la IA: La IA Generativa y la Nueva Revolución Industrial
El Big Bang de la IA: La IA Generativa y la Nueva Revolución Industrial
Hasta que ChatGPT lo reveló al mundo, la IA se trataba de percepción, comprensión del lenguaje natural, visión por computadora y reconocimiento de voz. Se trataba de detección y comprensión.
Sin embargo, ChatGPT presentó al mundo la IA generativa: IA que puede producir tokens, ya sean palabras, imágenes, gráficos, tablas o incluso canciones y videos. Esto representa un cambio fundamental, ya que ahora la IA no solo puede percibir y comprender, sino también generar nuevo contenido.
Esto marca el comienzo de una nueva era: la era de la IA generativa. La IA ha evolucionado de ser una supercomputadora a un "Centro de datos" que produce un nuevo producto: los tokens. Así como el generador de CA de Nikola Tesla producía electrones, el generador de IA de Nvidia produce tokens, que tienen grandes oportunidades de mercado en casi todas las industrias.
Esto representa una nueva Revolución Industrial. La IA ya no es solo un instrumento para el almacenamiento de información o el procesamiento de datos, sino una fábrica para generar inteligencia para cada industria. Este cambio del cómputo basado en la recuperación al cómputo basado en la generación tendrá un impacto profundo, ya que los datos generados requieren menos energía para recuperarlos y son más relevantes en el contexto.
Para permitir esta nueva era, Nvidia ha creado los Servicios de Inferencia de Nvidia (Nims): modelos de IA pre-entrenados empaquetados como microservicios fáciles de implementar y totalmente optimizados. Esto permite a las empresas integrar rápidamente capacidades de IA generativa en sus aplicaciones y servicios.
NIMS: Los Microservicios de Inferencia de IA de NVIDIA
NIMS: Los Microservicios de Inferencia de IA de NVIDIA
NVIDIA ha creado un conjunto de microservicios de inferencia de IA, llamados NIMS, para facilitar a los desarrolladores la integración de capacidades avanzadas de IA en sus aplicaciones. Estos NIMS son modelos de IA pre-entrenados que se pueden implementar y utilizar fácilmente, sin la complejidad de construir la infraestructura de IA subyacente.
Los aspectos clave de los NIMS incluyen:
-
Modelos pre-entrenados: NVIDIA ha desarrollado una variedad de modelos de IA pre-entrenados que cubren diferentes dominios como lenguaje, visión, robótica y más. Los desarrolladores pueden integrar fácilmente estos modelos en sus aplicaciones sin tener que entrenarlos desde cero.
-
Optimizados para el rendimiento: Los NIMS están altamente optimizados para ejecutarse de manera eficiente en el hardware GPU de NVIDIA, aprovechando tecnologías como Tensor Cores y CUDA. Esto asegura un rendimiento de inferencia de baja latencia y alto rendimiento.
-
Implementación en contenedores: Los NIMS se empaquetan como contenedores, lo que facilita su implementación en entornos de nube, on-premises o edge. Los desarrolladores pueden simplemente extraer la imagen del contenedor y ejecutar el modelo de IA como un servicio.
-
Pila integrada: Los NIMS incluyen la pila de software completa necesaria para ejecutar los modelos de IA, incluido el entorno de ejecución de NVIDIA, los motores de inferencia y otras dependencias. Esto simplifica la implementación y reduce la carga para los desarrolladores.
-
Escalable y confiable: Los NIMS están diseñados para ser escalables, con soporte para inferencia distribuida en varios GPU. También incluyen funciones para alta disponibilidad y tolerancia a fallos para garantizar un funcionamiento confiable.
Al proporcionar estos microservicios de inferencia de IA, NVIDIA tiene como objetivo democratizar las capacidades avanzadas de IA y facilitar a los desarrolladores la incorporación de IA de vanguardia en sus aplicaciones. Esto ayuda a acelerar la adopción de IA en diversas industrias y casos de uso.
El Auge de los Humanos Digitales
El Auge de los Humanos Digitales
Los humanos digitales revolucionarán la industria desde el servicio al cliente hasta la publicidad y los juegos. Las posibilidades para los humanos digitales son infinitas. Utilizando tecnologías avanzadas de IA y gráficos por computadora, los humanos digitales pueden ver, entender e interactuar con nosotros de maneras similares a los humanos.
La base de los humanos digitales son los modelos de IA construidos sobre el reconocimiento y la síntesis de voz multilingüe, y los modelos de lenguaje a gran escala que entienden y generan conversación. Estos modelos de IA se conectan a otras IA generativas para animar dinámicamente un modelo 3D realista de un rostro, y modelos de IA que reproducen apariencias realistas que permiten el trazado de ruta en tiempo real para simular la forma en que la luz penetra la piel, se dispersa y sale en varios puntos, dando a la piel su apariencia suave y translúcida.
Nvidia Ace es un conjunto de tecnologías de humanos digitales empaquetadas como microservicios fáciles de implementar y totalmente optimizados. Los desarrolladores pueden integrar los Nims de Ace en sus marcos, motores y experiencias de humanos digitales existentes. Estos incluyen Nims de Neotron SLM y LLM para comprender la intención y orquestar otros modelos, Nims de voz Reva para discurso interactivo y traducción, y Nims de audio a rostro y gesto para animación facial y corporal. Los Nims de Ace se ejecutan en Nvidia GDN, una red global de infraestructura acelerada por Nvidia que brinda procesamiento de humanos digitales de baja latencia en más de 100 regiones.
Los humanos digitales tienen el potencial de ser excelentes agentes interactivos, haciendo que las interacciones sean mucho más atractivas y empáticas. A medida que la tecnología continúe avanzando, los humanos digitales verán una adopción generalizada en todas las industrias, revolucionando el servicio al cliente, la publicidad, los juegos y más.
La Evolución de la Arquitectura y la Infraestructura de IA
La Evolución de la Arquitectura y la Infraestructura de IA
Jensen Huang analiza los rápidos avances en la arquitectura y la infraestructura de IA, destacando hitos clave y direcciones futuras:
Escalado de centros de datos y transformadores
- El escalado de los centros de datos de Nvidia permitió el entrenamiento de grandes modelos Transformer en conjuntos de datos masivos a través del aprendizaje no supervisado.
- Esto permitió que los modelos de IA aprendan patrones y relaciones de los datos sin la necesidad de un etiquetado humano extensivo.
IA basada en la física
- La próxima generación de IA debe estar fundamentada en el mundo físico y comprender las leyes de la física.
- Esto se puede lograr a través del aprendizaje de videos, la simulación de datos sintéticos y los sistemas de IA que aprenden de la interacción entre sí.
Arquitectura GPU Blackwell
- Blackwell es la nueva arquitectura GPU de Nvidia diseñada para la era de la IA generativa.
- Las características clave incluyen:
- El chip más grande jamás fabricado, con dos chips conectados a 10 TB/s
- Motor Transformer de segunda generación para adaptación dinámica de precisión
- IA segura para proteger los modelos del robo o la manipulación
- NVLink de quinta generación para interconexión de GPU de alto ancho de banda
- Motor de confiabilidad y disponibilidad para mejorar el tiempo de actividad
- Motor de descompresión para un procesamiento de datos más rápido
Sistemas modulares DGX y MGX
- Los chips Blackwell se integran en los sistemas modulares DGX y MGX de Nvidia.
- Los sistemas DGX ofrecen configuraciones de refrigeración por aire, mientras que MGX ofrece opciones de refrigeración líquida.
- Estos sistemas se pueden escalar para conectar cientos de miles de GPU utilizando las tecnologías de redes avanzadas de Nvidia.
Innovaciones Ethernet para fábricas de IA
- Nvidia ha desarrollado mejoras en Ethernet para que sea adecuado para los patrones de comunicación ráfaga y de baja latencia requeridos en el entrenamiento de IA.
- Tecnologías como RDMA, control de congestión, enrutamiento adaptativo y aislamiento de ruido permiten que Ethernet se desempeñe al nivel de las redes especializadas de InfiniBand.
Hoja de ruta: Blackwell Ultra y plataformas Reuben
- Nvidia planea continuar con su ciclo anual de impulsar los límites de la tecnología con las plataformas Blackwell Ultra y Reuben.
- Estas generaciones futuras mantendrán la compatibilidad arquitectónica para aprovechar el creciente ecosistema de software.
Blackwell: La Arquitectura de GPU de Próxima Generación de NVIDIA
Blackwell: La Arquitectura de GPU de Próxima Generación de NVIDIA
Blackwell es la nueva arquitectura GPU de NVIDIA, diseñada para impulsar la próxima generación de IA y computación de alto rendimiento. Aquí se destacan los puntos clave:
Características clave de Blackwell:
-
Escala masiva: Los chips Blackwell son los chips más grandes jamás fabricados, con dos de los dados más grandes conectados entre sí mediante un enlace de 10 TB/s. Esto permite una potencia de cálculo sin precedentes.
-
Confiabilidad y disponibilidad: Blackwell incluye un motor de Confiabilidad y Disponibilidad (RAS) que puede probar cada transistor y elemento de memoria individual, mejorando el tiempo de actividad y la estabilidad para implementaciones a gran escala.
-
Adaptación dinámica de precisión: El motor Transformer de segunda generación de Blackwell puede adaptar dinámicamente la precisión de los cálculos en función del rango y la precisión requeridos, mejorando la eficiencia.
-
IA segura: Blackwell incluye características de seguridad basadas en hardware para proteger los modelos de IA del robo o la manipulación.
-
Motor de compresión: Blackwell tiene un motor de compresión de datos dedicado que puede extraer datos del almacenamiento 20 veces más rápido que antes, mejorando el rendimiento de los datos.
Mejoras de rendimiento
- Blackwell ofrece un aumento masivo en el rendimiento de IA, con una mejora de hasta 45 veces con respecto a la generación anterior.
- La energía requerida para entrenar un modelo de 2 billones de parámetros y 8 billones de tokens se ha reducido en 350 veces en comparación con la generación anterior.
- El rendimiento de generación de tokens se ha mejorado en 45,000 veces, reduciendo la energía por token de 177,000 julios a solo 0.4 julios.
Arquitecturas escalables
- Los chips Blackwell se combinan en poderosos sistemas DGX, con hasta 72 GPU conectadas utilizando el avanzado interconector MV-Link de NVIDIA.
- NVIDIA también está desarrollando nuevos conmutadores Ethernet de alta velocidad, llamados Spectrum, para permitir un escalado sin problemas a decenas de miles de GPU y más.
En general, Blackwell representa un gran avance en la arquitectura GPU, permitiendo un rendimiento, eficiencia y escalabilidad sin precedentes para la próxima generación de aplicaciones de IA y computación de alto rendimiento.
Inteligencia Artificial Física: Robots Impulsados por el Omniverse de NVIDIA
Inteligencia Artificial Física: Robots Impulsados por el Omniverse de NVIDIA
La era de la robótica ha llegado. Investigadores y empresas de todo el mundo están desarrollando robots impulsados por IA física: modelos que pueden entender instrucciones y realizar de manera autónoma tareas complejas en el mundo real.
Los avances clave que permiten esto incluyen:
-
Modelos de lenguaje a gran escala (LLM) multimodales: Los avances en los LLM multimodales permiten a los robots aprender, percibir y comprender el mundo que los rodea, y planificar cómo actuar.
-
Aprendizaje por refuerzo a partir de demostraciones: Los robots
Preguntas más frecuentes
Preguntas más frecuentes