NVIDIA Blackwell Ultra AI Factory abre el camino para la era del razonamiento con IA

Crédito: @nvidiadc.
NVIDIA anuncia la próxima evolución de la plataforma de fábrica de IA de NVIDIA Blackwell, Blackwell Ultra, que está abriendo el camino para la era del razonamiento de la IA.
NVIDIA Blackwell Ultra mejora la inferencia de escalamiento en tiempo de prueba y entrenamiento (el arte de aplicar más cómputo durante la inferencia para mejorar la precisión) para permitir que las organizaciones de todo el mundo aceleren aplicaciones como el razonamiento de IA, los agentes de IA y la IA física.
“La IA ha dado un salto de gigante: el razonamiento y la IA de agentes exigen un mejor desempeño de la computación de órdenes de magnitud”, dice Jensen Huang, fundador y CEO de NVIDIA. “Diseñamos Blackwell Ultra para este momento: es una plataforma única y versátil que permite realizar inferencias de IA de forma fácil y eficiente, tanto antes como después del entrenamiento, así como con razonamiento”.
Basado en la innovadora arquitectura Blackwell, presentada hace un año, Blackwell Ultra incluye la solución a escala de rack NVIDIA GB300 NVL72 y el sistema NVIDIA HGX B300 NVL16. El GB300 NVL72 ofrece 1,5 veces más rendimiento de IA que el NVIDIA GB200 NVL72, además de multiplicar por 50 las oportunidades de negocio de Blackwell para las fábricas de IA, en comparación con las desarrolladas con NVIDIA Hopper.
Blackwell Ultra permite el razonamiento de la IA
NVIDIA GB300 NVL72 conecta 72 GPU Blackwell Ultra y 36 CPU NVIDIA Grace basadas en Arm Neoverse en un diseño a escala de bastidor, que actúa como una sola GPU enorme creada para el escalado en el tiempo de prueba. Con NVIDIA GB300 NVL72, los modelos de IA pueden acceder a la mayor capacidad de computación de la plataforma para explorar diferentes soluciones a los problemas y desglosar las solicitudes complejas en múltiples pasos, lo que resulta en respuestas de mayor calidad.
“El mercado es cada vez más exigente con la IA, ya que las nuevas tecnologías y herramientas, como los agentes de IA, requieren cada vez más capacidad de procesamiento, y Blackwell Ultra es la respuesta de NVIDIA a esta demanda. Queremos que la IA siga transformando el mundo, alcanzando nuevas cotas de innovación y avance”, afirma Marcio Aguiar, director de la división Enterprise de NVIDIA para Latinoamérica.
Se espera que GB300 NVL72 también esté disponible en NVIDIA DGX Cloud , una plataforma de IA integral y totalmente gestionada en nubes líderes que optimiza el rendimiento con software, servicios y experiencia en IA para cargas de trabajo en constante evolución. NVIDIA DGX SuperPOD con sistemas DGX GB300 utiliza el diseño de rack GB300 NVL72 para ofrecer a los clientes una fábrica de IA lista para usar.
Además, la plataforma Blackwell Ultra es ideal para aplicaciones que incluyen:
- Agentes de IA, que usan un razonamiento sofisticado y planificación iterativa para resolver de forma autónoma problemas complejos de múltiples pasos. Los sistemas de agentes de IA no se limitan a seguir instrucciones. Pueden razonar, planificar y tomar acciones para lograr objetivos específicos.
- IA física, que permite a las empresas generar videos sintéticos y fotorrealistas en tiempo real para el entrenamiento de aplicaciones como la robótica y los vehículos autónomos a escala.
La placa base NVIDIA HGX B300 NVL16 cuenta con siete veces más computación y cuatro veces más memoria en comparación con la generación Hopper, para ofrecer un desempeño innovador para las cargas de trabajo más complejas, como la del razonamiento de la IA.
Infraestructura de escalabilidad de NVIDIA para un desempeño óptimo
Las redes de escalabilidad avanzadas son un componente crítico de la infraestructura de la IA que puede ofrecer el máximo desempeño al mismo tiempo que reduce la latencia y la fluctuación.
Los sistemas Blackwell Ultra se integran sin problemas con las plataformas del NVIDIA Spectrum-X Ethernet y NVIDIA Quantum-X800 InfiniBand, con 800 Gb/s de rendimiento de datos, disponibles para cada GPU del sistema, a través de una SuperNIC NVIDIA ConnectX®-8. Esto ofrece capacidades de acceso directo a la memoria remota, para permitir que las fábricas de IA y los data centers en la cloud gestionen los modelos de razonamiento de la IA sin cuellos de botella.
Las DPUs NVIDIA BlueField®-3, que también se encuentran en los sistemas Blackwell Ultra, habilitan las redes de múltiples usuarios, la elasticidad de la computación de GPU, el acceso acelerado a los datos y la detección de amenazas de ciberseguridad en tiempo real.
Líderes de tecnología globales adoptan Blackwell Ultra
Se espera que los productos basados en Blackwell Ultra estén disponibles a través de los principales fabricantes de computadoras y proveedores de servicios en la cloud a partir de finales de este año.
Se espera que Cisco, Dell Technologies, Hewlett Packard Enterprise, Lenovo y Supermicro ofrezcan una amplia gama de servidores basados en los productos Blackwell Ultra, además de Aivres, ASRock Rack, ASUS, Foxconn, GIGABYTE, Inventec, Pegatron, Quanta Cloud Technology (QCT), Wistron y Wiwynn.
Los proveedores de servicios en la cloud Amazon Web Services, Google Cloud, Microsoft Azure y Oracle Cloud Infrastructure, y los proveedores de cloud de GPU CoreWeave, Crusoe, Lambda, Nebius, Nscale, Yotta y YTL estarán entre los primeros en ofrecer instancias impulsadas por Blackwell Ultra.
Las innovaciones de software de NVIDIA reducen los cuellos de botella de la IA
Toda la cartera de productos Blackwell es compatible con la plataforma de IA de NVIDIA de pila completa. El framework de inferencia de código abierto NVIDIA Dynamo, escala los servicios de IA de razonamiento y ofrece saltos en el rendimiento a la vez que reduce los tiempos de respuesta y los costos de servicio del modelo al proporcionar la solución más eficiente para escalar la computación en el tiempo de prueba.
NVIDIA Dynamo es un nuevo software de servicio de inferencia de IA diseñado para maximizar la generación de ingresos por tokens para fábricas de IA que implementan modelos de IA de razonamiento. Orquesta y acelera la comunicación de inferencia en miles de GPU y usa el servicio desagregado para separar las fases de procesamiento y generación de grandes modelos de lenguaje en diferentes GPU. Esto permite la optimización de cada fase de forma independiente para sus necesidades específicas y garantiza la máxima utilización de los recursos de GPU.
Los sistemas Blackwell son ideales para ejecutar los nuevos modelos NVIDIA Llama Nemotron Reason y el Blueprint NVIDIA AI-Q, compatibles con la plataforma de software NVIDIA AI Enterprise para la IA de nivel de producción. NVIDIA AI Enterprise incluye los microservicios NVIDIA NIM, así como frameworks de IA, bibliotecas y herramientas que las empresas pueden implementar en clouds, data centers y workstations acelerados por NVIDIA.
La plataforma Blackwell se basa en el ecosistema de potentes herramientas de desarrollo de NVIDIA, las bibliotecas NVIDIA CUDA-X, más de 6 millones de desarrolladores y más de 4,000 aplicaciones que escalan el desempeño en miles de GPU.
Leave a reply
Lo siento, debes estar conectado para publicar un comentario.