- AWS construyó el enfriamiento NVIDIA personalizado después de rechazar las soluciones líquidas existentes para la escala
- IRHX se ajusta a los bastidores de AWS sin cambios en la infraestructura existente
- Amazon podría extender este enfoque de enfriamiento a los chips de gravitón en el futuro
Amazon Web Services (AWS) ha introducido un sistema de enfriamiento patentado creado para manejar las demandas de las GPU más nuevas de Nvidia.
El intercambiador de calor en la fila, o IRHX, se desarrolló en respuesta a los crecientes requisitos de potencia y calor del hardware como el NVIDIA GB200 NVL72.
AWS evaluó las soluciones existentes de enfriamiento de líquidos, pero descubrió que no satisfacían las necesidades de la compañía.
AWS Graviton Siguiente?
“Tomarían demasiado espacio en el centro de datos, aún requerirían modificaciones importantes para los centros de datos, o aumentarían sustancialmente el uso de agua”, dijo Dave Brown, vicepresidente de cómputo y ML en AWS, en una presentación publicada en YouTube, que puede ver a continuación.
“Y aunque algunas de estas soluciones podrían funcionar para volúmenes más bajos en otros proveedores, simplemente no serían suficiente capacidad de enfriamiento líquido para apoyar nuestra escala”.
El sistema IRHX consiste en una unidad de bombeo, un gabinete de distribución de agua y bobinas de ventilador.
El líquido enfría las chips a través de una placa fría conjuntamente diseñada por AWS y Nvidia, luego vuelve a recorrer el IRHX, donde se enfría y se libera.
“Con el IRHX no necesitamos diseñar el centro de datos alrededor del estante”, dijo Brown.
El sistema admite la instancia de EC2 más potente de AWS, el P6E Ultraserver, que incluye el GB200 NVL72. Esta configuración a escala de bastidor permite que 72 GPU de Blackwell funcionen juntas como una sola unidad.
Brown dijo que el GB200 NVL72 “permite que 72 GPU NVIDIA Blackwell actúen como una sola GPU masiva”.
Amazon ha construido previamente hardware personalizado, incluidos chips y sistemas de redes. El IRHX extiende esa estrategia al enfriamiento, lo que permite a AWS implementar nuevos bastidores de GPU sin rediseñar sus instalaciones.
La compañía dijo que el sistema se ajusta a las dimensiones e infraestructura del bastidor existente, lo que lo hace escalable en los centros de datos globales.
Si bien IRHX se combina actualmente con los sistemas con sede en Blackwell de NVIDIA, es probable que se use con los propios chips de Graviton de Amazon si sus necesidades de enfriamiento aumentan.
Por ahora, el sistema está alimentando cargas de trabajo de IA que exigen tanto la escala como la velocidad.

Atender