Se espera que el procesador Hisilicon Ascend 910d AI de la próxima generación de Huawei ofrezca un mejor rendimiento que el H100 de NVIDIA, informa Reuters. El nuevo procesador será más lento en una base de chip vs chip en comparación con las GPU Blackwell B200 de NVIDIA y Blackwell Ultra B300, no importa las GPU de Rubin de próxima generación programadas para lanzar el próximo año. Sin embargo, el enfoque de Huawei de construir cápsulas con cientos de procesadores debería permitir que el Ascend 910d compite contra las cápsulas basadas en las GPU de Blackwell y las próximas Rubin de NVIDIA.
Huawei se está preparando para comenzar las pruebas de su procesador de inteligencia artificial más avanzado, el Ascend 910d, con el objetivo de rendimiento de superar el H100 de NVIDIA y ofrecer una alternativa nacional en medio de restricciones de exportación estadounidenses. Según las fuentes, Huawei se ha acercado a varias compañías locales para evaluar si el nuevo chip ASCEND 910D cumple con los requisitos de rendimiento y despliegue. Se esperan muestras iniciales a fines de mayo.
Por separado, Huawei planea iniciar envíos a gran escala de sus procesadores AI 910C de Dual Chiplet ASCEND a los clientes chinos (y probablemente sistemas completos basados en los chips) a principios del próximo mes. Según los informes, la mayoría de estos procesadores fueron producidos por TSMC para una empresa de terceros. Queda por ver si el SMIC ascendente 910d será realizado por China, o si, casi cinco años después de que el gobierno de los Estados Unidos restringiera el acceso de Huawei a las capacidades de producción de semiconductores de vanguardia, Huawei una vez más encontrará una manera de eludir las sanciones de los Estados Unidos.
Llegar a los niveles de rendimiento de NVIDIA H100 no será fácil para Huawei. El último Ascend 910C de doble chiplete de la compañía ofrece alrededor de 780 BF16 TFLOPS de rendimiento, mientras que el H100 de NVIDIA puede entregar alrededor de 2,000 TFLOP BF16. Para lograr los niveles de rendimiento de H100, Huawei tendrá que rediseñar la arquitectura interna del Ascend 910d y posiblemente aumentar el número de chiplets de cómputo.
Para mantenerse competitivo en la industria de la IA el próximo año, Huawei tendrá que lograr un rendimiento comparable al de los grupos de IA desarrollados en los EE. UU. Este año, la compañía introdujo su sistema CloudMatrix 384 con 384 procesadores Ascend 910C. Según los informes, puede superar el GB200 NVL72 de NVIDIA en ciertas cargas de trabajo, pero a costa de un consumo de energía significativamente mayor debido al rendimiento por vatio dramáticamente más bajo. También tiene más de cinco veces más ‘procesadores AI’ que un estante NVL72. Queda por ver si la interconexión puede escalar bien al número requerido de procesadores.
Sin acceso a tecnologías de proceso de vanguardia, será significativamente más difícil para Huawei mantener posiciones competitivas el próximo año. NVIDIA está en la pista para introducir sus GPU de Rubin con nombre en código para AI y HPC en 2026. Las GPU de Rubin se realizarán en el proceso de fabricación N3 (o más avanzado) de TSMC, y deberían ofrecer un rendimiento aún más alto por vatio que la GPU de Blackwell de generación actual.
Las GPU de Rubin están programados para ofrecer alrededor de 8.300 TFLOPS de rendimiento de entrenamiento FP8, y presumiblemente la mitad de BF16, aproximadamente el doble del rendimiento del B200. Los sistemas CloudMatrix ASCEND 910D y de próxima generación de Huawei con 384 de tales procesadores podrían ofrecer teóricamente un rendimiento de IA competitivo en el nivel del bastidor. Sin embargo, queda por ver qué beneficios de rendimiento, Ascend 910d y las GPU de Rubin de NVIDIA ofrecerán en comparación con las ofertas existentes. Además, debe tenerse en cuenta que Nvidia apenas podrá vender sus GPU de Rubin de alto rendimiento en China, por lo que para ese mercado, Huawei realmente no tendrá un competidor directo.
Independientemente del rendimiento o la eficiencia, los procesadores Ascend 910D de Huawei probablemente se convertirán en los caballos de batalla de China cuando se trata de capacitación de IA en los próximos años. Dada la importancia estratégica de la IA, el consumo de energía del Ascend 910d (o cualquier otro procesador de IA doméstico) no será un factor limitante, ya que el número de unidades desplegadas podría compensar la eficiencia de los procesadores de IA de NVIDIA (o AMD, Intel, Broadcom, etc.). El principal factor limitante para China será su capacidad para producir suficientes procesadores, ya sea a nivel nacional o en el extranjero utilizando compañías proxy.