昇腾解决方案-推理

昇腾解决方案-推理

大模型推理解决方案

华为昇腾大规模专家并行(大EP)集群推理解决方案,支撑运营商构建大模型中心推理场景,基于昇腾AI基础软硬件打造,深度适配DeepSeek以及业界主流MoE大模型,全面使能AI大模型应用深入千行百业。

架构图

相关产品

ascend inference a2 451 ascend inference a2 670

Atlas 800I A2推理服务器

Atlas 800I A2 推理服务器采用8模组高效推理方式,提供强劲 AI 推理能力,在算力、内存带宽和互联能力方面具有优势,可广泛应用于生成式大模型推理。该服务器为4U高度、风冷散热、4*鲲鹏920 CPU、32个DDR4内存插槽。