昇腾解决方案-训练

昇腾解决方案-训练

大模型训练解决方案

华为昇腾大模型训练解决方案支持运营商构建一个基于昇腾AI处理器进行AI模型训练任务的软硬件平台,支持预训练、SFT微调、后训练、蒸馏等全场景开发,并支持PyTorch、MindSpore、TensorFlow等主流开源的AI开发框架,提供全流程开发工具、开发套件、基础功能库和集群能力,满足大规模分布式训练场景,具备灵活、稳定、易用和高性能等特点,帮助用户更高效地训练和迁移模型。

架构图

相关产品

Atlas 800T A2 451 Atlas 800T A2 670

Atlas 800T A2训练服务器

Atlas 800T A2训练服务器具有更高算力密度、极致能效比与高速网络带宽等特点。该服务器广泛应用于深度学习模型开发和训练。该服务器为4U高度、风冷散热、4*鲲鹏920 CPU、32个DDR4内存插槽。

Atlas 900 A2 PoD 451 Atlas 900 A2 PoD 670

Atlas 900 A2 PoD

Atlas 900 A2 PoD 集群基础单元,具有极致算力密度、极高AI能效、极简交付部署等特点。该基础单元广泛应用于深度学习模型开发和训练。该基础单元为47U高度、全液冷散热、最大50.5kW功率。