#1: 作者: Slowking, 时间: 2026-3-05 09:08
华为 Atlas 950 是华为在 MWC 2026(巴塞罗那世界移动通信大会)上正式亮相的新一代 AI 智算超节点(SuperPoD)。
它是华为应对万亿级参数大模型和智能体(Agentic AI)时代推出的核心算力基础设施,旨在通过“系统级创新”打破单芯片性能受限的瓶颈,直接对标英伟达(NVIDIA)的最顶级机架系统(如 GB300 或 Vera Rubin 系列)。
以下是 Atlas 950 的核心亮点:
1. 核心架构:从“堆卡”到“超级计算机”
Atlas 950 不再是简单的服务器堆叠,而是通过华为自研的 “灵衢”(UnifiedBus)2.0 互联协议,将数千张芯片整合成一台逻辑上的超级计算机。
* 规模上限:单节点最大支持 8,192 张 昇腾 NPU 卡高速互联。
* 统一内存:具备 1,152 TB 的统一编址内存(HiZQ 2.0 技术),让数据在万亿参数模型训练时无需频繁“搬家”,实现就地计算。
* 超高带宽:系统总互联带宽高达 16.3 PB/s,互联延迟缩短至微秒级。
2. 算力表现
根据华为在 MWC 2026 公布的数据,Atlas 950 在系统级表现上非常强悍:
* 算力峰值:整套系统(由 160 个机柜组成)可提供约 8 EFLOPS 的 FP8 算力和 16 EFLOPS 的 FP4 算力。
* 对比优势:在特定大规模训练场景下,其算力规模和内存容量相比英伟达 NVL144 集群有显著的倍数领先。
3. 技术指标参考
| 特性 | 规格/描述 |
|---|---|
| 互联协议 | 灵衢(UnifiedBus)2.0 |
| 最大规模 | 8,192 卡(单柜通常为 64 卡基本单元) |
| 内存容量 | 1,152 TB (统一编址) |
| 数据格式 | 支持 FP16, BF16, FP8, MXFP4, HiF4 等 |
| 应用场景 | 万亿级大模型训练、海量高并发推理、Agentic AI 基础设施 |
4. 为什么 Atlas 950 很重要?
* 自主可控的突围:在先进工艺受限的情况下,华为通过液冷、光互联和内存池化等“系统级创新”,用成熟工艺的芯片组合出了超越顶尖单芯片集群的系统性能。
* 软件生态开源:配套的 CANN 异构计算架构 已全面开源,支持 Triton、PyTorch、vLLM 等主流框架,极大降低了从英伟达生态迁移的难度。
* 面向未来:它不仅支持当前的生成式 AI,更针对上下文长度从 K 级跃升至 M 级(百万级)的智能体应用做了深度优化。
了解 Atlas 950 在具体大模型(如 DeepSeek 或盘古)上的训练表现
#2: 作者: 本坛第一毒舌, 时间: 2026-3-05 11:07
是骡子是马,拉出来遛遛,纸面数据没卵用
#3: 作者: optimas, 时间: 2026-3-12 15:22
华为 Atlas 950 ?也就那些大厂才玩得转,小厂别做梦。
output generated using printer-friendly topic mod, 所有的时间均为 美国太平洋时间