摩尔线程MTTS5000参数：80GB显存单卡算力1千万亿次

恒谦游戏小东 ⋅ 02-25 ⋅ 15 阅读 ⋅ 游戏攻略

本文摘要： 2月12日消息，智谱发布新一代大模型GLM-5之后，摩尔线程立即宣布，在旗舰级AI训推一体全功能GPUMTTS5000上完成了Day-0全流程适配与验证，第一时间提供支持。它早在2024年就已经低调推出，但是具体造型、参数、性能一直没有对外公开，非常神秘。

2月12日消息，智谱发布新一代大模型GLM-5之后，摩尔线程立即宣布，在旗舰级AI训推一体全功能GPU MTT S5000上完成了Day-0全流程适配与验证，第一时间提供支持。

它早在2024年就已经低调推出，但是具体造型、参数、性能一直没有对外公开，非常神秘。

这次在宣布适配GLM-5的同时，摩尔线程首次公布了MTT S5000的部分参数和性能，非常惊喜!

它完整支持从FP8到FP64的全精度计算，而且是国内最早原生支持FP8精度的训练GPU之一，配置了硬件级FP8 Tensor Core加速单元。

MTT S5000的单卡FP8 AI算力最高可达1000 TFLOPS，首次达到PFLOPS级别，也就是每秒1千万亿次计算。

据业内人士称，MTT S5000实测性能可以对标NVIDIA H100，尤其是在多模态大模型微调任务中，部分性能更是超越H100，甚至开始接近最新的Blackwell架构。

另据互联网厂商的场景实测，MTT S5000在典型端到端推理及训练任务中，性能可以达到NVIDIA H20的2.5倍左右。

摩尔线程MTTS5000参数：80GB显存单卡算力1千万亿次

目前，基于MTT S5000的夸娥万卡集群已经落地，浮点运算能力达到10Flops(每秒1千亿亿次计算)，在Dense稠密模型训练中MFU达到60%，在MoE专家模型中维持在40%左右，有效训练时间占比超过90%，训练线性扩展效率达95%。

值得一提的是，MTT S5000在集群通信层面采用独创的ACE技术，将复杂通信任务从计算核心卸载，大幅提升模型算力利用率(MFU)。

MTT S5000在推理场景同样表现优异，比如在2025年12月，摩尔线程联合硅基流动基于MTT S5000完成了对DeepSeek-V3 671B满血版的深度适配与性能测试。

实测单卡Prefill吞吐超过4000 tokens/s，Decode吞吐超过1000 tokens/s，刷新了国产GPU的推理纪录。

- THE END -

评论（共 1 条评论，15人围观）

陈军：

2026-02-13

困扰我好久的游戏操作问题，摩尔线程MTTS5000参数：80GB显存单卡算力1千万亿次帮我彻底搞定，感谢！

摩尔线程MTTS5000参数：80GB显存 单卡算力1千万亿次