国产显卡性能实现飞跃摩尔线程S5000经优化后AI运算速度达到NVIDIAH100的60%

2026-02-11 17:17:07admin

e刻英语 V1.1.2 商务办公|31.5MB

查看

前不久，国产GPU领域的初创企业摩尔线程成功上市，其市值曾一度攀升至4000多亿元。就在今天，该公司又推出了全新一代的GPU架构，其AI性能与游戏性能均实现了大幅提升，特别是游戏性能，较之前飙升了15倍之多。

即便在当下的显卡世代里，摩尔线程仍在持续携手合作伙伴推进优化工作。硅基流动今日发布消息称，其在S5000显卡上达成了国产GPU推理性能的突破性提升。

根据实测数据，在经过系统级工程优化与FP8精度加速后，摩尔线程MTT S5000单卡的Prefill吞吐能够达到4000 tokens/s以上，Decode吞吐则超过了1000 tokens/s。

这是什么概念呢？他们拿NVIDIA的H100显卡做了对比，在相同场景的Prefill阶段，H100的性能大概是每秒6500 tokens；而在MTT S5000上，实测吞吐达到了每秒4000多tokens，相当于实现了NVIDIA H100超过61%的实测性能。

虽然目前展现的只是Prefill阶段的性能，但S5000能达到H100显卡60%以上的性能表现，绝对称得上是国产显卡发展中的一大进步。

MTT S5000是摩尔线程依托平湖GPU架构打造的AI显卡，这是其首次实现对FP8的支持，性能表现可达1024TFLOPS；相比之下，H100在FP8模式下的性能则接近4000TFLOPS。

关于硅基流动与摩尔线程对S5000显卡的优化细节，可查阅双方的官方稿件。这一案例表明，国产显卡虽在参数层面仍存在一定差距，但凭借工程优化手段，性能表现能持续提升，部分领域甚至能带来超出预期的突破。

摩尔线程目前的短板，除了硬件规模有限、工艺水平受限等因素外，软件生态自然也难以与NVIDIA相提并论。不过，随着国内厂商的携手合作，这一局面已在逐步改变。未来几年，若硬件规模持续扩大、软件生态不断完善，无论是AI领域还是游戏显卡领域，其推出能让NVIDIA感受到竞争压力的产品，也并非没有可能。