国产显卡性能实现飞跃摩尔线程S5000经优化后AI运算速度达到NVIDIAH100的60%

2026-02-11 17:17:07admin

劳动力管理云
劳动力管理云 V25.9.1 系统工具|177.9MB
查看

前不久,国产GPU领域的初创企业摩尔线程成功上市,其市值曾一度攀升至4000多亿元。就在今天,该公司又推出了全新一代的GPU架构,其AI性能与游戏性能均实现了大幅提升,特别是游戏性能,较之前飙升了15倍之多。

即便在当下的显卡世代里,摩尔线程仍在持续携手合作伙伴推进优化工作。硅基流动今日发布消息称,其在S5000显卡上达成了国产GPU推理性能的突破性提升。

根据实测数据,在经过系统级工程优化与FP8精度加速后,摩尔线程MTT S5000单卡的Prefill吞吐能够达到4000 tokens/s以上,Decode吞吐则超过了1000 tokens/s。

这是什么概念呢?他们拿NVIDIA的H100显卡做了对比,在相同场景的Prefill阶段,H100的性能大概是每秒6500 tokens;而在MTT S5000上,实测吞吐达到了每秒4000多tokens,相当于实现了NVIDIA H100超过61%的实测性能。

虽然目前展现的只是Prefill阶段的性能,但S5000能达到H100显卡60%以上的性能表现,绝对称得上是国产显卡发展中的一大进步。

MTT S5000是摩尔线程依托平湖GPU架构打造的AI显卡,这是其首次实现对FP8的支持,性能表现可达1024TFLOPS;相比之下,H100在FP8模式下的性能则接近4000TFLOPS。

关于硅基流动与摩尔线程对S5000显卡的优化细节,可查阅双方的官方稿件。这一案例表明,国产显卡虽在参数层面仍存在一定差距,但凭借工程优化手段,性能表现能持续提升,部分领域甚至能带来超出预期的突破。

摩尔线程目前的短板,除了硬件规模有限、工艺水平受限等因素外,软件生态自然也难以与NVIDIA相提并论。不过,随着国内厂商的携手合作,这一局面已在逐步改变。未来几年,若硬件规模持续扩大、软件生态不断完善,无论是AI领域还是游戏显卡领域,其推出能让NVIDIA感受到竞争压力的产品,也并非没有可能。