
近期,科技媒体对浪潮NF5468A5服务器进行了一系列专业测评,报告显示这款GPU服务器在典型的AI计算场景拥有超乎预期的卓越性能,在MLPerfTraining、MLPerfInference、Alphafold2、NAMD、HPL、Stream等各种典型应用评测中展示出了让人惊叹的领先性能,因而被媒体称赞为“算力猛兽”。浪潮信息官网显示,NF5468A5正在进行“超值机型限免试用”活动,对算力有强大需求的用户都可以免费申请。
NF5468A5是浪潮信息推出的一款面向AI训练、AI推理、HPC、视频处理等多种应用场景的GPU服务器,在4U空间内搭载2颗AMDEPYC处理器,支持多达8张双宽加速卡,巧妙的分区散热设计有效实现CPU与GPU模组的分流,同时通过PCIE4.0直连有效降低CPU和GPU间的通信延迟。该服务器支持高达8T的DDR4内存、409.6GB/s的内存总带宽,并且提供了8个全高全长双宽PCIex16的物理插槽。其强劲的处理器性能、巨大的内存容量和带宽、丰富的IO扩展,特别适合AI计算、云计算、HPC以及企业各类业务的工作负载。
媒体对NF5468A5进行了一系列测评。其中HPL测试结果表明,NF5468A5搭载2颗AMDEPYC 7543处理器,浮点计算速度为2.69TFLOPS,根据AMD平台理论浮点计算速度,处理器计算效率达到93.74%。在STREAM测试中,由于采用多线程并行,实测结果内存带宽373GB/s,对比平台内存理论带宽,实测内存带宽效率同样达到惊人的91.1%。
NF5468A5HPL测试结果
NF5468A5内存带宽测试结果
在AI训练性能测试中,浪潮NF5468A5搭配8张NVIDIAA100 PCIE 40GB GPU,使用MLPerfTrainingV1.0代码训练卷积神经网络ResNet50,每秒处理的图片数量可以达到21486张,单台机器35分钟即可完成Resnet50模型训练。参考最近几期MLPerf训练榜单,搭载8张NVIDIAA100 40GGPU卡的服务器的
ResNet50训练测试结果
在AI推理性能测试中,搭载1张NVIDIATesla T4 GPU的NF5468A5,使用MLPerfInferenceV1.0代码,ResNet50测试结果为每秒处理5671.9张图片,这份成绩也是非常出色的。同时,NF5468A5能够很好地支持寒武纪MLU270-S4推理加速卡,Caffe框架下的ResNet18计算性能每秒超过7000张图片。
ResNet50推理测试结果
同时,媒体还对浪潮信息自研的专用加速器M10A进行了性能测试,结果表明,浪潮NF5468A5搭配1张M10A,可实现480fps1080P视频的流畅转码,一张M10A的视频处理能力相当于一台双路服务器的性能。此外,NF5468A5搭载1张RTX3090显卡,ETHASH算法性能突破100MH/s。
M10A视频转码性能测试结果
浪潮NF5468A5+单卡RTX3090HASH算法测试结果
算法
ETHASH
ETCHASH
AUTOLYKOS2
BLAKE3
MTP
MTP-TCR
OCTOPUS
性能
108MH/s
108MH/s
232MH/s
2.44GH/s
7.23MH/s
28.78MH/s
103.07MH/s
算法
KAWPOW
PROGPOW
PROGPOW-VEIL
PROGPOW-VERIBLOCK
PROGPOWZ
FIROPOW
/
性能
55MH/s
54.4MH/s
54.85MH/s
27.31MH/s
54.37MH/s
54.91MH/s
/
NF5468A5在HPC应用性能方面同样有非常
WRF在不同AMD处理器上的性能对比
OpenFOAM motorbike算例在不同AMD处理器上的性能对比
在
NF5468A5+单张A100预测得到的AlphaFold2top1模型计算性能
NAMD在NF5468A5平台的测试结果
通过多次不同配置、不同场景的深度评测,媒体认为浪潮NF5468A5是一款性能强大、应用场景广泛的GPU服务器。该服务器硬件设计合理,可
目前,据浪潮官网显示NF5468A5正在推出“超值机型限免试用”活动,感兴趣的用户不妨申请,一试究竟。点击“阅读原文”即可报名参与。