全国直销电话:4006-854-568
IT-technology
以人为本,众志成城,以“用户至上”.“服务上乘”为原则,
追求产品和服务高质量,努力实现与客户之间真诚有效的沟通,
不断地圆梦、奔跑与腾飞。
新闻动态   NEWS
【转载】主流CPU性能比较(Hygon7280、Intel、AMD、鲲鹏920、飞腾2500) -北京赛维博信科技发展有限公司
来源:本人摘自网络,如有侵权请联系删除 | 作者:毛豆 | 发布时间: 2024-06-17 | 5277 次浏览 | 分享到:

下图列出了三款处理器的功能部件操作延迟数据,使用的命令是./lat_ops。

龙芯stream数据

LMbench  包含了 STREAM 带宽测试工具,可以用来测试可持续的内存访问带宽情况。图表12.25列 出了三款处理器的 STREAM 带宽数据,其中  STREAM 数组大小设置为 1 亿个元素,采用 OpenMP 版本 同时运行四个线程来测试满载带宽;相应测试平台均为 CPU  的两个内存控制器各接一根内存条, 3A5000 和 Zen1 用 DDR4 3200 内存条,Skylake 用 DDR4 2400  内存条(它最高只支持这个规格)。

从数据可以看到,虽然硬件上  3A5000 和 Zen1 都实现了 DDR4 3200,但 3A5000 的实测可持续带宽  还是有一定差距。用户程序看到的内存带宽不仅仅和内存的物理频率有关系,也和处理器内部的  各种访存队列、内存控制器的调度策略、预取器和内存时序参数设置等相关,需要进行更多分析 来定位具体的瓶颈点。像 STREAM  这样的软件测试工具,能够更好地反映某个子系统的综合能力, 因而被广泛采用。

对比结论

  • AMD单核跑分数据比较好

  • MySQL 查询场景下Intel的性能好很多

  • xdb比社区版性能要好

  • MySQL8.0比5.7在多核锁竞争场景下性能要好

  • intel最好,AMD接近Intel,海光差的比较远但是又比鲲鹏好很多,飞腾最差,尤其是跨socket简直是灾难

  • 麒麟OS性能也比CentOS略差一些

  • 从perf指标来看 鲲鹏920的L1d命中率高于8163是因为鲲鹏L1 size大;L2命中率低于8163,同样是因为鲲鹏 L2 size小;同样L1i 鲲鹏也大于8163,但是实际跑起来L1i Miss Rate更高,这说明 ARM对 L1d 使用效率低

整体来说AMD用领先了一代的工艺(7nm VS 14nm),在MySQL查询场景中终于可以接近Intel了,但是海光、鲲鹏、飞腾还是不给力。

附表

鲲鹏920 和 8163 在 MySQL 场景下的 perf 指标对比

整体对比


指标X86ARM增加幅度
IPC0.49790.495-0.6%
Branchs23760641477241597989498575.1%
Branch-misses810424762028983836845257.6%
Branch-missed rate0.0340.070104.3%
内存读带宽(GB/S)25.025.0-0.2%
内存写带宽(GB/S)24.667.8175.5%
内存读写带宽(GB/S)49.792.886.8%
UNALIGNED_ACCESS132914664513686011901929.7%
L1d_MISS_RATIO0.060550.04281-29.3%
L1d_MISS_RATE0.016450.017114.0%
L2_MISS_RATIO0.348240.4716235.4%
L2_MISS_RATE0.005770.03493504.8%
L1_ITLB_MISS_RATE0.00280.00578.6%
L1_DTLB_MISS_RATE0.00250.0102308.0%
context-switchs84071951161498138.2%
Pagefault228371741189224.6%

 

服务热线

1391-024-6332