全国直销电话:4006-854-568
IT-technology
以人为本,众志成城,以“用户至上”.“服务上乘”为原则,
追求产品和服务高质量,努力实现与客户之间真诚有效的沟通,
不断地圆梦、奔跑与腾飞。
新闻动态   NEWS
【转载】主流CPU性能比较(Hygon7280、Intel、AMD、鲲鹏920、飞腾2500) -北京赛维博信科技发展有限公司
来源:本人摘自网络,如有侵权请联系删除 | 作者:毛豆 | 发布时间: 2024-06-17 | 5276 次浏览 | 分享到:

测试命令:

1 for i in $(seq 0 8 127); do echo core:$i; numactl -C $i -m 0 ./bin/lat_mem_rd -W 5 -N 5 -t 64M; done >lat.log 2>&1

测试结果和numactl -H 看到的node distance完全一致,芯片厂家应该就是这样测试然后把这个延迟当做距离写进去了

AMD EPYC 7T83(4 numa node)的时延相对抖动有点大,这和架构多个小Die合并成一块CPU有关。

1 grep -E "core|64.00000" lat.log 2 core:0 3 64.00000 71.656 4 core:32 5 64.00000 80.129 6 core:64 7 64.00000 131.334 8 core:88 9 64.00000 136.774 10 core:96 11 64.00000 129.563 12 core:120 13 64.00000 140.151




AMD EPYC 7T83(4 numa node)比Intel 8269时延要大,但是带宽也高很多

龙芯测试数据

3A5000为龙芯,执行的命令为./lat_mem_rd  128M 4096,其中 4096 参数为跳步大小。其基本原理是,通过按  给定间隔去循环读一定大小的内存区域,测量每个读平均的时间。如果区域大小小于 L1 Cache 大 小,时间应该接近 L1 的访问延迟;如果大于  L1 小于 L2,则接近 L2 访问延迟;依此类推。图中横坐 标为访问的字节数,纵坐标为访存的拍数(cycles)。

基于跳步访问的 3A5000 和 Zen1、Skylake 各级延迟的比较(cycles)

下图给出了  LMbench 测试得到的访存操作的并发性,执行的命令为./par_mem。访存操作的并 发性是各级 Cache  和内存所支持并发访问的能力。在 LMbench 中,访存操作并发性的测试是设计一  个链表,不断地遍历访问下一个链表中的元素,链表所跳的距离和需要测量的 Cache 容量相关,在  一段时间能并发的发起对链表的追逐操作,也就是同时很多链表在遍历,如果发现这一段时间内 能同时完成 N 个链表的追逐操作,就认为访存的并发操作是  N。

 

服务热线

1391-024-6332