桌面CPU I7 2600K 跟手机CPU 骁龙855 谁运算能力更高?

如果重点在于理想化模型下的通用格式的密集数值运算性能上,答案是半斤八两

如今CPU最快的数值计算能力是SIMD单元赋予的,SIMD单元一般数据宽度很宽,他能一次打包多个没有相互依赖的数据或元素(包含逻辑计算)进行并行计算,浮点SIMD比较容易被优化,理论值也很容易得出

A76拥有两条128bit的,可以执行浮点FMA的单元,单独执行乘法和加法都是2条128bit,乘加混合为FMA,每个单元理论上每周期执行2次乘加计算,并且其中一个可以执行浮点除法

2600K所在的Sandy Bridge架构,浮点是两条256bit的单元,但不支持FMA,可同时执行1*256的浮点加法和1*256浮点乘法,其中一个端口也带FP除法器

那么2600K的浮点峰值就很简单了,2600K拥有四个SNB核心,四核默认boost到3.5Ghz

1,浮点加法单精度(32位)峰值:一条256bit加法单元,流水线化,理想情况下每个核心每周期执行256/32=8次浮点单精度加法,一共4个核心3.5G个周期,浮点加法峰值=112Gflops

2,浮点乘法单精度(32位)峰值:一条256bit加法单元,流水线化,理想情况下每个核心每周期执行256/32=8次浮点单精度加法,一共4个核心3.5G个周期,浮点加法峰值=112Gflops

3,浮点加法乘法平均混合峰值:一条256bit加法单元加上一条256bit乘法单元,流水线化,理想情况下每个核心每周期执行256/32*2=16次浮点单精度加法,一共4个核心3.5G个周期,浮点乘加峰值=224Gflops

4,浮点SIMD除法:各自拥有一个单元,2600K为256bit,A76为128bit,可默认2600K是A76的两倍,但除法计算时延较高,平均吞吐较低,不具备理论推算的条件

855由1个2.9Ghz的A76,3个2.4Ghz的A76和4个1.8Ghz的A55组成

A76执行浮点加法每周期2*128bit,乘法每周期2*128,乘加融合2*128FMA,等效每周期4*128

A55没有FMA单元,为1个128bit加法器与1个128bit乘法器,执行浮点加法每周期,1*128bit,乘法每周期1*128,乘加融合2*128,

所以,1,浮点加法单精度(32位)峰值:128/32*2*2.9Ghz+128/32*2*2.4Ghz*3核+128/32*4核*1.8Ghz=109.6Gflops

2,浮点乘法单精度(32位)峰值:128/32*2*2.9Ghz+128/32*2*2.4Ghz*3核+128/32*4核*1.8Ghz=109.6Gflops

3,浮点加法乘法平均混合峰值:两条128bit FMA融合乘加单元,流水线化,A76理想情况下每个核心每周期执行128/32*2=16次浮点单精度加法,A55为8次,峰值=128/32*2*2.9Ghz*2+128/32*2*2.4Ghz*3核*2+128/32*4核*1.8Ghz*2=219.2Gflops

整数运算要复杂些,因为即使是密集整数计算也不一定能被向量化,无符号的整数计算和有符号的整数计算吞吐会有差异,理想状态下,Sandy Bridge的向量INT单元可以执行2条128bit的整数加法,1条128bit的整数乘法和3条128bit logic计算,A76依旧是2条128bit的Vec ALU

A76与SNB其实也差别不大,由于2600K不支持AVX2,整数向量为128bit,所以相对A76没有优势

值得注意的是,并非所有整数计算指令都是这个吞吐量,如Vpaddw/Vpaddb/Vpaddd/Apaddq是这样,Vpaddsb,Vpaddsw,Vpaddusw等并非这个吞吐,如果考虑标量计算,A76和SNB都是3个ALU,本质也没啥差别

主要是要解释一些回答中提出的论点

1,2600K和骁龙855就像通用处理器和专用处理器的区别?

首先现代处理器没有纯粹的CISC和RISC处理器,由于有大量扩展指令集存在,扩展的功能都是过去各自没有的能力,这些部分构成了现代处理器进行更强多媒体性能的基础,这些指令是不能用CISC/RISC来简单区分的,这两款都是通用处理器

2,ARM没有什么服务器用

问题是2600K也不是服务器使用的,ARM在服务器领域占有率低与intel现在的服务器处理器很强有关,但这与2600K无关,如果今天X86服务器仅仅是2600K的水平,X86已经被赶出服务器领域了,换言之,ARM是打不过现在的Intel服务器处理器,但不是打不过2600k

3,散热差距,耗电差距

由于制程差异巨大,耗电大是必然的,这不是优势,如今一颗8250U处理器锁定在15瓦,跑出的向量浮点性能理论上都超过2600K

4,2600K超频后依旧是顶尖四核水平

古董跑分软件蒙蔽了你的双眼

实际上E5-2690在使用最新计算单元计算圆周率的测试中,双路16核也被7700K拉开了较大距离,更何况4核的2600K

来源:知乎 www.zhihu.com

作者:JZWSVIC

【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载

此问题还有 45 个回答,查看全部。
延伸阅读:
我现在是三代的i3处理器,主玩游戏,现在需要换最新的CPU吗?
最近想换一部性价比高的手机,夏普s2如何,cpu是骁龙630???