×

avx512

amd的cpu怎么样?cpu做成一个性能超强的单核不行吗这种技术可以实现吗

admin admin 发表于2022-08-07 11:23:51 浏览91 评论0

抢沙发发表评论

制程工艺的放缓导致CPU频率不可能大幅提升,总之静态功耗、动态功耗的存在就决定了CPU频率越高,从16位到32位再到64位,CPU性能会更高,但实际却不存在处理器的位数通常是指通用寄存器的宽度,比如8位处理器一次处理8位数据或者8位指令,有很多人会想到那么有没有非常牛的CPU架构让IPC性能大幅提升呢,但CPU的浮点性能并不是日常所需的。

amd的cpu怎么样

如果要打游戏AMDfx8核系列CPU比较不错性价比高

英特尔i7CPU适合编程运算志强e系列适合图形处理不说了发一个我的CPU娱乐大师跑分
我电脑配置

电脑型号 技嘉 台式电脑 操作系统 Windows 7 旗舰版 64位 SP1 ( DirectX 11 ) 处理器 AMD FX-Series FX-8320 八核 主板 技嘉 970A-D3P ( AMD RD890 PCI to PCI bridge (external gfx0 port B) ) 显卡 AMD Radeon HD 6800 Series ( 1 GB / 微星 / 双卡交火 ) 内存 8 GB ( 金邦 DDR3 1600MHz ) 主硬盘 英特尔 SSDSC2CW120A3 ( 120 GB / 固态硬盘 ) 显示器 惠科 HKC2600 ( 26.3 英寸 ) 光驱 华硕 DRW-24D3ST DVD刻录机 声卡 创新 EMU10K1 Audio Processor (SB Live!) 网卡 瑞昱 RTL8168/8111/8112 Gigabit Ethernet Controller / 技嘉-avx512

cpu做成一个性能超强的单核不行吗这种技术可以实现吗

CPU的的单核性能有多重要,这个不用再重复了,但是CPU的单核性能可以无限增加下去吗?回答这个问题之前,先说一个小故事吧。很多年前VIA威盛还可以跟英特尔硬刚,那时候是Pentium 4时代,英特尔在CPU频率不断突破1GHz、2GHz、3GHz之后要做更高频率的CPU,放言称奔4频率上4GHz,后来就有了英特尔前任CEO巴瑞特下跪的一幕,因为英特尔在奔4时代并没有如承诺的那样推出4GHz高频的产品。-avx512

但是很多人不知道的是,4GHz并不是英特尔当时的最终目标,2001年的IDF会议上英特尔曾经表示奔4处理器可以上10GHz频率。如今18年过去了,这个目标一直都没实现,(硅基时代)可能永远都无法实现了。-avx512

这件事就能说明CPU频率不是想提升就提升的,奔4时代过去这么多年了,其实CPU的主流频率依然在4GHz左右,英特尔虽然在酷睿i7-8086K上首次实现官方5GHz频率,但绝大多数处理器日常使用的频率都没这么高,高负载下频率在4GHz出头就不错了。-avx512

制约单核性能超强的CPU出现的第一个问题就是频率无法大幅提升,而这个因素也跟现在的制程工艺有关,实质上是摩尔定律已经失效了,这个影响了半导体行业50年的金科玉律随着硅基芯片物理极限的到来已经失效了,从28nm节点之后其实就没有带来很大的性能改进了,而且功耗问题也越来越严重。-avx512

大家都知道理论上制程工艺越先进(制程数字越小),CPU性能会更高,功耗、发热会更低,但是实际上这个问题很复杂,CPU的功耗可以分为静态功耗(Static Power)及动态功耗(Dynamic Power),前者主要是漏电流引起的,制程越先进,漏电流又有增加的趋势,而动态功耗可以用1/2*CV2F这个公式来计算,F频率越高,动态功耗就越高。-avx512

为了上更高的频率,电压增加不可避免,但电压高了功耗也高了,总之静态功耗、动态功耗的存在就决定了CPU频率越高,功耗就会极速增加,将会严重影响处理器的性能表现,因为要降频。

说到这一点,英特尔的14nm工艺虽然被人调侃挤牙膏,但从技术上来说真的很牛了,从Skylake架构的第一代14nm到现在Coffee Lake的14nm++工艺,性能提升26%,或者功耗降低52%,在不改变基本结构的情况下这个成绩很难得。-avx512

制程工艺的放缓导致CPU频率不可能大幅提升,有很多人会想到那么有没有非常牛的CPU架构让IPC性能大幅提升呢?理论上这种思路是可以的,但是现实很残酷,CPU架构还是要服从半导体工艺物理定律的,没有先进的工艺,再好的CPU架构也不可能实现。-avx512

此外,即便不考虑工艺对CPU架构的影响,单纯说CPU架构的话,不论是X86还是ARM架构,在64位时代CPU单元不外乎就是ALU单元、缓存、I/O等子单元, 但是不论提升那部分单元,归根到底还是要算到晶体管数量上来,还要考虑提升导致的成本——这个成本不只是钱的问题,比如提升L1/L2/L3缓存可以提高性能,但是缓存占用的核心面积很大,而且还有命中率及命中惩罚的问题,不是随便加加单元就行的。-avx512

此外,CPU的内部还可以分为整数部分、浮点部分,前者对日常使用很重要,浮点性能对计算更重要,但CPU的浮点性能并不是日常所需的,所以大家普遍感觉不到这部分的提升。

支持AVX512的酷睿i9-7900X浮点性能提升很大

公平地说,近年来CPU浮点单元的进步是符合题目所说的单核超强的要求的,因为从SSE到AVX到AVX2再到最新的AVX-512,CPU浮点性能是有大幅提升的。如英特尔所说:“借助多达两个512位融合乘加 (FMA) 单元,应用程序在512位矢量内的每个时钟周期每秒可打包32次双精度和64次单精度浮点运算,以及八个64位和十六个32位整数。因此,与英特尔高级矢量扩展 2.0(英特尔 AVX2)相比,数据寄存器的宽度、数量以及FMA单元的宽度都增加了一倍。”-avx512

但是前面也说了,CPU的浮点性能不是日常所需的,整数性能更加重要一些,但是整数单元性能提升就没这么明显了,导致很多人以为CPU架构多年来挤牙膏。

从16位到32位再到64位,为何16年过去,依然没有128位系统出现

绝大部分人都没有意识到128位的处理器早已经存在了,并且已经存在了几十年。这么多年过去了,不光是128位的处理器出现了,256位、512位的处理器也同样出现了,比如Nvidia GTX 280这样的显卡、AMD Radeon R9 290,以及Tesla产品使用的是512位内存总线的处理器。-avx512

既然硬件已经存在了,那么操作系统毫无疑问会支持它们的使用,比如AVX-512就是英特尔与2013年7月份提出用于X86指令集架构的256位高级矢量扩展SIMD指令的512位扩展。AVX-512也并不是英特尔第一个引入的512位SIMD指令集,在第一代志强中就出现类类似的512位SIMD指令。-avx512

理论上512位的操作系统已经存在,但实际却不存在

处理器的位数通常是指通用寄存器的宽度,比如16位的处理器有16位通用寄存器,32位的处理器有32位通用寄存器,64位的处理器有64位的通用寄存器。那么就会要求与之相对应数的数据线、地址线、控制线,比如16位的处理器一次传输16位的二进制数,那么它的数据线、地址线、控制线都是16位的。-avx512

这也就能解释为什么32位的系统最多只能使用4GB的内存了,因为32位系统所能寻址的范围是2的32次方,也就是4GB。所以32位的系统最多只能使用4GB的内存,而64位的处理器几十GB还不是它的极限,他的寻址范围在2的64次方,也就是18200000TB。-avx512

芯片产商乐此不彼的增加处理器的位数,是确实得到了好处,比如8位处理器一次处理8位数据或者8位指令。当8位处理器计算+1时,需要先接收8位加的指令,再接收1这个8位二进制数。如果采用16位CPU则可以一次性16位2个字节的数据,计算+1这个动作就可以同时接收加的指令和1这个8位二进制数了。而32位就可以直接实现一次处理a=a+b的动作。-avx512

如果处理的位数再往128位迈进,就会发现寻址这个动作变得异常困难起来。处理器和高速缓存的压力也会变得非常巨大。原本可以放两条、四条指令的高速缓存仅仅只能放下一条,甚至放一条都不够。

处理器位数的增加也会导致操作码的变长,比如在32位处理器中跳转这个动作需要5个字节,而64位处理则需要15个字节。

正可谓是牵一发而动全身,处理器的位数在某种程度上确实简化了软件设计的复杂度,但硬件反而更为复杂了,结果就是计算速度下降。从实用的角度出发增加到128位的意义并不大。

综上所述

128位、512位架构对于图形、密码学,以及复杂的系统建模等数学密集型操作非常有用,但并不适用于操作系统。64位对于大多数用户来说已经足够用了,操作系统的更高位深度并不直接意味着它会有更高的速度,反而需要处理更长的地址,寻址也会变得异常困难,同理需要更换的不仅仅是操作系统,更换的还有软件代码。-avx512


以上个人浅见,欢迎批评指正。

认同我的看法,请点个赞再走,感谢!

喜欢我的,请关注我,再次感谢!