第二代Threadrippers的基本构建块与第一代部件相同。Threadripper处理器是包含多个管芯和Infinity Fabric互连的多芯片模块(MCM)。每个芯片的基本构建块为Core Complex(CCX),它具有四个内核,八个线程和8MB三级缓存。每个芯片包含两个CCX。其实第一代Threadrippers就有四个芯片了,只不过其中两个处于活动状态,另外两个处于非活动状态,共有16个核心和32个线程。新的第二代部件使所有四个芯片都处于活动状态,最多可计入32个内核和64个线程。
在工艺制程上从原来的14nm升级为12nm,2950X相比1950X的升级幅度与2700X/1800X之间的区别很像,格罗方德(GF)12nm加持使得CPU能够实现在相同核心数量下,功耗几乎不变的基础上提高频率与性能。
与第一代部件相比,缓存子系统的改进减少了内存延迟,并且每个周期产生的指令多出约3%。涡轮增压也应该更加智能,能够使处理器更接近其热量和功率限制。
相比Intel几乎每代CPU都需要更换相应的主板,第二代线程撕裂者在这方面确实要显得“良心”的多,适配的主板接口依然是TR4,使得原来的X399主板只要刷一个新的BIOS即可支持第二代线程撕裂者。不过要注意的是,鉴于在第一代线程撕裂者(TDP 180W)发布的时候,主板厂商们可能没有预料到一年之后就会出来这么一个32核的CPU(TDP 250W),所以一些供电模块规格较低的主板如果强行上32核2990WX的话,也许会导致发热过高从而无法发挥2990WX的全部性能,严重的话甚至导致主板损坏。
没有改变的一件事是内存控制器和PCIe通道的分配。在第一代产品中,两个功能芯片共有两个内存通道和32个PCIe链路。尽管新的Threadrippers包括四个功能芯片而不是两个,但AMD选择在新处理器中使用相同的配置,这意味着两个芯片的内存控制器和PCIe连接未被使用。这对于操作系统对运行线程的最佳调度具有细微的影响,操作系统应该在使用没有内存控制器的内核之前选择将内核与内存控制器一起使用,因为前者的内核应该比后者快一点。
4款Threadripper 2的参数对比:
第二代线程撕裂者(Threadripper)系列处理器
CPU
2990WX
2970WX
2950X
2920X
接口类型
TR4
TR4
TR4
TR4
核心线程
32/64
24/48
16/32
16/32
制程工艺
GF12nm
GF14nm
频率
3.0~4.2GHz
3.5~4.4GHz
3.4~4.0GHz
超频
可超频
二级缓存
16MB
12MB
8MB
三级缓存
64MB
64MB
内置核显
无
XFR技术
XFR2
XFR1
Store MI
支持
PBO
支持
不支持
TDP
250W
180W
XFR2
根据AMD提供的数据,如果把2990WX在180W普通风冷散热器、32℃室温下的性能视为基准,换用新的Wraith Ripper散热器可以额外加速多达11%,室温降至20℃则可以提升13%,而如果换上水冷,则能获得16%的额外性能!
即Extended Frequency Range 2(第2代自适应动态扩频),类似于intel的睿频,是用来为cpu频率加速的。只要是12nm的锐龙都支持XFR2、而14nm的都只支持XFR1;第一代XFR能动态加速让CPU获得额外的频率提升,第二代在此基础上能让CPU根据散热器的效能再进一步地提频,虽然幅度不多,但这也就意味着,如果你用一个强一点点的散热器的话,CPU的频率又能动态地提高一点点,散热器再加强一点,性能又能相应加强。反正要记得,如果你选择了Threadripper系列的处理器,那么一款高性能的散热器对于XFR作用的发挥是很有必要的。
Stroe MI
Store MI与intel的傲腾技术有点类似,不过还需要SSD,该技术可以让电脑划分一定容量的内存、SSD以及HDD组合成一个新的分区,Store MI会智能地管理这个分区,使得它能同时享受到内存的随机速度、SSD的持续读写速度以及HDD的大容量。
其中X370、B350、A320需付费才能使用Store MI技术,而X399、X470、B450主板则可免费使用。
PBO
Experience
Out-of-box
Overclock
PBO
nT Frequency
Stock
User Controllde
PBO Controllde
Power Limits
Stock
User Controllde
Increased
Idle Downclocking
Yes
NO
Yes
Warranty
Yes
NO
NO
Precision Bosst 2
On
Off
On
Performance
Stock
Increased
Increased
全称Precision boost overdrive,(加速超频技术)。开启PBO后,就能在手动超频的情况下同时享受到自动加速的效果了,而此前无论是AMD还是Intel平台,手动超频只能让CPU的频率固定在某个数值,默频下拥有的自动加速会失效;PBO能在手动设定频率之后依然有自动加速的效果,同时会解开功耗墙,根据主板供电的极限去提高功耗上限。
开启PBO之后,CPU的功耗会大幅提升,性能也会更强,频率依然智能;同样也是需要一个强效的散热器、性能才更强,当然对主板的用料和设计要求更高。
不过PBO技术只支持X400系列晶片组才支持,300系列主板供电无法应付如此激进的供电范围。并且PBO也属于超频行为,由此造成的损坏将失去质保。。。
内存模式
由于锐龙Threadripper处理器核心众多,而且内部分成多个Die,又支持四通道内存,所以在内存支持和应用方面AMD也做了特别设计,使用的时候需要分情况注意。
为了理解第二代Threadripper处理器的内存机制,先来看看结构拓扑图
2950X相对简单一些,内部两个Die,每个Die有8个物理核心,同时每个Die对外连接两个内存通道、32条PCI-E 3.0通道(分成两组),两个Die之间通过一条Inifinity Fabric总线互连,DDR4-1600内存的时候IO带宽就有大约50GB/s。
2990WX就比较复杂了,内部共有四个Die,各自还是8个物理核心,但依然只有两个Die分别负责对外连接两个内存通道、32条PCI-E 3.0通道,另外两个Die是没有的,AMD称之为Compute Die,也就是只负责计算。
同时,每两个Die之间都有一条Infinity Fabric,总计六条之多,这样可以保证两个Die之间的物理核心可以直接沟通,从而降低延迟。内存频率1600MHz的时候,每条互连总线带宽约为25GB/s,也就是2950X的一半。
为了提高内存性能,AMD设计了两种内存访问模式,其一称为分布模式(Distributed Mode),整个系统配置为一体化内存访问(UMA),内存访问需求在所有可用通道之间均匀分配,即便是应用在多线程下的表现难以预料也能确保内存性能的一致性。
然后是本地模式(Local Mode),配置为非一体化内存访问(NUMA),它是2950X的独有模式,整个处理器分为两个节点(node),每个节点包含一个Die和两个内存通道。
操作系统会尽可能将进程和内存需求放在同一个节点内,不够了才会扩展到第二个节点,这能在线程不多时降低内存延迟,非常适合用来玩游戏,因此在Ryzen Master工具中,如果启用游戏模式(Game Mode),2950X就会切换到本地模式内存配置。
跑分
在Cinebench R15渲染测试中:2990WX得分为5099。这让它轻松领先于英特尔目前的顶级竞争对手,售价1999美元,18核,36线程的酷睿i9-7980XE,得分约为3300分。Cinebench是这些高线程数处理器的最佳工作负载之一,因为它的工作负载几乎完全可以与并发线程数一起扩展。它可以很好地指示Threadripper可以实现的功能,当然前提是拥有可以利用此硬件工作负载的相应配置和温度环境。
超频
先说2990WX,将CPU频率超频到4GHz时,单线程性能基本上没有变化,毕竟默频时2990WX单核睿频就能达到4.2GHz;多线程性能则提升了13%。
再将内存频率从2400MHz超频到3333MHz之后,整个平台的多线程性能又有5%的提升,相比默频有18%。
再说2950X,由于其默认全核频率就能达到3.8GHz,将CPU频率超频到4.2GHz、内存频率超频到3333MHz时,单线程性能同样也是没什么变化,多线程性能则提升了10%。
AMD与Intel几款旗舰级CPU性能测试数据
项目
单位
TR2
2990WX
TR2
2950X
TR2
1950X
Ryzen7 2700x
I7-8086K
I9-7980XE
CPU-Z
单线程
473
493
445
476
544
479
CPU-Z
多线程
16648
9573
8869
4805
3870
8886
Cinebench R15单线程
cb
166
172
161
173
209
181
Cinebench R15多线程
cb
5271
3234
3019
1750
1428
3364
AIDA GPGPU
单精度
GFLOPS
1738
1011
936
502
AIDA GPGPU
双精度
GFLOPS
868
505
468
251
wPrime 32M
单线程
秒
37
35
37
36
29
31
wPrime 1024M
多线程
秒
32
50
53
98
120
51
X264 FHD
Benchmark
帧
157
94
91
50
46
107
X265 FHD
Benchmark
帧
96
66
61
36
35
70
POV-Ray
单线程
PPS
392
409
385
399
492
458
POV-Ray
多线程
PPS
10238
6466
6014
3578
2978
6559
7-zip单线程
MIPS
5246
5927
5514
5981
7357
6236
7-zip单线程
MIPS
121534
102328
97458
52134
50075
89895
3DMARK
18363
26022
25333
20068
18891
26356
单线程
标准对比
100
104
99
104
117
107
多线程
标准对比
100
64
60
33
30
66
备注说明:1、每个选项都将得分最高的标注为黑体字。2、最后2个对比得分项将TR2 2990WX作为对比进行比较。3、具体实际得分还跟每个CPU体质有关,但是大概参数是可以参考的。
可以看出第二代AMD锐龙Threadripper处理器主要面向的是生产力相关的专业领域,玩游戏并不是主要目的。但并不是说它就不适合玩游戏。在默频状态下,即便全核只有3.4GHz的频率,2990WX与i7-8086K在游戏帧数之间的差距也不到10%。但是在多线程火力全开的情况下,拥有32核64线程的2990WX比起18核36线程的i9-7980XE要高出1/3。
最后说一句,虽然都是支持AM4接口,但是好马配好鞍,Threadripper 2系列CPU还是配400系列的主板最好(虽说买的起这么高端的CPU自然也不缺相应主板的钱)。。。
芯片组
USB
SATA
3.0
PCIe
Gen3
PCIe
Gen2
Processor
PCIe
Interface
超频
XFR2
XFR2
增强
PBO
SATA
RAID
NVME
RAID
3.2
3.1
2.0
X470
2
6
6
4
2
8
1X16/2X8
Y
Y
Y
Y
0/1/10
0/1/10
X370
2
6
6
4
2
8
1X16/2X8
Y
Y
N
N
0/1/10
0/1/10
B450
2
2
6
2
1
6
1X16
Y
Y
Y
Y
0/1/10
0/1/10
B350
2
2
6
2
1
6
1X16
Y
Y
N
N
0/1/10
0/1/10
A320
1
2
6
2
1
4
1X16
N
Y
N
N
0/1/10
备注:USB 3.2即为3.1 Gen 2,USB 3.1即为3.1Gen 1;“Y”表示支持,“N”表示不支持。