写在前面 先前在外观解禁的时候我发表了一篇关于这张显卡的开箱。当时受限于保密协议无法为大家透露更多资讯。评论中大家有问到一些问题,我在这里集中解答一下。
Q:扇页也是金属吗?
A:扇叶不是金属的,风扇罩和背板都是金属的
Q:3090的HOF什么时候出?
A:这个我也不知道,不过3090的解禁时间比3080要晚一周
Q:这要是做水冷就可以直接单卡槽了呀?
A:只要后续有全覆盖冷头跟上可以做单槽卡,而且还很短,但是I/O挡板只提供了双槽和三槽的
Q:初期的非公大多是根据公版pcb改出来的吧
A:这代RTX 3080的公版有两种,一种是Founder’s Edition自己独占的那个异形PCB。另一款就是这个RTX 3080金属大师采用的PG132版型
新一代的安培
9月初NVIDIA发布Ampere架构显卡的时候介绍了一大堆的新鲜事物,我在这里捡重点的给大家简单复习一下
当我第一眼看到Ampere架构的GPU的CUDA核心数量的时候被吓了一跳,Ampere GPU究竟是用了何种黑科技居然能将CUDA数量翻了一倍还多。经过仔细研究之后,发现了其中的奥妙所在。
下面这个是Ampere架构一个SM的结构图。
在上一代的Turing核心中,整型(INT)运算单元和单精度浮点(FP32)单元各司其职,进行着互不影响的并行运算。但是在长期的游戏运行中NVIDIA发现整型运算的需求要远远小于单精度浮点。于是NVIDIA在Ampere架构中引入了一种同时能够处理整型和单精度浮点两种数据类型的运算单元,这样就使得Ampere在处理纯粹的单精度浮点运算时,相比Turing拥有多一倍的单精度浮点单元。而在NVIDIA统计CUDA CORE是以一个单精度浮点单元对应一个CUDA CORE,也就是说在Ampere架构中每两个CUDA CORE对应一个专用单精度浮点单元和一个单精度浮点/整型两用单元。我能想得到上一个做过类似操作的便是友商的CPU——推土机
当然在GPU用的单精度浮点单元显然是更加重要,这一改变也使得Ampere的规格和性能得到了一次飞跃
仅仅有了GPU的提升是远远不够的。GDDR6X显存的应用,更是让Ampere的显存带宽逼近了1TB/S。超级核心外加大带宽显存才是真正的Ampere完全体
显卡做工解析
拆掉庞大的散热器与背板之后,看到了相对纤瘦的PCB
影驰给这款散热器取了一个蛮好听的名字,叫做“寒光星”。散热器本体使用了6根热管贯穿,原色铜底与GPU直接接触。风扇罩可以很容易的拿下来,方便我们清理灰尘
三枚风扇由两个接头分别控制
正面风扇罩采用了一体成型的全铝合金材质,厚度达到了2.5mm左右,非常的坚固
背板也不遑多让的达到了1.5mm,更是增加了显卡的厚重感
看完了散热周边,再来看下影驰RTX 3080金属大师的PCB。这款PCB虽然尺寸看起来短小,但实际拥有12层的厚度,而且也是很足的。PCB的正面几乎没有那一寸土地是空闲的
放眼望去我们可以看到16颗输出电感,左边6颗右边10颗,所以粗略的估计总共有16相供电来为这张RTX 3080金属大师服务
背面同样是密密麻麻的元器件和焊点,让密集恐惧症患者心有余悸
在PCB背面的一堆图标里面我发现了这个,NVIDIA的公版PCB标识,编号为PG132。早先就传闻NVIDIA为这次的Ampere显卡设计了两种公版方案,其中一种异形PCB方案留给自家的Founder‘s Edition,另一种方案则交给了AIC。这个PG132公版似乎坐实了上面的说法
在PCB的背面还发现了两枚PWM主控,型号为UP9511。这两枚都是8相主控
PCB正面还有一枚,总计三枚PWM主控控制16相供电
MOSFET规格暂时不详
GA102-200基于Ampere架构的GPU采用了三星8NM工艺,628平方毫米的面积容纳了28亿晶体管,不由得让人感叹科技的进步8704个CUDA核心,正好是2080TI那颗TU102的两倍
显存采用了10颗编号为D8BGW的镁光GDDR6X显存,单颗容量1GB,运行速度为19Gbps,320bit位宽。显存总带宽达到了760GB/S
GPU背面采用了许多MLCC电容来提供更纯净的电流补给
三槽显卡的体积虽然不小,但如果搭配上ATX主板和大型风冷散热器的话,也不是那么突兀。银灰色在主机中也是百搭的,深浅主题都可以搭配
比如配上华擎Z490TAICHI和利民FS140 BLACK
三槽挡板和全金属的风扇罩可以将整个显卡牢牢地所在机箱上,及时没有支撑架的情况下也基本不会出现下垂情况
基准性能测试
在做这代显卡的性能测试时,我遇到了史无前例的尴尬局面。
目前市面上游戏性能最好的处理器无疑是INTEL I9-10900K,这点恐怕连友商也无法反驳。但是10900K仅支持PCI-E 3.0,有会对显卡的带宽产生负面作用。之前的PCI-E4.0的显卡RX5700XT性能相对没有那么强大,PCI-E 3.0带宽不足以对他造成影响,而RTX 3080则不同。
比如在《地平线:零之曙光》的测试中,可以很明显的发现在1920*1080与2560*1440这两个分辨率下,INTEL平台的表现要好于AMD平台;而分辨率上升为4K之后情况得到逆转(左边10900K M12E,右边3900X X570-I,显卡驱动版本为456.16)。
当然也并不是所有游戏都会这样,比如《荒野大镖客2》在2K以上两个平台就没什么区别,3DMARK跑出来的图形分,两个平台也基本一致
CPU的游戏性能与PCI-E带宽到达了一个不可调和两难取舍的境地。没办法,我也只好二选一。我在这里选择了INTELI9-10900K,毕竟目前1080P和2K分辨率的显示器相比4K要更主流一点。所以我的测试平台是这样的
最新版本到GPU-Z已经可以正确识别RTX 3080的各项参数了,GA102的Cuda总核心数为8704个,正好是上一代RTX2080TI的TU102的两倍,可见规格之至强大
10900K和M12E,显卡只能运行在PCI-E 3.0状态下
3DMARK TIMESPY和TIME SPY EXTREME的跑分
默认的GPU频率为1440MHz,Boost频率为1710Mhz。然而实际运行频率要远远高于这两个数值。在3DMark TimeSpy压力测试的过程中,大部分时间GPU核心频率都在1750-1800MHz之间浮动,最高可以突破1850MHz
在3DMARK的几项高要求测试中,RTX 3080对RTX2080TI都体现出了较大优势,领先幅度达到20%以上,并且随着分辨率的提高而增大
光线追踪与DLSS测试
实时光线追踪与DLSS是RTX显卡的两大杀手级应用,前者是提高画质而后者是提高性能。这么说可能有点抽象,下面我来举个例子
这是游戏《CONTROL》中刚开头的一个场景,下图是没有开启实时光线追踪的效果
下图是实时光线追踪开到高之后的效果
这样可能看的不是很清楚,我做一个gif来给大家看。《CONTROL》中一共有三档实时光线追踪选项——“关闭”,“中”,“高”。
可以看到开启中档实时光线追踪效果之后地面和天棚上的玻璃有了显著的变化,而从中开到高之后左边的美国国旗和右边墙上的灭火器的阴影有了较大差异
当然开启实时光线追踪之后是要损失一定的帧数的,在《CONTROL》的4K分辨率下,每提高一档的实时光线追踪特效就要损失十几帧
这样的情况同样存在于《古墓丽影:暗影》和《地铁:离去》中
通过《古墓丽影:暗影》和《地铁:离去》的测试我们可以看到这样一个现象,由于Ampere架构拥有第二代RT CORE的加持,开启实时光线追踪虽然依然会损失帧率,但是RTX 3080损失幅度要明显小于上一代Turing核心的RTX2080TI
说完了光线追踪,下面该讲一下另一个DLSS了,也就是NVIDIA的深度学习抗锯齿。简单的来说呢,就是显卡会以一个较低分辨率去渲染,然后通过NVIDIA的AI算法进行拉伸达到标称分辨率去输出。这样无疑大幅提高性能,但也不可避免的带来一定的画质损失。具体效果如何我们继续来看
同样是来自《CONTROL》,《CONTROL》的DLSS开启之后会使输出分辨率和渲染分辨率脱钩,玩家可以自己选择渲染分辨率,从1920*1080到2560*1440不等,一共三个等级。下面两张图,第一张是关闭DLSS,第二张是DLSS开到最大,也就是渲染分辨率为1920*1080时的情况
区别主要在于一些细节上,不仔细看很难发现。我将正上方的墙壁拼起来,左上方的是关闭DLSS的情况,后面开启DLSS并且依次降低渲染分辨率。并不是很明显,可以看到下面两个逐渐缺失了墙面上的一些纹理,颜色也产生了一点点的变化
这种画质降低,客观来讲是有的,但是在玩游戏的时候我们能否察觉就是另一回事了。相比于性能的提升,损失这点画质还是非常值得的
在《古墓丽影:暗影》与《地铁:离去》的测试中,高分辨率下开启DLSS无疑会大幅提升性能,4K分辨率下的提升幅度都在50%左右。
其他游戏性能测试
《战争机器5》1080P分辨率下受限于CPU,两者没能拉开距离。而随着分辨率的提升,差距拉大到接近30%
在《荒野大镖客2》中除1080P分辨率以外,两个更高分辨率都要领先2080TI 20个百分点以上
《全面战争:特洛伊》,4K分辨率下RTX 3080相对于RTX2080TI提升超过了25%
《无主之地3》提升幅度随分辨率升高而升高,4K分辨率下领先幅度超过30%
《地平线:零之曙光》,领先幅度约为20%
在上面的游戏测试中我们可以看到一个共同特点,RTX 3080对于RTX2080TI的领先优势都是随着分辨率的提高而增加的。这其中存在两方面的因素:第一是Ampere架构对于高分辨率的适配性高于Turing,另一个则是1080P分辨率下CPU在多数时间是帧率的瓶颈,不能够完全展现出显卡的性能所致
功耗与温度测试
为什么我喜欢使用3DMARK压力测试来测试温度与功耗而不是FURMARK?
原因在于显卡终究是用来玩游戏而不是用来虐待的,NVIDIA商也会针对FURMARK这种拷机程序进行针对性的“优化”,避免在这种拷机时候浪费过多的性能和电力。所以我们经常可以发现在FURMARK中GPU无法Boost到达他的最高频率,并且功耗也不能触及峰值。
而3DMARK不同,作为市面上主流的显卡跑分软件,在显卡性能评判中占据了重要地位。厂商也乐于将显卡最好的状态发挥在3DMARK程序里,所以我们在3DMARK中将会看到真正的满性能显卡。所以我才会选择3DMARK压力测试来测量温度及功耗,这样既能模拟日常游戏场景,也能得到显卡的最佳状态
NVIDIA给RTX 3080设定的TGP是320W,我们可以很清楚地看到影驰RTX 3080金属大师严格的遵循了这一设定,在3DMARK压力测试的过程中,功耗一直在320W上下不超过10W的范围内浮动。所以影驰RTX 3080 金属大师采用的双8pin供电提供150W*2功率,再加上PCI-E插槽的75W之后能够完美适应这样的功耗,从而让显卡安全释放最佳性能
在室温27度的情况下,显卡满载温度维持在74度上下,没有出现因为过热而降频的现象
风扇转速方面满载维持在2100-2200RPM之间,虽然影驰RTX 3080 金属大师没有任何灯光,但经过三折处理的风扇旋转起来也是挺带感的
噪音方面控制的还是不错的。虽然在满载的时候明显可以听得到的声音,但并不吵。噪音计贴脸测得约为55分贝,距离1m左右约为40分贝出头
63’.jpg(684.57 KB, 下载次数: 0)
下载附件
昨天19:11上传
总结
在2560*1440分辨率的测试汇总中,影驰RTX 3080金属大师领先RTX2080TI约18%
4K分辨率下的成绩汇总,影驰RTX 3080金属大师领先RTX2080TI大约24%
该款RTX2080TI是曾经售价过万的顶级非公版显卡,相比普通版本的RTX2080TI性能要领先5~10%,如果扣除这个优势可以预见影驰RTX 3080金属大师将会领先普通的RTX2080TI 25~30%,然而价格只有其一半多一点
影驰RTX 3080金属大师没有华丽的RGB灯光,取而代之的是扎实的做工和用料,非常的实用。附送双槽挡板和显卡支架的做法也体现了影驰充分从玩家角度出发的思考问题方式。
RTX3080金属大师在影驰产品线中应当是比黑将稍高一个档次的产品,价格方面相信也会比较实惠,无疑是玩家体验Ampere一个好起点。影驰RTX 3080金属大师显卡的出世将正式带领玩家们进入4K60帧的新时代