就像刚刚过去的苹果发布会一样,NVIDIA每一代的新旗舰显卡的发布在玩家心目中也完全可以被当做一场“科技春晚”,只不过最近的“春晚”周期横跨了2016-2018三个年头,间隔长达两年零三个月。或许也只有这样一个破纪录的更新周期才能消化2016年5月发布会上Pascal架构产品那令人震惊的性能跨越。这也让我们看到老黄在2018年新品发布会上拿出新款“核弹”时有了更多的期待。按照惯例,笔者在第一时间拿到了这两款国内外玩家翘首以盼的新显卡——”GeForce RTX 2080Ti和GeForce RTX 2080“。
规格参数一览
以TU102和GP102核心为例,从规格上来看,CUDA核心的数量增长并不是非常夸张,相对而言最大的变化就是增加了用于光线追踪的RT Cores 和深度学习用的Tensor Cores。这也是这一代显卡最重量级的升级。新成员的加入也让图灵架构的显卡核心面积大幅度增加。TU102相比GP102在面积上就增加了60%。相应的频率也有所增加,但幅度相对较小。-rtx2080
TU102核心透视实拍
TU102的晶体管数量达到了186亿,而前一代GTX 1080Ti所使用的GP102则只有118亿,增加了57%。这颗GPU核心也顺理成章成为了目前规模最大的游戏显卡核心。巨大的规模带来的副作用就是潜在的功耗和发热量的增加。-何评价
相比两年前Pascal时代28nm到14/16nm工艺的巨大工艺红利来说,这一代从16nm 到12nm 的提升幅度就没那么夸张,一定意义上来说,台积电以及三星的12nm工艺更多的是在之前14/16nm工艺基础上的小改成果。所以虽然有一定的效果,但对于NVIDIA来说并不会有太多频率和发热控制上的显著进步。-rtx2080
RTX6000采用的完整TU102核心拥有72个SM单元,而很不幸的是RTX2080Ti阉割掉了4个SM单元,仅有68组。相应的内存控制器也阉割掉了一组,剩下11个,整体的策略和GTX 1080Ti时期对GP102的“刀法”完全一致。-何评价
每一组SM单元中都配备了一个RT Core,以及两两成对的TENSOR Cores。可以看出,事实上这一代FP32和INT32单元所占据的比例其实相对不那么高。可以说这一代是近几年来,在底层变化最大的一代产品。-rtx2080
如果细化到Tensor Core本身,图灵架构的Tensor Core相对于Pascal上搭载的相同结构的最大变化就是将处理方式从2D平面升级到了3D,这意味着以数量级计的效率提升。
GDRR6显存:求稳之举
出乎很多人意料的是NVIDIA在这一代产品中并没有使用大家所期待的性能强大的HBM2显存。继续使用了最新的DDR显存,也就是GDDR6显存。
架构上没有多少变化的GDDR6是基于前一代产品的继续优化产物,通过提升频率到7000MHz(等效14000MHz)将带宽提升到了14Gbps的水平,同时降低了40%的串扰。虽然性能仍然不可能与HBM相比,但胜在成本低,良率高,可以持续大规模供货,不至于出现被显存拖累的窘境。-何评价
前文我们说到,RT Cores占用了很大的核心面积,而这些单元并不会提升传统的光栅渲染效能。他们的用途要比单独提升游戏的FPS值更有价值。基于这些单元,NVIDIA在这一代显卡产品中加入了酝酿多年的“实时光线追踪”(RTX)技术。这也是为什么这一代显卡产品的命名从“GTX”变成“RTX”的原因。-rtx2080
光线追踪与实时光线追踪
传统的光栅化渲染其实将一个3D图形的几何信息转变为一个个栅格组成的2D图像的过程,可以理解为在这个3D图形的每个点都包含有颜色、深度以及纹理数据,经过一系列计算变换后,将其转换为2D图像的像素,进而呈现在显示设备上。更多的是一种基于作者认为“这里应该有这个”的创作性质的图形渲染方式,一定以上来说就是已知结果并把结果写出来,而并不能知道这个结果是正确的还是错误的。-何评价
而光线追踪技术则是通过通过光源位置、射线、和物体关系进行真实的光线模拟运算,来得出这里应该有哪些光线,有怎样的反射关系。这样得出的游戏画面的光影效果也就更加真实。
光线追踪在以往游戏中的应用都是在游戏的制作中提前进行运算,将得出的结果写到游戏程序中,显卡所做的也仅仅是将已经写好的“台词”念出来。这样的做法意味着无法实现大量且精细的光线追踪,那将意味着海量的计算过程和无比巨大的供调用的结果数据。-rtx2080
而“实时光线追踪”就是将光线追踪的运算过程拿到游戏过程中来,实时地计算出光线应该投影和反射形成的效果。如果性能足够强大,不仅可以在同样的场景中做到更高数量级的光线追踪效果,游戏画面可以得到显著的提高,还能大幅度降低游戏开发者的运算量。-何评价
如果把图形渲染比喻成一场数学考试,那么光栅化渲染基本上约等于不会做题目所有的选项都靠“三短一长选最长”的直觉来回答;而“光线追踪”则是将尽可能多的题目死记硬背,靠题海战术来完成答卷;而“实时光线追踪”(RTX)技术则是将做题的方式学会,通过聪明的大脑来运算解决遇到的每一个题目。这样毫无疑问,最后一种方式所得到的分数必然要远胜前两者。-rtx2080
落实到游戏的话,目前支持光线追踪的游戏并不多,近期《古墓丽影:暗影》虽然已经承诺支持,但并未在首发版本中加入。而另一款NVIDIA演示的RTX游戏《战地V》也延期上市。所以目前还不能玩到支持实时光线追踪技术的游戏。但是相信不久的将来,在NVIDIA的推动下,会有更多的支持RTX技术的游戏来到我们面前。-何评价
靠“脑补”的DLSS技术
科隆发布会上占据时长同样多的还有全新的基于AI人工智能技术的“深度学习超级采样”(DLSS)技术。这也是图灵GPU核心中的那些Tensor Core的用途所在。
原理是这样的,NVIDIA 使用自己的超级计算机以64 倍于标准分辨率的分辨率运行游戏,绘制出极多的超高画质的画面,再用一定的方式挑选出一些细分画面作为完美渲染的“标准答案”。然后通过DLSS深度学习,将标准分辨率的画面和这些画面进行对比,生成一张最优画面,然后再与全尺寸(64倍超采样)进行对比,得出差别,然后将这些差别反推到神经网络中,进行循环训练。在几轮之后就人工智能网络就可以学会如何将标准画面渲染到接近64倍分辨率原图的方法。-rtx2080
这些学习结果定期通过软件更新提供给图灵GPU的显卡,通过Tensor Cores,就可以进行实时比对,将较低分辨率的画面“脑补”为正确的高分辨率画面,从而实现画面细节的提升。超采样也消灭了画面中可能存在的锯齿。-何评价
最终的效果就是,要得出一个4K分辨率的高画质反锯齿画面,通过DLSS技术并不需要真的在4K分辨率下渲染画面,实际渲染一个低分辨率画面,通过DLSS技术即可达到需要的效果。这样不仅画质有所保证,还可以大幅度降低游戏的性能需求,游戏的运行效率将大幅度提升。-rtx2080
虽然效率提升,但画质方面却并不会因为DLSS技术而受到损失,相反的,相比TAA(时间性反锯齿),DLSS技术大量的机器学习可以避免拖影和细节错位,从而获得更好的反锯齿效果。
相比需要更深度技术基础的实时光线追踪而言,DLSS更加容易实现,所以很多现有的游戏很快就可以经过NVIDIA的运算后支持DLSS技术,运行效率,尤其是4K下的性能会显著提升。目前NVIDIA承诺的DLSS技术游戏包括《绝地求生》《古墓丽影:暗影》《剑侠情缘三》等众多我们熟悉的作品。-何评价
不过由于需要硬件层面的支持,DLSS技术也是图灵架构GPU的专属功能。后续的基准测试中,我们会有针对DLSS技术的实测数据。
3DMark
首先是传统的3DMark测试:
在基于DX11的Firestrike测试中,RTX 2080Ti显卡相对于GTX 1080Ti有着约20%的性能优势。而RTX 2080则相对于GTX 1080有着26-28%的性能提升,而相对于GTX 1080Ti有着5%左右的差距。-rtx2080
而来到DX12测试中,RTX 2080Ti的性能优势大幅度扩大,相比GTX 1080Ti有着高达44%和43%的性能优势。反观RTX2080,则相对GTX 1080有着38%和51%的性能提升。
Unigine Valley1.0
Valley是一款常用的DX11图形性能测试工具,包含大量先进的画面技术。
在手动开启最高画质并设定3840x2160分辨率开启8x反锯齿后,Valley的测试成绩如图所示,基本上与3DMark Firestrike的测试结果保持一致。RTX 2080Ti 20%左右的性能优势,并且RTX 2080的表现扔略逊于GTX 1080Ti。-何评价
DLSS技术效能测试
我们使用《最终幻想15》的DLSS Benchmark程序进行了开启和关闭DLSS技术的对比测试。分辨率为3840x2160。
可以看到,在未开启DLSS的情况下,RTX 2080Ti相比GTX 1080Ti有25%左右的优势,而开启DLSS之后,RTX 2080Ti的得分提升了高达39%。相对于GTX 1080Ti的性能优势扩大到惊人的75%。甚至RTX 2080开启 DLSS之后的成绩也提升了38%,超过GTX 1080Ti 44%,相对于GTX 1080的优势更是毫无意外的达到了63.7%!-rtx2080
由此可见,DLSS技术毫无疑问可以显著提升游戏的运行效能,不过这样的性能释放还需要游戏的支持才能解锁,让我们一起期待DLSS技术在游戏产业的普及吧。
NVIDIA前段时间宣称新一代的图灵显卡可以完美征服4K分辨率的高画质大作,那么我们就挑选几款高画质大作进行一番4K游戏的测试。
在实际游戏中,RTX2080Ti展现了新一代的旗舰的性能水准,相对于GTX 1080Ti的优势基本上在20-25%之间,而RTX 2080则波动较大,总体相比GTX 1080的提升幅度在30-40%,表现不错。-何评价
可以看出,这一代显卡在现有非DLSS游戏中的提升没有上一代Pascal和Maxwell换代时的惊艳。表现基本上向上进步了一档,次旗舰RTX 2080战平前代旗舰GTX 1080Ti。但必须强调的是这都是在DLSS和RTX技术没有引入的情况下得出的结论,未来如果有足够多的DLSS游戏上市,我们还会再一次进行类似的测试,与此次的结论相比照,得出相应的最终结论。-rtx2080
功耗测试
我们使用FurMark进行压力测试,设定为2560x1440分辨率。通过NZXT电源自带的CAM软件捕捉最高功耗值。
由于此时CPU为空载状态,CPU负载维持在20W以下。另外此时显卡的功耗数据仅代表PCI-E供电线所提供的功率,不包含PCI-E插槽的供电部分。
如果计算CPU满载时约100W的功耗水平,那么RTX 2080Ti整机的峰值功耗将超过400W,那么一款500W额定功率并且转化率良好的电源是最低标准,如果考虑到一些冗余的话,官方给出的650W电源需求基本上是合理的。-何评价
散热
这一代公版显卡采用了有别于以往涡轮散热器的双风扇散热器,在TDP变化不大的情况下,满载烤机测试中的温度相比前代有着明显的降低,RTX 2080Ti Founders Edition满载仅78摄氏度的表现已经达到了之前一些GTX 1080Ti非公的水平。可以说公版显卡在这一代上基本上摘掉了散热不佳的帽子。-rtx2080
评测总结:
新一代的RTX系列显卡出乎我们意料地选择了对画质和人工智能进行革新和探索,而不是我们之前所期待的大幅度的理论性能提升。RTX 2080Ti相比GTX 1080Ti在DX11下20%左右在DX12下44%的理论性能提升也意味着NVIDIA在缺少强劲的对手情况下,更加重视新技术的支持和优化。这也体现在RTX和DLSS技术的实践上,DLSS技术的AI黑科技带来的提升令人震惊,另外,此次加入的RTX实时光线追踪技术带来了堪称革命性的画质提升,将游戏画面与电影和现实世界的差距缩小到了一个新的程度。-何评价
回到值不值得买的话题上,这一代产品的主要卖点是新技术的支持,而不单纯是性能上的进步。这与以往“强不强”的讨论话题不一样,此次更多的是解决DLSS和RTX技术“有没有”的问题。从这个角度上来说,买新不买旧是绝对成立的。当然考虑这些之前你还要考虑到目前两款显卡分别达到5699元和8199元的市场指导价。-rtx2080