RTX 3080出生两个月卒!Radeon RX 6800/6800 XT首发评测
一、前言:出乎所有人预料的RDNA2构架
2020年9月4日,当NVIDIA基于新一代Ampere安培架构的GeForce RTX 30系列显卡发布之时,几乎在所有玩家的内心都默默的宣判了AMD的死刑。
因为此前在流处理器数量相同的情况下,同时代的NVIDIA显卡性能是远强于AMD显卡,就算是RDNA构架也不能难幸免。RX 5700 XT无法战胜拥有相同2560个流处理器数量的RTX 2070 Super,前者是7nm,后者是12nm。
新一代RTX 3090一上来就宣告拥有10496个流处理器,带来的震撼可想而知!至于传说中的RDNA2,很早之前大家就知道了,它最多拥有5120个流处理器。恐怕那时没人会觉得RNDA2会威胁到RTX 3090,甚至RTX 3080都可以高枕无忧。
不过如同Zen3处理器带给大家的震撼一样,10月29日发布的RDNA2 GPU的实际性能表现几乎超出了所有人的预料!
RDNA 2虽然是RDNA架构的更新版本,并不是完全重新设计。但在RDNA原有的基础上,RDNA2性能提升1倍,能效提升至少50%,ROP单元翻倍,完整支持DX12 Ultimate等技术特性,支持硬件光线追踪。
以上是RDNA、RDNA 2两代架构图,可以发现整体布局没有太大变化,当然各个功能模块都是调整优化过的,而最突出的,一是增加了独立的Infinity Cache高速缓存,二是在每个计算单元内加入了专用的光追加速器Ray Accelerator。
至于RDNA 2架构的底层细节,比如说计算单元的变化,AMD这次没有给出更多资料,只是简单提到了几点,包括精简TLB以降低延迟、重新设计32位像素流水线并支持HDR格式、优化几何分派与曲面细分、全方位精细时钟门控、频率树分离与门控、最小化数据转移、重新平衡流水线、高性能库等等,但没有任何图示。
以下是RDNA2构架新技术解析:
1、Smart Access Memory (SAM)显存智取技术
在游戏运行的时候,CPU是不能一次性访问全部显存的,比如RTX 3090有24GB显存,而CPU只能访问其中的256MB。于是有大量数据会回到内存后给CPU处理器完成后再转移到显存,此时不仅浪费了带宽也造成了无谓的资源浪费。
Smart Access Memory (SAM)可以让搭载AMD 500系列芯片组在搭载Zen3 CPU和RDNA2 GPU的时候,让Zen3 CPU可以完整访问全部显存,而且带宽还是PCIe 4.0的速度,理论上最多可以让游戏性能提升13%。
2、Ray Accelerator单元
在RDNA2构架中,加入了硬件光追单元Ray Accelerator!与NVIDIA的完全专用RT Core相比,RDNA2的Ray Accelerator紧密集成到了RNDA2的CU之中,并可以共享很多在光追中通常未被充分利用到的现有HW。
这是AMD放出的RNA 2光追渲染效果图,可以看到RDNA2实时光线追踪效果与传统光栅化渲染的差别。
AMD声称,相比于软件方案,RDNA 2架构的硬件加速光追性能,可以提升10倍之多,同时给出了部分游戏的实际性能,2K分辨率下《使命召唤:现代战争》可以跑出95FPS,《孤岛危机重制版》可达90FPS,《战地5》能有70FPS。
3、全局Infinity Cache
在大容量三级缓存的加持下,Zen3的IPC性能获得了巨大的性能提升。如今AMD将这个理念带入了GPU领域。
传统的GPU构架中,一般只有1.5~4MB的缓存,RDNA2除了4MB的L2缓存之外,还加入了128MB的全局Infinity Cache缓存,所有的CU单元均可以访问。
AMD Infinity Cache 作为一个巨大的带宽放大器,其有效带宽可以达到256 位 16 Gbps GDDR6 显存的 4 倍。在Infinity Cache的带动下,512GB/s带宽的RX 6900 XT的性能表现足以媲美936GB/s带宽的RTX 3090。
4、Fidelity FX超分辨率抗锯齿技术
针对NVIDIA DLSS深度学习超采样抗锯齿技术,AMD也提出了超分辨率(FidelityFX Super Resolution),简称FSR。目前这个技术正在开发中,不久之后会在新驱动中提供支持
历代AMD显卡在ROP单元数量上都非常保守,最顶级型号的GPU最多就只有64个ROP。这一次AMD非常的激进,RX 6800 XT直接就配备了128个ROP,也是GPU历史上第一款拥有128个ROP的显卡。
二、RX 6800 XT图赏:2.5槽厚度 整块均热板散热
第一次采用三风扇设计的AMD公版显卡。
顶部视角图,双8pin供电接口。
“RADEON”LOGO通电后可以发光。
公版在散热方面不计成本,没有用热管取而代之的是大面积的均热板,整个面板就是一个大均热板。
显存以及MosFET部分也贴有导热垫。
PCB裸照,15+2相供电电路设计,理论上应付500W的功耗都没问题。
供电电路的钽电容在PCB板背面。
背部的钽电容以及CPU背面高密度的MLCC电容。
Navi 21 GPU核心,芯片面积519mm2,268亿个晶体管。
旁边是三星GDDR6显存颗粒,频率16GHz,单颗容量2GB,一共8颗组成256Bit 16GB,显存带宽达到了512GB/s。
三、RX 6800图赏:与RX 6800 XT的差别只在于厚度
外观与RX 6800 XT一样,同样是3个风扇。
全尺寸的金属背面。
底部视角图。
顶部视角图,同样也是双8Pin供电接口,不过显卡比RX 6800 XT薄不少,一个是2.5槽,一个是2槽。
顶部的“RADEON”LOGO不能发光。
2个DP1.4、1个HDMI 2.1以及Type-C接口。
与RX 6800 XT一样,同样也是整块均热板设计,没有热管。
PCB板与RX 6800 XT长得一模一样,同样也是17相供电电路,应对250W TDP的RX 6800有些大材小用。
GPU核心周围有8颗三星GDDR6显存,总容量16GB,频率16GHz,带宽512GB/s。
供电电路的钽电容也在PCB板背面。
四、测试平台:i9-10900K + 锐龙9 5900X双平台
测试平台如下:
处理器选择了i9-10900K和锐龙9 5900X。其中i9-10900K超频到了全核心5.2GHz,锐龙9 5900X是默频使用。
想要测试Smart Access Memory (SAM)显存智取技术必须3A平台。
微星MEG X570 GODLIKE超神板主板是微星在AM4平台最为顶级的主板,采用EATX板型构造,8+8Pin供电接口,18相供电电路设计,可以为处理器提供超过千瓦的供电功率。
最关键的是,X570 GODLIKE超神板最新的BIOS可以完美支持4200MHz频率的内存。
芝奇皇家戟F4-4000C15D 8GBx4套装,不仅拥有4000MHz的频率,15-16-16-36的时序也是低的吓人,比绝大部分3000MHz频率的内存都要低,不过默认电压1.5V也算是比较高的了。
长江存储致钛PC005 Active 512GB SSD,顺序读写速度分别为3500MB/s,2900MB/s。不依赖模拟SLC缓存也能保持550MB/s的稳定写入速度,同时寿命远远高于市面上绝大多数TLC SSD。
酷冷至尊P360 ARGB水冷散热器,应该是市面上颜值最高也最易安装的水冷散热器,可以很轻松的压制5.2GHz的i9-10900K处理器。
XPG CORE REACTOR 850 GOLD电源,全模块化设计,单路12V输出电流70.8A,12V输出功率达到了850W。
120mm FDB液体动态轴承风扇。
华硕玩家国度PG27UQ ROG 27英寸IPS电竞显示器。
4K UHD(3840*2160)分辨率、4ms响应时间、144Hz刷新率、G-Sync 技术、IPS+量子点面板、10bit色彩、DisPlay HDR1000认证。依旧是目前市面上顶级的电竞显示器。
五、理论性能测试:3DMark比RTX 3090还强 默认运行频率可达2.45GHz
以下数据都是在[email protected]平台上测得,Smart Access Memory (SAM)显存智取技术会在锐龙9 5900X平台上另行测试。
1、3DMark
首先是RX 6800,在2K分辨率3DMark Fire Strike Extreme测试中,RX 6800图形分数达到了21472分,核心温度最高69℃,核心运行最高频率为2237MHz,显卡最大功耗达到了205W。
在3DMark Fire Strike Ultra测试中,RX 6800图形分数为10551分,核心温度最高68℃,核心运行最高频率为2238MHz,显卡最大功耗达到了206W。
接着是RX 6800 XT!
在2K分辨率3DMark Fire Strike Extreme测试中,RX 6800 XT的图形分数达到了25438分,核心温度最高72℃,核心运行最高频率为2441MHz,显卡最大功耗达到了281W。
在3DMark Fire Strike Ultra测试中,RX 6800图形分数为12598分,核心温度最高75℃,核心运行最高频率为2445MHz,显卡最大功耗达到了280W。
3DMark Fire Strike的测试,RX 6800 XT的分数创了记录,2K分辨率下的图形分数达到了25438,比RTX 3090还要高9%,不过4K分辨率下领先优势降到了4%。
而RX 6800同样可以越级,不论是2K还是4K分辨率的图形分数都与RTX 3080相当。相比RTX 3070,可以领先25%左右。
2、3DMark Time Spy
在2K分辨率3DMark Time Spy测试中,RX 6800图形分数达到了15099分,核心温度最高68℃,核心运行最高频率为2225MHz,显卡最大功耗达到了243W。
在4K分辨率3DMark Time Spy Extreme测试中,RX 6800图形分数为7146分,核心温度最高69℃,核心运行最高频率为2225MHz,显卡最大功耗达到了218W。
接下来是RX 6800 XT!在2K分辨率3DMark Time Spy测试中,RX 6800 XT图形分数达到了17871分,核心温度最高74℃,核心运行最高频率为2313MHz,显卡最大功耗达到了265W。
在2K分辨率3DMark Time Spy Extreme测试中,RX 6800图形分数为8487分,核心温度最高78℃,核心运行最高频率为2434MHz,显卡最大功耗达到了314W。
3DMark Time Spy的分数比较贴近于实际表现,在2K分辨率下RX 6800 XT比RTX 3080快了1%,4K则被反超了4%。
RX 6800的情况要好一些,2K分辨率下比RTX 3070快了10%,4K分辨率下也有6%的优势。
六、2K游戏测试:RX 6800碾压RTX 3070, RX 6800 XT比RTX 3080快1%
1、APEX英雄
2、使命召唤16:战区
3、GTA V
4、刺客信条:奥德赛
5、德军总部:新血脉
6、地平线:零之曙光
7、孤岛惊魂5
8、古墓丽影:暗影
9、绝地求生
10、微软模拟飞行2020
11、死亡搁浅
12、巫师3
13、无主之地3
14、战地5
15、战争机器5
RX 6800/6800 XT这样的显卡应该不会有多少人会在1080P分辨率下进行游戏,不过我们还是测试了他们在1080P下的帧率,数据汇总如下:
在1080P分辨率下,RX 6800 XT的表现非常接近RTX 3090,比RTX 3080则快了3%。
RX 6800比RTX 3070也快了8%。
2K分辨率下,RX 6800 XT的领先优势有点缩小,比RTX 3080只快了1%。RX 6800相比RTX 3070领先优势从1080P的8%提升到了11%。
七、4K游戏测试:RX 6800 XT被反超 RX 6800依旧有9%的优势
1、APEX英雄
2、使命召唤16:战区
3、GTA V
4、刺客信条:奥德赛
5、德军总部:新血脉
6、地平线:零之曙光
7、孤岛惊魂5
8、古墓丽影:暗影
9、绝地求生
10、微软模拟飞行2020
11、死亡搁浅
12、巫师3
13、无主之地3
14、战地5
15、战争机器5
4K分辨率更需求显存带宽,此时RTX 3080已经反超了RX 6800 XT,领先幅度达到了4%。
RX 6800表现尚可,依旧比RTX 3070快了9%。
八、3A平台免费的午餐:SAM技术可以让默频锐龙9 5900X超越5.2GHz的i9-10900K
在游戏运行的时候,CPU是不能一次性访问全部显存的,比如RTX 3090有24GB显存,而CPU只能访问其中的256MB。于是有大量数据会回到内存后给CPU处理器完成,再转移到显存,此时不仅浪费了带宽也造成了无谓的资源浪费。
Smart Access Memory (SAM)可以让搭载AMD 500系列芯片组在搭载Zen3 CPU和RDNA2 GPU的时候,让Zen3 CPU可以完整访问全部显存,而且带宽还是PCIe 4.0的速度,理论上最多可以让游戏性能提升13%。
要开启Smart Access Memory (SAM),需要将主板的BIOS更新到最新的版本,在新BIOS中启用Above 4G Decode、Re-Size BAR Support这2个选项就行了。
下面我们在微星X570 GODLIKE超神板和锐龙9 5900X平台上测试Smart Access Memory (SAM)技术带来的提升。
1、刺客信条:奥德赛
在《刺客信条:奥德赛》中,开启SAM之后,在1080P分辨率下的提升比较明显,达到了5%,2K只有2%的提升,4K干脆没有。
2、德军总部:新血脉
这个游戏很奇怪,开启SAM技术之后,1080P分辨率下的帧率竟然出现了大幅度的下降。
不过2K分辨率下提升了3%,4K分辨率也有4%的帧率提升。
3、地平线:零之曙光
在开启SAM之后,1080P和2K分辨率的帧率完全没变,4K分辨率下帧率倒是提升了4%。
4、孤岛惊魂5
这个游戏开启SAM后没有任何影响。
5、古墓丽影:暗影
在《古墓丽影:暗影》中,开启SAM技术之后,3个分辨率下都有明显提升,1080P下提升了3%,2K分辨率下帧率提升了5%,4K分辨率时也有4%的提升。
6、绝地求生
在《绝地求生》中,开启SAM也没有太明显的改善。
7、死亡搁浅
开启SAM技术之后,《死亡搁浅》在4K分辨率下有了4%的提升,其他2个分辨率帧率的差异可以看成是误差。
8、巫师3
《巫师3》中,启用SAM技术之后,3个分辨率下均有1%的帧率提升。
9、战地5
《战地5》中,开启SAM技术带来的性能提升非常显著,特别是2K分辨率下可以一直有200FPS的满帧运行,4K分辨率下的帧率提升也达到了5%。
10、战争机器5
《战争机器5》是我们测试的游戏中,开启SAM技术后受益最大的。在1080P分辨率下提升幅度达到了12%,2K分辨率下也有8%的提升,4K分辨率的提升是4%。
首先注意一点,锐龙9 5900X的游戏性能比i9-10900K稍有不如是因为后者超频到了全核5.2GHz,而前者是默频状态。
在开启SAM技术之后,2K与4K分辨率下,RX 6800 XT的帧率都有3%的提升,而此时默频的锐龙9 5900X的游戏帧率已经超越了超频到5.2GHz的i9-10900K。
1080P分辨率下由于《德军总部:新血脉》的帧率下降了7%,导致开启SAM技术之后整体性能提升只有1%。
九、超频测试:RX 6800可以达到2.5GHz、RTX 6800 XT能上2.65GHz
1、RX 6800 XT超频测试
首先是RX 6800 XT,最新版的AMD的驱动中心优化了超频设置,可以选择手动、自动欠压GPU、自动超频GPU、自动超频显存。
我们将RX 6800 XT核心频率拉到2615MHz,显存频率超频到2150MHz(等效17.2GHz),再把功耗上限也提升15%。
最终在3DMark Fire Strike Extreme中,超频后的RX 6800 XT拿到了26627分,比默频高了1200分,提升幅度约为5%。在运行中,最高频率可达2635MHz,最高温度75度,最高功耗300W。
同时我们也测试了超频后的显卡在《古墓丽影:暗影》中的表现。
在2560*1440分辨率时,开启最高特效,超频后的RX 6800 XT在《古墓丽影:暗影》中测试帧率达到了1588FPS,相比默频的149FPS提升了9帧,提升幅度达到了6%。另外在运行游戏的过程中,GPU的最高频率达到了2657MHz。
超频后,也能用过FurMark烤机测试,烤机8分钟,GPU温度控制在77度,Hot Spot达到了103度(110度温度墙),烤机功耗300W左右。
2、RX 6800超频测试
RX 6800的最高电压只有1.025V,而RX 6800 XT的最高电压可以达到1.15V,因此在超频方面,RX 6800还是有一些差距。最终我们将加速频率直接拉到了2500MHz,比默频提升了将近400MHz;显存频率超频到了2140MHz(等效17.1GHz)带宽达到了547GB/s。
在3DMark Fire Strike Extreme测试中,超频后的RX 6800图形得分为23458,比默频的21472高了将近2000分,提升幅度接近10%。最高运行频率2497MHz,最高温度62度,最高风扇转速1665RP,,最高功耗244W。
十、温度与功耗测试:游戏功耗偏高 RX 6800烤机仅68度
1、功耗测试
在GCN年代,AMD显卡的功耗一度令人绝望,不过从RDNA构架开始,AMD的独门绝技可以在待机状态下将GPU和显存频率都降到个位数,待机功耗要比同期的NVIDIA GPU低不少。
可以看到在待机状态下,RX 6800 XT的GPU频率竟然只有0MHz(不知道是否显示错误),显存频率也只有20MHz,GPU待机功耗是6~7W。
我们分别测试待机、游戏以及FurMark的功耗表现,测试所用的电源为XPG CORE REACTOR 850 GOLD电源。
我们的i9-10900K平台进行了超频,因此其功耗会较默频时高一些。
待机功耗自然是RDNA2构架的2块显卡更低,RX 6800与RX 6800 XT都不到90W,比NVIDIA GPU低5W左右。
在进行FurMark烤机时,RX 6800的功耗比RTX 2080 Ti低30W,比RTX 3070高20W。RX 6800 XT的烤机功耗达到了460W,比RTX 3080低5W左右。
不过在运行游戏时,2块RDNA2 GPU的功耗都有点偏高,其中RX 6800 XT竟然比RX 3080还要高16W,而RX 6800的游戏功耗也超越了RTX 2080 Ti。
2、温度测试
这里我们只对RX 6800/6800 XT进行温度测试,测试时室温24度。
Furmark的参数设定为1920*1080分辨率、0AA。运行7分钟之后,RX 6800的温度稳定在68度,Hot Sport温度是90度(这个没到110度都不用怕),运行频率则为2013Hz,GPU功耗203W。
至于RX 6800 XT,在运行FurMark 8分钟之后,温度稳定在74度,Hot Sport温度是94度,运行频,2039MHz,风扇转速1520RPM。
十一、光线追踪性能测试:RDNA2的效率暂不及安培GPU
NVIDIA的GPU有专门的RT Core,用来计算光线,AMD的实时光线追踪方案与NVIDIA不同,是将Ray Accelerator单元集成到了RDNA2的CU之中,每个CU配一个Ray Accelerator单元。
由于DXR技术已经被整合到了DIRECTX 12之中,因此只要是采用DIRECTX 12接口的实时光线追踪游戏,AMD的RDNA2 GPU都能在游戏中启用DXR技术。比如《战地5》、《古墓丽影:暗影》、《地铁:离去》、《控制》、《使命召唤16》、《德军总部:新血脉》、《堡垒之夜》、《看门狗:军团》等等游戏RDNA2 GPU都支持开启光追。
以下测试均是在4K分辨率下运行,并开启最高画质。
1、堡垒之夜
至于测试场景,为了尽量避免变量干扰,我们选择了嗨皮岛的一个单人场景进行测试。
AMD显卡在堡垒之夜中的表现要强于NVIDIA显卡,RX 6800 XT开启光线追踪之后,帧率依然有34FPS,而RTX 3080只有22FPS。RX 6800开启光追之后,帧率几乎是RTX 3070的2倍。
2、古墓丽影:暗影
RX 6800 XT在4K分辨率下开启光线追踪之后,帧率只有42FPS。
RX 6800更是只有30FPS。
在《古墓丽影:暗影》中,RX 6800 XT在开启DXR技术之后,帧率从80FPS掉到了42FPS,下降幅度超过了接近50%;而RX 6800则直接从71FPS掉到了30FPS,降幅接近6成。
相比之下,2块NVIDIA GPU表现要好一些,RTX 3080开启DXR之后帧率下降了40%,RTX 3070同样也是跌了40%。
3、控制
不开启DXR时,RX 6800 XT的帧率为56FPS。
开启DXR技术之后,地面以及墙壁上产生了非常真实的光影效果,同时画面看上也去更加明亮。不过代价就是帧率跌到了26FPS,下降了一半还多。
2款RDNA2 GPU在开启光追技术之后,帧率都下降了50%以上,而2块安培GPU的帧率只下降了40%。
十二、总结:RDNA2只是开始 还远未发挥最强的性能
2020年,AMD带给了我们足够多的惊喜!在CPU领域Zen3处理器时隔15年终于从Intel手中抢回了最强游戏处理器的宝座。
而在GPU领域,RDNA2的发布也迫使NIADIA一再改变原有了GPU规划,20GB的RTX 3080被取消了,取而代之的是更强的RTX 3080 Ti。RTX 3070 Ti也被取消了,因为再怎么折腾也无法战胜RX 6800。RTX 3070、RTX3060 Ti都推迟上市,RTX 3060据说更是会有12GB显存,反而高于RTX 3080。
作为消费者,真的是很乐意看到这样的竞争!
下面长话短说,将测试结果汇总如下:
1、游戏性能
在任何分辨率下,RX 6800都要领先于RTX 3070!1080P分辨率下的优势是8%,2K可以领先11%,4K依旧有9%。
RX 6800 XT在低分辨率下有优势,1080P比RTX 3080快4%,2K分辨率时只有1%的优势,到了4K分辨率时被反超了4%。显存带宽还是很重要的!
当然这里说的都是基于Intel平台的测试结论,如果换到AMD平台会有一些差别。
2、Smart Access Memory (SAM)显存智取技术
前提是必须3A平台,包括AMD 500主板、Zen3 CPU、RDNA2 GPU。
在开启SAM技术之后,RX 6800 XT在2K和4K分辨率下能够有3%的提升,超过RTX 3080已经不是太大的问题!与此同时默频的锐龙9 5900X的游戏性能超越了超频到全核5.2GHz的i9-10900K。
另外有部分游戏在1080P分辨率下开启SAM技术之后帧率有降低的情况,还需要BIOS与驱动的继续完善,后续SAM技术带来的性能提升会远远不止3%。
3、功耗
待机功耗很低,烤机功耗正常,游戏功耗偏高。
在运行游戏时,TDP 300W的 RX 6800 XT的整机功耗比320W TDP的RTX 3080还要高20W左右,RTX 3070的功耗也比RTX 2080 Ti高6-10W。
4、超频
RTX 3080的超频能力简直就是一言难尽,本身的加速频率并没有多高,40MHz的超频幅度简直连鸡肋都算不上。
RX 6800的默认加速频率2105MHz,实际运行频率可以达到2250MHz,超频则能上2500MHz,超频后性能提升10%以上。
RX 6800 XT默认加速频率2250MHz,实际运行频率可以达到2450MHz,超频之后可以到2650MHz。
在频率方面,新一代的RDNA2 GPU对NVIDIA的Ampere GPU简直就是碾压性的优势。由于频率可控空间更大,RX 6800/6800 XT的非公版也非常值得期待。
5、光线追踪
RDNA 2支持硬件加速光追,不是软件模拟。总的来说目前RDNA2 GPU中的Ray Accelerator单元的效率暂时不及N卡的RT Core,但是差距并不大。当初NVIDIA的RTX技术在发布之初同样也是断崖式的帧率降低,经过了2年多的优化才有现在的成果。
相信经过后续的优化,Ray Accelerator单元的效能会有改善。
6、Fidelity FX超分辨率抗锯齿技术
RNDA2不支持DLSS有点遗憾,不过AMD也在开发类似的技术--Fidelity FX超分辨率抗锯齿!这个功能目前正在开发中,不久之后会在新驱动中提供支持,敬请期待!