进军顶级显卡市场,AMD Radeon RX 6900XT首发评测
在高端显卡领域蛰伏多年的AMD终于凭借RX 6800XT显卡重返高端消费级显卡市场,从我们的评测结果来看,这款显卡的确拥有不小的市场竞争力。不过AMD并未止步于此,优化的RDNA 2架构、增强计算规模的NAVI 21核心,以及无限缓存等核心技术的加持,让AMD有能力冲击更高的显卡领域,AMD Radeon RX 6900XT(下文简称RX 6900XT)就是他们打开顶级显卡市场的敲门砖。今晚10点,这款显卡的评测内容终于解禁,我们也已经完成了这款显卡的详细评测工作,下面就请跟随本文来看看RX 6900XT的性能究竟有多强,它是否能给NVIDIA带来足够的压力。
AMD Radeon RX 6900XT技术解析
在这个信息大爆炸的时代,我们每天都要通过各种途径接收大量信息,如果你已经记不太清RDNA 2架构、NAVI 21核心或者无限缓存等技术的详细内容,其实也完全情有可原。因此,我们不妨首先来简单了解一下RX 6900XT的核心技术,如果你想详细了解其技术内容,不妨移步《高端显卡市场争夺战打响!AMD Radeon RX 6800 XT & RX 6800显卡首发评测》一文,这里有RDNA 2架构的详细解析内容,应该能够满足你的好奇心。
RNDA 2架构是一个基于RDNA改进、扩张和加入了大量全新功能的架构,它的规模更大、性能更强,同时拥有时下流行的光线追踪、VRS等高级功能,还提供了对DirectX 12终极版本的全面支持。凭借RDNA 2,AMD在图形计算市场上基本能够和竞争对手站在同一高度,同时也有了能力推出更具有竞争力的产品。根据AMD的描述,RDNA 2是一个面向游戏设计的架构,它带来了三个方面的技术优势,一是更为出色的功率效率和更高的频率,二是全新设计的无限缓存带来的GPU技术突破,三是大量高级技术包括硬件光线追踪技术的支持。不仅如此,AMD还大幅度提升了RDNA 2架构的性能功耗比。根据AMD的数据,在相同的频率下,RDNA 2消耗的功耗只有RDNA的0.5倍,在相同的功耗下,RDNA 2架构能达到的频率是RDNA架构的1.3倍。
🔺AMD RDNA 2架构简图
需要注意的是,RDNA和RDNA 2的所有产品采用的是台积电的7nm工艺,虽然在不断的工艺发展和生产过程中,台积电会对后期工艺进行优化,但是仅凭优化一般很难达到功耗降低一半、频率提升30%这样的效果的,因此RDNA 2拥有现在的优势主要还是来自于其架构的设计。另外,AMD还特别提到,RDNA 2的高频率和AMD目前在CPU中的设计经验的引入相关,AMD宣称在新的GPU设计和制造过程中使用了大量在CPU设计中曾使用到的技术或者经验,再加上优化过的微架构,最终实现了本代GPU超过2GHz的运行频率以及较低的功耗。
🔺RDNA 2的性能功耗比大幅度提升
RDNA 2架构的NAVI 21核心(也就是此前网友们盛传的“Big NAVI”)在宏观上可以看做NAVI 10核心的扩大版本——后者拥有2个渲染引擎(Shader Enigne),每个渲染引擎包含了10个双CU单元,所以总计拥有2560个流处理器单元,而NAVI 21核心拥有4个渲染引擎,所以内部计算资源均相对NAVI 10翻倍(例如NAVI 21拥有80个CU单元和5120个流处理单元)。
🔺RDNA的CU单元,AMD在RDNA 2上基本维持了之前的CU结构,但是在电源和功耗方面做出了重大改进。
下面我们继续深入探究RDNA 2的CU单元的技术亮点。在NAVI 21核心上,AMD保留了之前的双CU架构,也就是一个双CU单元包含了两个CU,每组CU分别可以执行两个SIMD 32指令,同时对应这种变化,CU单元的分发前端也改成了Wave 32,1个双CU单元就有两个Wave 32指令分发单元,在遇到SIMD 64指令的情况下还可以合并为Wave 64进行分发,这一点和之前的NAVI 10完全相同。不过,AMD宣称在RDNA 2上对CU单元内2个SIMD 32计算负荷平衡方面进行了优化,以提高计算效能,但是AMD没有给出更多信息。
值得一提的是,虽然在计算端RDNA 2的CU单元在设计上和RDNA基本相同,但是AMD还是为RDNA 2架构的CU单元加入了大量电源管理方面的内容,以尽可能提升GPU的性能功耗比。AMD宣称其加入了更多细粒度的门控时钟设计,能够更加精确的控制CU单元的电压和频率。并且AMD还重新设计了CU的数据路径(配合无限缓存),以减少在数据传输存取过程中所消耗的能量。另外,AMD在RDNA 2架构上正式支持了硬件光线追踪加速,并且为每个CU单元配备了1个光线追踪单元RA(Ray Accelerator),后文将对这项技术进行深入解析。
🔺AMD在RDNA 2架构上正式支持了硬件光线追踪加速,所以RX 6900XT显卡同样可以运行“光追游戏”。
除了基本计算架构外,RDNA 2在缓存体系上相比RDNA做出了重大改进。基于RDNA架构的GPU其缓存体系包含了4个级别,分别是L0、L1和L2,以及显存控制器单元,而RDNA 2的缓存体系添加了额外的层级。如今,RDNA 2拥有L0、L1、L2和无限缓存(Infinity Cache)、显存控制单元5个层级。其中无限缓存是全新加入的大容量缓存,其容量高达128MB,根据AMD的架构图来看,无限缓存被分为4个区块,每个区块为32MB,这个数量和4个渲染引擎、4个显存控制器是相互对应的。在缓存连接方面,AMD使用运行在1.94GHz的、16x64Bit(1024Bit/时钟周期)的Infinity Fabric总线连接缓存和RDNA 2的引擎,AMD宣称这个总线的带宽的峰值是256bit GDDR6显存的4倍。
🔺RDNA架构的缓存体系,由L0、L1和L2,以及显存控制器单元组成。
🔺RDNA 2架构的缓存体系的最大变化是加入了无限缓存
那么AMD使用如此巨量缓存的收益是什么呢?性能功耗比方面,高速缓存往往会大幅度降低VRAM读取的频次,毕竟大量的数据能够存放在本地缓存中,这里也涉及到数据命中率的概念,因此可以有效地提高GPU整体的能效比。此外,较大的缓存的另外一个好处是允许厂商使用较小的DRAM芯片或者较少的内存控制器模块来配置一个相对较小的存储系统。比如AMD在NAVI 21上就配备了256bit的GDDR6显存系统,而不是像GTX 3090那样使用384bit的显存系统那样。
相比之下,256bit的显存系统在晶体管占用和能耗上要明显小于384bit的系统——AMD给出的数据显示,具有无限缓存的256bit显存系统相比传统的384bit显存系统,在能够提供2.17倍于后者峰值带宽的情况下,仅消耗后者90%的功耗,有着惊人的效果。
性能方面,AMD宣称无限缓存的能够改善GPU在每个时钟周期内完成的实际工作量或性能,这里AMD所指的应该是提高GPU的数据命中率,而不是像传统GPU那样等待数据从VRAM中取出,这和前文在性能功耗比方面的描述是一致的,而AMD数据显示无限缓存带来了34%的延迟降低。另外,AMD还宣称在光线追踪计算中,BVH相关的遍历数据会存放在无限缓存中,这也是AMD设计的硬件光线追踪加速的重要组成部分。
🔺无限缓存带来的三大优势
在RDNA 2上,AMD宣布带来了硬件光线追踪、2级VRS可变速率阴影、Mesh渲染(Mesh Shaders)以及采样器反馈(Sample Feedback)四大DirectX 12高级功能。其中最受关注的是光线追踪,VRS和Mesh渲染带来了性能上的提升,但是对最终用户来说可能没那么有吸引力。采样器反馈则能够是的开发人员更好的了解正在使用的纹理和以及相关元素块,这样能够更好的管理显存的使用和需要预加载的数据等。
🔺RDNA 2架构提供了对微软DirectX 12 Ultimate版本的支持
正如前文所说,RDNA 2架构的每个CU单元配备了1个光线追踪单元,从而在硬件层面支持光线追踪技术。AMD的资料显示,RA单元的光线追踪交叉性能是传统软件执行的10倍,更具体的数据显示RDNA 2架构的GPU在微软DXR SDK的Procedural Geometry的测试中带来了471fps的成绩,在软件模拟下只有34fps,所以性能达到了软件的13.8倍。另外,RDNA 2目前还可以支持DirecStorage API,这项功能之前在NVIDIA的RTX 30系列GPU上也出现过,其主要用途是使用GPU直接解压缩游戏数据,从而绕开了效率较低的CPU,带来了更好的使用体验和更少的等待时间,对游戏玩家来说是非常友好的。
除了架构、缓存等硬件方面的增强和优化之外,AMD还在这一代显卡上推出了三大特色功能。首先则是Rage Mode,简单可以理解为“自动超频”或者“狂暴模式”,这个功能目前仅支持Radeon RX 6900XT和Radeon RX 6800XT两款产品。在这个模式下,驱动和配套软件会寻找GPU是否还有性能提升的空间,并通过不断的提升GPU频率来获得更高的性能。
🔺AMD加入了新的Rage Mode技术,可以实现显卡自动超频。
Smart Access Memory(显存智取技术)是RDNA 2架构的另一大亮点,根据AMD目前的资料,在启用了这个功能后,CPU端(锐龙5000系列)可以直接通过PCIe 4.0总线访问GPU的全部本地显存,所以CPU就可以直接调用GPU的数据而不需要等待GPU转发。
根据AMD的描述,这项功能在不同的4K游戏中可以带来大约5%~11%的性能提升,平均带来了6%的性能提升。这项功能可以在BIOS中开启并自动运作,不需要用户操作。在AMD的数据对比中,通过Rage Mode和Smart Access Memory的联合应用,能够为显卡带来少则4%,最多则13%的性能提升,尤其是AMD的数据显示,在启用了这两个功能后,Radeon RX 6900XT能略微胜出NVIDIA的RTX 3090。
🔺Smart Access Memory技术能给RX 6900XT带来非常可观的性能提升
在RDNA 2的发布会上,AMD展示了FidelityFX中的一个新功能,那就是超级分辨率(Super Resolution)。超级分辨率可以通过AMD的GPU将较低分辨率的原始图像进行插值、锐化或者引入AI技术等,升格为较高分辨率的图像。和这个功能比较类似的就是NVIDIA的DLSS技术。具体来说,超级分辨率能够在性能和图形画质之间提供一个平衡,尤其是在支持光线追踪、高分辨率的游戏运行时,超分辨率技术能够带来更高的帧数和近似全尺寸分辨率的画质,大幅度提高游戏的可玩性。
目前FidelityFX超级分辨率功能还没有上线,因此RX 6000系列用户短期内还无法使用这个技术。但是一旦这个技术开发完成,AMD就会将其像其他所有的FidelityFX内技术一样,在GPUOpen平台上开源发布,并且AMD还明确指出超级分辨率技术是跨平台的,其实现难度较DLSS更低,并且更容易访问和控制,也更容易在更多游戏中实现。
🔺超级分辨率技术能够提升游戏画面的分辨率
RX 6900XT同样搭载RDNA 2架构的NAVI 21核心,但在计算规模上明显增强。例如RX 6900XT的晶体管数量达到268亿个,而RX 6800XT的晶体管数量则为230亿个。更为重要的是RX 6900XT的CU单元比RX 6800XT多8个,所以前者的光线追踪计算单元也多8个,同时流处理器数量多512个。而在GPU频率、显存类型和容量、显存带宽和TDP这几个方面,RX 6900XT和RX 6800XT则基本保持一致。因此,从规格参数来看,RX 6900XT的纸面性能应该要比RX 6800XT稍强一些,但具体强多少呢,相信测试成绩能告诉我们答案。
🔺RX 6900XT规格亮点一览
AMD Radeon RX 6900XT鉴赏及性能测试
RX 6900XT采用了和RX 6800XT相同的外观设计,其整体造型比较硬派,而且黑色、银色和红色的色彩搭配也是比较经典的游戏显卡配色。细节方面,RX 6900XT同样配备3个散热风扇,可以保护PCB板并提升显卡强度的一体式金属背板也没有落下。此外,显卡顶部的Logo下还隐藏了LED灯,开机之后可透出AMD Radeon系列显卡标志性的红色光芒。
🔺RX 6900XT顶部的Logo下隐藏LED灯,开机之后可透出红色灯效。
在RX 6800XT显卡的首发评测中我们详细对比了它和RX 6800在外观上的差别,其中一点就是RX 6800XT顶部的Logo采用的是白色导光材质,而RX 6800则采用的是红色导光材质,当时我们猜测RX 6800XT可能支持RGB LED灯效。果然,顶部Logo同样采用白色导光材质的RX 6900XT可通过软件控制其灯效模式和灯光色彩,实现当下主流的RGB灯效。
🔺玩家可通过灯效控制软件调节RX 6900XT顶部Logo的灯光色彩和灯效模式,实现当下主流的RGB灯效。
🔺RX 6900XT灯效鉴赏
🔺这款显卡采用双8Pin供电设计
🔺RX 6900XT的视频输出面板上设计了两个DP接口、1个HDMI接口和1个USB-C接口
🔺RX 6900XT同样配备3个散热风扇
🔺这款显卡的一体式金属背板可保护PCB板上的元器件,同时起到提升显卡强度的作用。
🔺RX 6900XT也采用了和RX 6800XT相同的散热设计,其GPU和显存部分均配备纯铜散热底座,显存和重要芯片也配备散热贴片进行降温处理。
🔺RX 6900XT采用14层PCB设计
🔺RX 6900XT的GPU芯片面积为519平方毫米,拥有268亿个晶体管和5120个流处理器,频率为2015~2250MHz。
🔺RX 6900XT搭载的是来自三星的GDDR6显存,总显存容量为16GB。
🔺RX 6900XT采用16相供电设计,每相供电电路均配备IR TDA21472 MOSFET和封闭式电感等元器件。
GPU:NAVI 21
计算单元数:80个
流处理器数:5120个
光线追踪单元数:80个
核心游戏频率:2015MHz
核心超频频率:2250MHz
显存容量:16GB GDDR6
显存速率:16Gbps
高速缓存容量:128MB
供电接口:双8Pin
视频输出接口:DP×2,HDMI×1,USB-C×1
参考价格:7999元
前文中我们提到,RX 6900XT主要是在流处理器数量上领先RX 6800XT,而核心频率和显存规格则保持一致,所以我们认为RX 6900XT在理论性能上应该能小胜RX 6800XT。不过相比靠经验推测,测试成绩明显更具说服力,所以在测试环节中,我们会把RX 6800XT纳入对比显卡的行列中。
我们知道RX 6900XT的对标产品是来自NVIDIA的RTX 3090,相信不少玩家也非常好奇RX 6900XT的实际性能和RTX 3090相比到底谁强谁弱。于是我们也将NVIDIA GeForce RTX 3090 FE(下文简称:RTX 3090 FE)作为对比显卡之一,从而给大家一个准确的答案。除此之外,狂暴模式和SAM功能是RX 6900XT的一大亮点,我们也比较好奇它们究竟能给RX 6900XT带来多大的性能提升,所以我们也将对此进行测试。
🔺RX 6900XT的GPU-Z截图
显卡:AMD Radeon RX 6900XT
AMD Radeon RX 6800XT
NVIDIA GeForce RTX 3090 FE
处理器:AMD锐龙 9 5950X
内存:DDR4 3200 32GB双通道
主板:ROG CROSSHAIR VIII DARK HERO
电源:ROG THOR 1200W
前文中我们提到,RX 6900XT和RX 6800XT的GPU频率和显存规格保持一致,它们在规格上的主要区别是RX 6900XT多了512个流处理器单元,以及8个光线追踪单元,这两方面的提升在3DMark的测试成绩上有所体现——RX 6900XT的显卡总分均小幅领先RX 6800XT。
与RTX 3090的对比方面,RX 6900XT在Fire Strike、Fire Strike Extreme和Fire Strike Ultra这3个场景中的显卡分数保持领先,但在剩下3个测试场景中落后于RTX 3090,特别是在测试显卡光线追踪性能的Port Royal场景中,RTX 3090 FE的领先幅度高达28%,看来NVIDIA的第二代RT Core实力不容小觑。
游戏性能的实测成绩我们不妨同样从RX 6900XT对比RX 6800XT,以及RX 6900XT对比RTX 3090 FE这两个部分来分析。首先在RX 6900XT对比RX 6800XT方面,总体来看拥有更多流处理器的RX 6900XT在综合性能上仍然领先RX 6800XT约4%,但前者并没有保持全胜战绩,运行部分游戏的平均帧率落后RX 6800XT约2%。而在和RTX 3090 FE的较量中,RX 6900XT的综合性能落后前者约6%。并且仅在运行《尘埃5》《刺客信条:英灵殿》时的平均帧率高于RTX 3090 FE,运行其十余款参测游戏的平均帧率则有不同程度的落后。
在光线追踪性能测试部分,我们挑选了《看门狗:军团》《控制》《战地5》等游戏来考察RX 6900XT的表现。需要说明的是,在测试中我们统一关闭AMD SAM和NVIDIA DLSS功能,以保证测试成绩的可对比性。从我们的测试结果来看,RX 6900XT运行这部分参测游戏的平均帧率领先RX 6800XT约2%,同时明显落后于RTX 3090 FE。例如在开启光线追踪之后,RTX 3090 FE在4K分辨率下运行《控制》的平均帧率为42fps,而RX 6900XT在上述设定下运行这款游戏的平均帧率仅24fps,两者差距非常明显。
在RX 6900XT的技术解析中我们提到,AMD推出的SAM功能和狂暴模式可有效提升RX 6900XT的游戏性能,所以我们也非常好奇SAM+狂暴模式到底能给RX 6900XT带来多大的性能提升。于是我们挑选了《刺客信条:英灵殿》《极限竞速:地平线4》《无主之地3》这3款游戏,并分别在2.5K和4K分辨率下考察了RX 6900XT在同时开启SAM和狂暴模式后的游戏性能。
结果显示,参测游戏的平均帧率有非常明显的提升。例如在2.5K分辨率下,RX 6900XT运行《刺客信条:英灵殿》的平均帧率达到127fps,相比默认状态下的性能提升达41%。此外,开启SAM和狂暴模式后,RX 6900XT在4K分辨率下运行《极限竞速:地平线4》的平均帧率达到175fps,不仅在比默认状态下提升14%,同时还反超RTX 3090 FE。
综合来看,SAM+狂暴模式的确能给RX 6900XT带来比较可观的性能提升。通常情况下,如果玩家想要“免费”提升显卡性能,超频自然是首选,但对显卡进行手动超频需要足够的经验和耐心,同时也仍然存在损坏显卡的风险。相比手动超频,SAM+狂暴模式同样能给玩家带来非常明显的性能提升,而且操作简单,损坏显卡的风险也非常低,所以也更值得玩家们尝试。
我们在这部分测试中主要想考察RX 6900XT的散热性能和功耗,于是我们使用Furmark(1080p分辨率,关闭抗锯齿)对这款显卡进行了半个小时的烤机测试。结果显示,这款显卡在烤机半个小时之后的核心温度为81℃(室温约21℃),与RX 6800XT在相同测试环境下的核心温度相差不大。而在功耗方面,RX 6900XT在满载状态下测试平台的总功耗在465W左右,略高于RX 6800XT,所以我们也建议玩家们至少为这款显卡搭配额定功率在850W或更高的电源。
定位顶级游戏显卡市场,对标NVIDIA的RX 3090,或许不少玩家都对RX 6900XT在性能上的期待值都比较高。然而GPU频率和显存规格与RX6800XT保持一致,只是小幅提升GPU的流处理器数量和光线追踪单元数量,这让RX 6900XT的综合性能相比RX 6800XT仅有3%~4%的提升,所以RX 6900XT在实际性能上的表现难免会让不少玩家失望。不过好在开启SAM和狂暴模式之后,RX 6900XT的性能得到明显提升,这能在一定程度上达到部分玩家期待的水平,同时还是能在部分游戏性能上比肩NVIDIA的RTX 3090。
价格方面,RTX 3090 FE的售价是11999元,RX 6900XT的售价是7999元。我们认为,AMD或许并不是想要凭借RX 6900XT与NVIDIA在顶级游戏显卡领域一较高下,而是试图让RX 6900XT来填补RTX 3090和RTX 3080之间的性能断层,从而实现错位竞争。与此同时,AMD还通过SAM+狂暴模式来提升RX 6900XT的性能,使其性能可以达到可媲美RTX 3090的水平,从而在“秀肌肉”的同时,满足那些对RX 6900XT有较期待的玩家。
随着RX 6900XT正式上市,AMD和NVIDIA在消费级显卡市场的竞争也愈发激烈,综合这款显卡的性能和价格来看,它也有能力抢夺NVIDIA在顶级显卡的市场份额,那么NVIDIA将会如何应对呢?按照NVIDIA的一贯传统,他们应该会针对RX 6900XT推出一款相同定位的产品,这款产品有可能就是目前网上流传搭载20GB显存的RTX 3080。
那么精准的产品定位加上更加亲民的价格是否能让RX 6900XT在顶级游戏显卡市场一展身手,AMD能否凭借这款显卡争夺更多的消费级显卡市场份额,NVIDIA将会以怎样的方式予以还击,从而巩固自己在消费级显卡市场的领导地位呢,让我们拭目以待吧。