来了来了!拿到RTX 3080后,CG行业首个评测
“ 感知CG · 感触创意 · 感受艺术 · 感悟心灵 ”
中国很有影响力影视特效CG动画领域自媒体
本来想起个“第一个拿到RTX 3080后”题目,后来想想还是别装了,怎么可能比老黄还早?
其实在7月中旬就收到评测邀请了。当时也没怎么在意。一直到30系列卡发布前夕,才知道这次评测的重要性。
当时一直以为会给我们用RTX 3090做评测的,哈哈哈,但后来得知是RTX 3080,有那么一丢丢失望。但还是非常期待的,毕竟我属于那一小撮最先尝鲜的,很有优越感,哈哈哈。好了,我就不显呗了,怕大家扔鸡蛋和白菜根。
2号老黄发布,3号中午我就收到了。当时在外面忙,没有理会。回到公司的时候,看着包裹帖了个黄色的标签“Warning”,我就知道是它到了,激动半天,没赶拆包裹。
过了一会,终于小心翼翼划开包裹。
当当当~~~来吧,舞动!
过去1年中我们看到NVIDIA在CG领域动作频频,去年推出了NVIDIA Studio,以为设计师提供专用的高性能笔记本电脑、台式机和GPU。CG世界此前也做过好几篇NVIDIA Studio PC的试用采访文章。
越来越多的在线创作者和自由职业者依赖PC进行工作,并不断增加创作激情。过去一年里,NVIDIA与OEM和ISV合作伙伴合作,推出了超过80款RTX Studio笔记本电脑和台式机,为超过50创意和设计APP提供RTX GPU优化。这些GPU加速的PC和APP使超过4500万专业设计师能在有效时间内进行创作。
而这次RTX 30 系列 GPU 为 3D 渲染、AI 加速工作流程和视频编辑,乃至直播提供巨大的加速:
渲染方面
• 第二代RT Cores - 在顶级渲染器中提供2倍的性能提升,包括:Blender Cycles、Chaos V-Ray和Autodesk Arnold。
• 基于光线追踪的运动模糊渲染做了全新的硬件加速 -这是一种在产品级渲染中使用的常见技术,现在速度被提升了5倍。
• 高达24GB的显存,以处理复杂的3D项目和多应用工作流。
AI方面
• NVIDIA DLSS - AI超级分辨率技术提升了D5 渲染器等实时光线追踪可视化应用的帧率
• 第三代Tensor Core - , 以加速AI工作流程更为省时,如在Blender Cycles、Chaos V-Ray和Autodesk Arnold等3D渲染器中进行交互式视窗降噪,或在Davinci Resolve中,进行视频超分辨率和慢镜头。
Video方面
• PCIe Gen 4 - 将GPU和PC其他部分之间的连接速度提高一倍,对将大型、超高分辨率的HDR和RAW视频传输到GPU显存中特别有用。
• AV1解码 - 首款支持全新AV1解码器的独立GPU,让设计师仅需比以前少50%(5)的带宽回放高达8K HDR的视频,同时释放CPU去处理其他工作。
• 高达24GB的显存 - 在最苛刻的8K视频编辑和着色工作流程中使用多种特效时带来流畅的体验。
怀着对RTX30系列对CG软件优化的巨大好奇,我们迫不及待的开始首发测试。
对比测试说明:我们手里有RTX 2080 Ti,所以呢这次我们用RTX 3080和RTX 2080 Ti进行对比测试。
机器配置:
这是台新机器,刚配上三天,为了测试我们电脑里只安装了软件其他无用的软件都没有装。
测试的软件:
Vray独立版
D5渲染器
Blender
Redshift
Octane渲染器
有的同学会问,为什么只测这几个软件和渲染器呢?因为我们需要考虑软件对于最新显卡是否支持。比如我们在测Redshift的时候,一开始没注意版本问题,下载了2.6版本的,结果在3080卡上就白屏了。后来下载3.0才正常跑起来。
D5渲染器:8K单帧和2K视频输出,支持DLSS。
有关这款渲染器我们之前发布大概3期文章了。D5渲染器是一款建筑可视化软件,完全使用最新的NVIDIA RTX GPU加速构建而成,包括RTX光线追踪,RTX Global Illumination和NVIDIA DLSS(深度学习超级采样)。针对NVIDIA RTX GPUs中的专用RT Core和Tensor Core,还进行了调整,可以以最大限度地发挥性能完成极高交互性的渲染效果。
在这里我们测试了RTX 2080 Ti和RTX 3080分别输出8K图和2550*1440分辨率视频的时间。
8K图像在设置和视角都相同的情况下,我们测试了下面这个场景。
这幅图在开启DLSS(深度学习超级采样)输出8K图,在RTX 2080 Ti上的时间是3分22秒;在RTX 3080测得的时间为2分02秒。这样的单帧图片在渲染时间上差距并不是那么大,紧接着我们又用相同的相机动画和设置输出了一个2550*1440的视频。如下:
这次的时间差距就有些大了,明显看出3080上的时间缩短了一半。
RTX 2080 Ti的渲染时间是1个小时10分钟,而3080上则只用了34分钟39秒。长距离赛就明显看出差距了。
在视图预览操作上没有什么明显差别。测试了开启实时RTX预览和高质量预览,速度上差别不大。不过在一开始打开场景的时候,RTX 3080明显要快一些。
D5 渲染器现已支持NVIDIA DLSS以提高帧率,设计师能进行更高级的交互设计,并创建高质量的视觉输出,比如沉浸式的建筑Demo等等。
在D5渲染其中设计人员还可以在“高质量”而非“中等质量”预览模式下工作,而不会损失性能。这是一个非常重要的改进。虽然没有光线跟踪的“中等质量”预览模式下,当3D相机移动时,透明物体,环境反射和逼真的柔和阴影往往会丢失,而在相机停止时才能再次出现。
现在,借助处于“高质量”预览模式下的D5 Render渲染器的RTX实时光线追踪功能,架构师不再需要应对这些限制。透明对象,反射和阴影在整个渲染预览中保持不变。与场景交互过程中保持高水准的视觉质量,可以为建筑师和客户提供更好的身临其境的可视化体验。
Vray独立版测试
我们搞了个Vray Standalone版。Vray独立版是在没有Max做平台的情况下,用Dos命令来操作的。用起来还挺费劲,折腾了3个小时,终于渲出图像了。这里我们用VRay官方的两个场景。一个是蘑菇的一个是大神scotteaton肖像。
在DOS命令下,打开后不用任何操作,所有详细的参数都一目了然了。
先来看看蘑菇场景的测试RTX 2080 Ti结果。从这里我们可以看到测试详细数据,使用的显卡型号等等都在这里。
然后我们再来看看最后渲染的时间数据:
是467.77秒,这是RTX 2080 Ti的结果。
另一个肖像的RTX 2080 Ti测试结果。
那么RTX 3080会有怎么样的表现呢?这里我直接放上两个场景的时间了。
蘑菇场景:
肖像场景:
最终我们把时间放在一起来看看。
可以看到在两个场景下,RTX 3080的耗时都比RTX 2080 Ti要短上不少,在实际创作过程中能够进一步带来效率上的提升。
Blender Cycles:运动模糊和景深测试
在Blender Cycles的测试我们相对多一些,我们测试了渲染过程的Motion Blur(运动模糊)与后期实现模糊的速度对比;景深渲染时间;还有使用Blender开放数据进行基准测试。
NVIDIA RTX 30系列GPU现在支持硬件加速的运动模糊,从而使这些GPU可以在渲染过程中显着加快运动模糊。对于运动模糊大家都不陌生,这里我就不解释了。下面我们通过场景来看看在使用直接渲染运动模糊和后期加运动模糊的前后对比。测试的场景是这个:
我们先来看看RTX2080 Ti的表现。为了节省文章空间,这里我把图重叠放置下,分别来看看在不开启运动模糊和开启渲染运动模糊,以及后期加运动模糊的时间。
细心的小伙伴可能发现了,运动模糊渲染的效果要比后期的要好很多。这是因为矢量模糊只是是近似模拟运动模糊,虽然在时间上快很多,但是会在最终输出是会产生伪影条纹。
而用Cycles渲染器中使用RTX加速运动模糊,可以得到高质量的运动模糊。
再来看看RTX 3080的时间。
我们列个表对比下:
好了,再来对于景深场景渲染的数据。
这里我们保持渲染采样设置为400,降噪选择为Optix模式。
然后我们把焦点设置在道具上,分别测试光圈数值0.2与0.8的景深渲染速度。
先来看看RTX 2080 Ti。
上图光圈设置为0.2,景深很大。最终渲染图像时间为2分12秒。
上图光圈设置为0.9,几乎没有景深。最终渲染图像时间为2分07秒。
有景深速度稍微慢点。下面来看看3080效果的表现:
同样的场景,其他参数都不变的情况下,我们把f-stop设置为0.2的渲染速度是1分0.1秒
有意思的是,在没有景深的情况下渲染速度也是1分0.1秒。
接下来测试的是Blender开放数据进行基准测试。这是一个Blender平台上专门测试GPU的开放数据评测方式。大家也可以到https://opendata.blender.org/ 下载。在这个页面里你可以看到很多之前AMD和NVIDIA的相关评测结果。
这里我们选择相应的系统。
下载后得到一个Zip文件,解压后使用Windows命令提示符或Powershell执行“ benchmark-launcher-cli.exe”。按照提示一步步操作就可以得到五个场景的渲染时间了。这里就不详细介绍过程了。
我们还是来看看分别在RTX 2080 Ti和RTX 3080不同显卡上的时间表现。
这是RTX 2080 Ti的结果:
这是RTX 3080的结果:
图有点看不清哈。这里我们把时间放一起做个对比。
在V-Ray实测的渲染速度RTX3080几乎可达RTX2080Ti的近2倍。在Blender的基准数据测试里也是差不多的,整体渲染效率约为2倍差距。
Maya中Arnold渲染
上面测试了那么多渲染器,这次该轮到Arnold了,Arnold渲染器已经支持NVIDIA RTX GPU加速。作为一款支持光线追踪技术的渲染器,自然也是RTX GPU大显身手的地方。搭载第二代RT Core的RTX 3080可以比上一代RTX 2080 Super快数倍的速度进行快速渲染。
这里我们也是通过命令符的方式激活场景在后台执行渲染。
这里我们测试的是1500*1500分辨率的图像。RTX 2080 Ti:时间用时1分21秒
RTX 3080:只用时28秒
实际的测试结果是,RTX 3080的渲染速度比2080提升了3倍!
Redshift渲染器
我们用同样的测试方法,运行基准测试文件,文件自动下载,然后REDSHIFT基准都自动运行。
RTX 2080 Ti的测试结果为:8分21秒
RTX 3080测试结果为:3分12秒
结果一目了然了,比起2080 Ti,RTX 3080要快一倍还多。
Octane渲染器:三个场景采样对比
对于Octane渲染器,这里就不多介绍了。它是最早的一款基于GPU、基于物理渲染的渲染器。2020.1.5发布的版本中增加了对NVIDIA RTX 30系列GPU的支持,具备极快的RTX加速能力,还结合突破性的机器学习优化和对核外几何渲染的支持。所以做测试肯定少不了它。这里我们找了三个场景,在基本不动参数的情况下,我们再RTX 2080 Ti和RTX 3080上分别开启RTX和关闭测试。Ok,首先来看看RTX 2080 Ti的数据。
注意:这里的参数不是越小越好了,因为显示的不是渲染时间。而是每分钟采样数和总采样数,采样数越高越好。
那么再来看看RTX 3080的数据是怎样的?
好了,我们来看看OC渲染器两张卡测试结果的对比。
整体的感受就是渲染没难度的图上差距不大,但随着输出高分辨率,带运动模糊, 模糊反射的大场景时候差距明显拉开了,一般RTX 3080都比RTX 2080 Ti快一倍多!
总结:
除了上面我们做的给顶级创意APP做RTX GPU加速之外,NVIDIA还为CG艺术家们提供的NVIDIA Studio套件包括:
• NVIDIA Studio 驱动:驱动对创意工作流程进行了广泛的测试和优化,并及时将最新的创意APP对外发布。
• NVIDIA Broadcast: 一个新应用,利用AI提升麦克风和网络摄像头的效果,具有虚拟背景、网络摄像头自动取景和麦克风降噪等功能。
• NVIDIA Omniverse Machinima:全新的艺术形式。让艺术家能从支持的游戏和第三方资产库中导入资产,然后利用基于NVIDIA人工智能的姿势估计器和新的Audio2Face技术自动制作角色动画,从而创造出令人惊叹的基于视频游戏的故事。
• NVIDIA Texture Tools:为纹理艺术家和游戏开发者提供GPU加速的纹理压缩。
• GeForce Experience: 访问最新的驱动,并无缝捕捉和分享你的工作。新版本支持桌面/创意APP捕捉高达8Kp30的HDR视频。这一功能此前只在专业级硬件捕捉设备上才能实现。
总的来说这次的RTX 30系还是非常令人惊喜的,它不仅在性能上完全超越了以往的GPU,还带来了更多技术上的革新,对于咱们行业的CG艺术家而言,NVIDIA再一次把工作效率提升到了新的高度。同时在价格方面也对用户更加友善,相信用不了多久,RTX 30系GPU就会够成为你们PC机器上的标配硬件了,嘿嘿,期待么?
我们所测的内容就这么多。因为刚出来新卡,很多软件对于其支持还有待优化,所以其他软件就没有测,感兴趣的小伙伴自己买一块自己玩下吧。