在月初盛大开启的 CES 大会上,科技圈迎来一场重磅革新。NVIDIA发布基于 Blackwell 架构的 GeForce RTX 50 系列显卡,同时带来 DLSS 4、Reflex 2 等一众前沿技术,引发行业瞩目。如今,随着性能解禁,备受期待的卡皇GEFORCE RTX 5090 D的性能也即将面向玩家展开。本次我们拿到了映众的RTX 5090 D曜夜X3来为大家带来首发评测。
基于NVIDIA Blackwell架构的映众RTX 5090 D曜夜X3显存规格全面升级至32G GDDR7。512bit的位宽和1792GB/s的带宽极大程度可以缓解高分辨率下显卡带宽不足引发的瓶颈问题,玩家甚至可以在材质拉满的4K乃至8K分辨率进行流畅的游戏体验。
RTX 5090 D曜夜X3搭载GB202核心,拥有21760个CUDA,L2级缓存98MB。相较于RTX 4090 D有着不小的提升,且在基本规格参数上并未有削减,相信对游戏场景的影响不大。
GEFORCE RTX 5090 D新技术解析
第四代RT Core的算力达到318 TFLOPS,在光线三角形相交率达到了上一代的两倍,并通过进一步增强压缩来节省内存的占用。第五代Tensor Core则是2375 AI TOPS,得益于支持加速处理FP4精度模型,使其具备更快的模型处理速度,还可以一定程度上节省显存消耗。
在视频编解码能力上,RTX 5090 D曜夜X3拥有3个第九代NVENC和2个第六代NVDEC,不仅支持全新的AV1 UHQ标准,也首次引入了422编解码,H.264标准的解码速度也迎来翻倍式升级。这对于视频创作者、影视工作者乃至主播群体的工作流都有着极大的效率提升。
NVIDIA RTX神经网络着色器(Neural Shaders)也是CES大会上发布的一个重磅技术,借助AI技术来改变传统的着色方式,将利好整个游戏玩家及创作者群体。比如通过生成式AI来调节人物的面部质量,诸如肤质细节、面部光影和面部血色细节,以及更真实的发丝等。
在RTX Neural Material(RTX神经材质)的加持下,可以将光栅化和光线追踪的数据进行分析,并通过生成式AI来呈现出更真实的画面表现。这也正是在画面更合理且更真实的同时,也能减少显存占用的原因。
可以看两组图片,宝石和丝绸这种材质的展现形式一直以来都是游戏开发者所面临的挑战。因为其单一材质表面具备多种光线特性,即便是有了光线追踪也不能完全保证复刻到相对真实的水平,若是盲目增加光线反射次数则又会带来大量资源的消耗。
从图中来看,宝石的表面展现出了多种光影特性,而丝绸与光照的结合让其甚至能够表达出渐变色这一特性,做到了符合现实逻辑。这对于以往的游戏开发和游戏体验来说是十分震撼的。
接下来就是游戏玩家十分关注的DLSS 4技术,将以往采用的CNN(卷积神经网络)替换成了实时Transformer模型。相较于以往追踪连续帧的变化来进行生成,进化为通过画面的操作以及特性来评估预测,做到更好地理解视觉场景,生成出的画面也将更稳定,可有效改善拖影及细节。
从画面对比来看,采用Transformer模型后的画面将更加出色,布包的纹理细节、遮蔽光等细节全面领先CNN模型,而且这一区别在动态视频中更为明显。值得一提的是,GeForce RTX 20/30/40都将更新至Transformer模型,这对于所有RTX显卡用户都是一个好消息。
DLSS 4的多帧生成是RTX 50系列显卡的独占技术,这是因为Blackwell架构搭载了Flip Metering硬件。通过全新的帧生成AI模型代替光流加速器,使得每运行一次可以为渲染帧生成多个帧,相较于以往的DLSS 3提升了生成效率并减少了内存的占用。
以往玩家们容易遇到在低帧率下开启DLSS 3帧生成容易造成画面延迟过高,体验感较差的现象。这是因为DLSS 3帧生成使用CPU Pacing技术来控制帧率显示。DLSS 4则利用Flip Metering来代替CPU Pacing,让GPU来接管整个流程,极大改善了画面延迟的情况。
这也就解释了,为什么NVIDIA在前几日发布的《黑神话:悟空》DLSS 4技术演示视频中,在开启DLSS 4多帧生成后,不仅帧数大幅提高,其操作延迟还非常可观。
说到延迟,就不得不提到基于全新Frame Warp的NVIDIA Reflex 2。作为一项改善操作延迟的技术,Reflex 2有着颠覆性的表现。以往的操作是基于玩家移动鼠标,硬件接受到指令,再进行画面的渲染。现在则是当GPU渲染第一帧后,CPU会根据操作者的外设输入指令去计算下一帧的位置。将方才渲染的帧扭转到最新的对应视角,通过上一帧的数据来对预测帧的画面细节进行补充,以此来极大程度的降低延迟。
从实际游戏体验来说,Reflex 2可以做到对于图像的修复。画面撕裂这一现象以往在注重高帧率的竞技游戏中经常出现,也就是一幅完整画面存在明显的割裂。借助最新的Reflex 2技术可以有效解决这一难点。《无畏契约》和《THE FINALS》将率先支持这一技术,后续RTX 20系及以上的用户均能开启体验。
说了这么多玩家关心的新技术,下面来直接看下显卡实物。
显卡拆解赏析
映众RTX 5090 D曜夜X3采用纯黑与灰银配色的斜对称式设计,正面的几何线段和栅格处理非常醒目,时尚感满满。
正面搭载了三把直径为98mm的11叶环形轴流风扇,正中间的风扇采用了反转设计,能改善风流挤压。
背面为镂空金属背板设计,整块背板的色调与显卡主色调一致,一体感很强。在右侧使用了不规则镂空处理,辅助热流导出。
侧面的“INNO3D”带有纯白LED灯光,走的是经典简约路线。背板与显卡前脸的中间部分使用了隐藏式的金刚臂支撑架,防止PCB变型,强化显卡的整体质感。而供电方面与前代一致,使用的是16pin外接方案。
另一侧接口升级成了3个DP 2.1b和1个HDMI 2.1b。视频传输带宽更强,能支持4K甚至是8K分辨率下的高帧率画面,也能呈现更出色的动态范围及色阶。
拆开显卡 ,映众RTX 5090 D曜夜X3采用的是公版PCB方案。
供电方面采用的是23+6相供电,全系列采用日系全固态电容与密封电感、DR.MOS等,以保障600W性能世兽的电源需求 。而映众的这块PCB在接口方面还做了镀金处理,以提升接口的抗氧化性能,细节处理相当到位。
显存采用的是三星GDDR7 高速显存颗粒,总共 16颗组成32GB 512Bit的规格,速率达到了28Gbps。
散热方面,显卡采用的是VC均热板散热加9热管的组合 ,搭配3 SLOT的散热鳍片矩阵, 可以快速帮助5090D排除热量。
下面我们来借助GPU-Z来看看它的核心参数。
显卡参数
映众RTX 5090 D曜夜X3的核心频率为2017MHz,Boost频率能来到2407MHz。显存总容量达到32607MB(32.607GB),512bit的显存位宽。
烤机测试
用FurMark烤机软件对RTX 5090 D曜夜X3进行了30分钟的压力测试,GPU温度定格在70.5℃,显存温度在84℃。核心频率维持在2040MHz,风扇转速均没有超过2000RPM,调度在50%左右。要注意的是,由于是全新产品,GPU-Z还有很多信息无法识别,GPU热点温度的读取应该也是有误的, 在产品正式发布以及软件更新之后,相信这个BUG会解决。 从测试来看, 这样的烤机表现也和曜夜的产品理念相贴合,兼顾稳定的输出和较低的环境噪音。
测试平台
在配置平台方面,采用了目前较为顶级的硬件,旨在能够发挥出RTX 5090 D的全部性能。
3DMark基准测试
在3DMark的基准性能测试中,RTX 5090 D曜夜X3相较于4090 D的提升幅度还是非常大的,TimeSpy强了46%,TimeSpy Extreme强了45%,Fire Strike下强了35.4%,Fire Strike Ultra强了48.8%。在看重光线追踪性能的Port Royal测试项目中,RTX 5090 D比4090 D强53.4%。SpeedWay下强52.3%;Steel Nomad则比4090 D强65.1%。
能够看出,映众RTX 5090 D曜夜X3在光线追踪以及高分辨率场景下有着更为明显的优势。
在显卡的稳定性方面,Time Spy压力测试下跑了20个循环,帧率稳定度达到了99.5%,代表着高负载下显卡依旧能够稳定运行。
DLSS 4游戏测试
接下来就是玩家们最为期待的DLSS 4的游戏性能表现,目前市面上并没有DLSS 4游戏,但各个大作已陆续推出了内测版来支持,我们选取了三款进行测试,分别是《赛博朋克 2077》、《漫威争锋》、《霍格沃茨之遗》。
从对比测试来看,2K分辨率下,在开启光线追踪和DLSS多帧生成之后,RTX 5090 D曜夜X3能跑到平均424帧,比光追开+DLSS帧生成的RTX 4090 D性能强124%;4K分辨率下平均289帧,对比RTX 4090 D性能强150%(1.5倍)!
需要说明的是,在4K测试中,RTX 5090 D在光追开+DLSS帧生成的表现不如4090 D的现象,则是因为首发测试版驱动还不够稳定,未来正式版驱动将会有效解决这一问题。
《漫威争锋》2K分辨率下,在DLSS性能和多帧生成的加持下,RTX 5090 D竟然达到了恐怖的577平均帧,比4090 D在DLSS性能+帧生成高了93%,将近翻倍。4K分辨率下跑到了平均472帧,对比4090 D高了130%(1.3倍)。
在魔幻RPG《霍格沃茨之遗》中,RTX 5090 D曜夜X3在借助DLSS性能以及多帧生成下实现了2K分辨率平均300帧,4K分辨率平均259帧。分别比4090 D在开启DLSS性能和帧生成下提升了112%和99%,进步可谓十分巨大。
DLSS 3/2游戏测试
在赛车竞速类游戏《极限竞速:地平线》中,开启DLSS性能后。2K分辨率下,RTX 5090 D曜夜X3比RTX 4090 D性能提升30%,4K分辨率下,性能提升35.3%。
《地平线:零之曙光》开启DLSS性能,2K分辨率下,RTX 5090 D曜夜X3比RTX 4090 D性能提升7.5%,4K分辨率下,性能提升11.3%。目前这款游戏也是两张显卡差距最小的。
在国产优秀独立游戏《光明记忆:无限》中,开启DLSS性能,2K分辨率下,RTX 5090 D曜夜X3比RTX 4090 D性能提升45.2%,4K分辨率下,性能提升42.2%。
国产3A大作《黑神话:悟空》游戏中,开启DLSS帧生成,2K分辨率下,RTX 5090 D曜夜X3比RTX 4090 D性能提升32.3%,4K分辨率下,性能提升38.5%。
经典丧尸类游戏《消逝的光芒2》中,开启DLSS帧生成,2K分辨率下,RTX 5090 D曜夜X3比RTX 4090 D性能提升34.5%,4K分辨率下,性能提升16%。
热门武侠吃鸡游戏《永劫无间》中,开启DLSS性能,2K分辨率下,RTX 5090 D曜夜X3比RTX 4090 D性能提升21.3%,4K分辨率下,性能提升16.8%。
《潜行者2:切尔诺贝利之心》游戏中,开启DLSS性能+帧生成,2K分辨率下,RTX 5090 D曜夜X3比RTX 4090 D性能提升24.6%,4K分辨率下,性能提升36.2%。
光栅化游戏测试
《孤岛惊魂6》游戏中,2K分辨率下,RTX 5090 D曜夜X3比RTX 4090 D性能提升0.4%,4K分辨率下,性能提升40.1%。在该游戏的高分辨率场景下,RTX 5090 D的优势更加明显。
《孤岛惊魂:新曙光》游戏中,2K分辨率下,RTX 5090 D曜夜X3比RTX 4090 D性能提升20.1%,4K分辨率下,性能提升40.2%。比较有意思的是,这是目前唯一一款4K分辨率下两张卡性能表现均强于2K分辨率的游戏。
《无主之地3》游戏中,2K分辨率下,RTX 5090 D曜夜X3比RTX 4090 D性能提升33.6%,4K分辨率下,性能提升45.1%。
测试总结
从测试来看,映众RTX 5090 D曜夜X3在开启DLSS 4的多帧生成选项后,帧数有着爆炸式的增高,这不仅代表着其核心性能的强大,也预示着高分辨率全特效光追游戏也可以在高帧率下完美运行。在常规性能下同样也能与RTX 4090 D拉开一定差距,特别是在4K分辨率的情况下。当然,由于测试版驱动的原因,也导致部分游戏之间的性能表现区别不大,这一点相信在正式版驱动上线之后会迎来改观。
目前,已有75款游戏和应用支持DLSS 4技术,随着越来越多支持DLSS 4的游戏问世,玩家们将迎来脱胎换骨的游戏体验。不论是Reflex 2技术还是Transformer模型,都将下放至RTX 20/30/40的显卡用户,这也是一个极大的好消息。在游戏画面日新月异的当下,映众RTX 5090 D曜夜X3凭借极致的游戏性能与出色的温度控制,将一种大作轻松拿下!是骨灰级玩家不可或缺的“游戏装备”!