前言:Blackwell二当家驾到
上个星期我们为大家带来了的 iGame GeForce RTX 5090 D Advanced 32GB显卡的首测,Blackwell的超高性能和DLSS 4带来的多帧生成都给玩家们留下了深刻印象。
本次NVIDIA在国内首发的Blackwell显卡一共两个型号,除了已经与大家见面的大哥GeForce RTX 5090 D以外,还有二哥GeForce RTX 5080。虽然GeForce RTX 5090 D强到离谱,但是将近2万的售价同样也很离谱,让其注定远离大众市场,很多玩家其实更关注相对亲民的GeForce RTX 5080。
我们也在第一时间收到了来自七彩虹的iGame GeForce RTX 5080 Vulcan OC 16GB显卡产品,下面我就来领大家看一下Blackwell的二当家表现如何。
开箱:智械装甲
这次来到我们评测室的显卡是七彩虹iGame Vulcan也就是我们俗称的“火神”系列显卡,是七彩虹显卡的高端系列。
这一代的火神显卡相比上一代在外观上做出了一定的升级,正面的线条更加简练。
而侧面增加了镂空的框架支撑,整体延续了新VULCAN系列经典三角设计元素,无处不在的斜线切割和银黑色的穿插更增添了一些前卫气质。
3枚107mm大口径“风镰”扇叶,使空气形成旋涡聚风吸入提升风压,有效增加进风量
供电接口使用了12V-2x6供电接口,斜对面则是磁吸式LCD智屏接口。
GeForce RTX 5080 Vulcan OC配备了3个DP2.1b和2个HDMI2.1b的视频输出接口,相比一般竞品多了一个HDMI。现在DP2.1的显示器尚未普及,而HDMI 2.1的显示器却已经铺天盖地,并且许多带屏幕的机箱使用的也是HDMI连接的屏幕,所以多配置一个HDMI接口意义非凡。除此外还有一个iGame系列标志性的一键超频按钮用以切换标频模式和超频模式。
尾部配有一根RGB导灯条和加固螺丝孔
显卡整体长度达到36.0cm(不含挡板),高度13.5cm(不含PCIE接口部分),厚度约7.0cm(3.5槽),比前几天我们看到的七彩虹iGame GeForce RTX 5090 D Advanced 32GB还要大上一点。
亮点:LCD智屏
LCD智屏是火神系列显卡的一大特色。
这次iGame GeForce RTX 5080 Vulcan OC的LCD智屏在分辨率上保持和上一代一致,但是在机械结构上进行了升级。
新版本的智屏支持0-90°以内任意角度悬停,相比于上一代的固定角度更具有灵活性,可以适配更复杂的安装环境。
当智屏搭配外接底座在外使用时,可将灯板吸附于显卡侧面磁吸触点中,实现产品外观的一体性。
LCD智屏使用iGame Center软件进行控制,该软件可以在七彩虹官方网站下载。
iGameCenter不但可以识别显卡,还支持其他iGame系列产品的设定,比如我这块iGame Z890 Vulcan X V20主板。
智屏除了可以监控CPU、显卡等运行状态以外,同时还支持自定义画面。
我们可以制作自己的图像上传,也可以在七彩虹的智屏素材库中挑选,目前素材库针对RTX 40/50系列高清屏的素材已经有大几十款,还在陆续增加中。
在素材库中选定动画后进行上传,上传过程中智屏会提示上传中,并显示上传进度以供参考。
上传速度需要根据用户所选择的图片大小而异,可实现静态图以及动态图的效果。
显示效果还是挺优秀的,传了动画之后,硬朗威猛的火神显卡瞬间融入二次元,实现了从“猛”卡到“萌”卡的华丽变身。
除了智屏以外,火神显卡的RGB元素相对较少,只有在顶部和背板有几根RGB导灯条,相比一些五颜六色注重灯效的产品更显稳重。
安装灯光模组后,火神显卡焕发出赛博朋克风格的光影效果,让玩家切身感受赛博RGB的视觉盛宴,无论是喜欢华丽还是喜欢低调的玩家都可以找到适合自己的搭配方案。
特色:Blackwell拾遗
在我们上星期发表的七彩虹iGame RTX 5090 D Advanced 32GB显卡评测中,我曾经为大家介绍过一些Blackwell架构的特色。但受篇幅所限,有些细节并没有深入解读,这次我们接着七彩虹iGame RTX 5080 Vulcan OC 16GB显卡再进行一些扩展。
硬件规格
GB202是RTX Blackwell GPU系列的旗舰产品,用于GeForce RTX 5090(D)。而本次评测的GeForce RTX 5080则是使用次顶级的GB203 GPU。这些 GPU 基于相同的底层架构,使得不同的玩家可以根据自己的需求进行选择。
GeForce RTX 5080的GB203总共456亿晶体管,共包括7组GPC、42组TPCs、84组SMs、8组 32-bit 总共256bit显存控制器。
每组SM包含128个FP32 CUDA Cores,总计10752 CUDA Cores、84 RT Cores、336个Tensor Cores、336个Texture Units、112个ROPS,同时还包含10.5MB L1 cache、21MB Register File和64MB L2 cache。
近三代的“80”显卡规格对比如下:
与上一代的RTX 4080不同,本次的RTX 5080上市便使用完整规格的GB203 GPU,可谓出厂即满血。GB203共包含7组GPC,每组完整 GPC 包括一个专用的光栅引擎、两个ROP分区(每个分区包含8个单独的 ROP 单元)和6组 TPC,每组 TPC 还包括一个 PolyMorph 引擎和两组SM单元。
流处理器(SM)是 NVIDIA GPU 架构的核心组件,在 GPU 的并行处理能力中发挥着关键作用,通过其各种核心(CUDA、Tensor、RT)实现大规模并行性、高效的 warp 调度、内存管理以及对 AI 等现代工作负载的支持。每个完整SM 包括 128 个 CUDA 核心、1个 Blackwell 第四代 RT 核心、4个 Blackwell 第五代 Tensor 核心、4 个纹理单元、1个 256 KB Register File和 128 KB 的 L1/共享内存,可根据图形和计算工作负载的需求配置不同的内存大小。
Blackwell在流处理器方面的另一项重要改动是不再区分浮点单元和整数单元,所有FP32浮点单元均支持INT32证书运算,反之亦然,这样的改动使得在理想状态下INT32 整数运算单元数量比 Ada Lovelace增加了一倍,但每一个运算单元在同时时刻支持浮点或整数之中的一种,单一单元并不支持两者同时运算。
在显存方面,此次Blackwell 首发的几款型号均搭载了最新的GDDR7显存,其中GeForce RTX 5080 配备 30 Gbps GDDR7 内存,峰值内存带宽为960 GB/秒。这是一种新的超低压 GDDR 内存标准,使用 PAM3信号技术,相比于使用PAM4信号的GDDR6X,GDDR7 的信噪比实现了显著增强,独立通道数量翻倍,同时将 I/O 密度开销降至最低。GDDR7 在大幅提高的带宽的同时,还显著提高了能效,尤其是在功率受限的系统(如笔记本电脑)中,可以实现更优的性能和更长的续航。
除此之外,RTX 50 系列显卡的 GDDR7 实现包括对 RAS(可靠性、可用性、可维护性)的增强 CRC 的支持。
DLSS 4
本次DLSS 4的主要特性有5项,包括1项新增(多帧生成)和4项增强(帧生成、光线重建、超分辨率、深度学习抗锯齿)。其中新增项目为RTX 50系列独占的DLSS Multi Frame Generation,相比RTX 40系列的Frame Generation多了一个“Multi”的关键词,也就是从“帧生成”进化为“‘多’帧生成”。
DLSS 3 Frame Generation 的 AI 模型使用运动矢量和深度等游戏数据,配合GeForce RTX 40 系列的光流加速器的光流场生成一个额外帧。 但是这种方式在每生成额外一帧的时候都需要光流加速器和AI模型参与,所以在生成多个帧的时候开销过高。
DLSS 4新的帧生成 AI 模型的速度提高了 40%,使用的显存减少了 30%,并且每个模型只需要运行一次渲染帧以生成多个帧。与此同时,NVIDIA使用AI光流模型替代硬件光流加速器来生成光流场,从而避免了硬件光流加速器造成的性能瓶颈。
工作流程改变后, 每次渲染时GPU都需要跨超分辨率、光线重构、多帧生成等场景执行五个AI模型,并且每个渲染帧的重建和多帧生成都必须在几毫秒内完成,否则 DLSS 多帧将出现反效果,成为减速器。
为了实现这一目标,GeForce RTX 50 系列 GPU 包含第五代 Tensor 核心,其AI 处理性能提升高达 2.5 倍。 一旦生成新帧,它们就会均匀分布以提供流畅的体验。
DLSS 3的帧生成使用基于 CPU 的节奏调度,在复杂场景下,额外帧与原帧合成输入时,容易出现每帧之间的帧节奏不一致的情况,从而影响整体平滑度。
为了解决此问题,Blackwell 使用硬件Flip Metering来代替CPU进行帧节奏控制,它将帧节奏逻辑转移到显示引擎,让 GPU 能够进行更精确地统一管理调度,与此同时 Blackwell 显示引擎也得到了增强,像素处理能力提高了一倍,足以支持更高分辨率和刷新率,满足 Flip Metering 与 DLSS 4 的要求。
结合以上软硬件方面的创新, DLSS 4 能够生成每 16 个像素中的 15 个像素,同时保证出色的画质、流畅度和延迟,让一次性生成多个帧成为现实。
Blackwell通过使用神经网络渲染,图像质量的增长速度快于摩尔定律,这种 AI 渲染技术将继续扩展。DLSS 通过以原生渲染成本的一小部分生成绝大多数像素,大幅提高了帧速率。DLSS-RR(光线重建)通过大幅减少需要投射和着色的光线数量,实现了使用路径跟踪实现逼真的照明。
Blackwell 推出了具有多帧生成的 DLSS 4,可进一步提高游戏性能并降低延迟。新的神经网络着色技术(RTX Neural Materials,RTX Neural Faces,RTX Neural Radiance Cache (NRC),AI-based transformer 模型等)在计算上更高效,同时能够以更好的图像质量重建图像。
可以毫不夸张地讲,神经网络渲染时代已经到来。
实测:火神觉醒
测试平台
本次测试基本延续了之前RTX 5090 D的平台,只不过参测产品增加了NVIDIA GeForce RTX 4080 Founder's Edition 16GB作为上一代产品的对照。
标频模式与超频模式
本次测试的iGame GeForce RTX 5080 Vulcan OC 16GB挡板处配有一个一键超频按钮,该按钮可以切换显卡的两个BIOS,按钮按下时为超频模式,恢复为弹起状态为标频模式。其实这个按钮在上次的iGame GeForce RTX 5090 D Advanced 32GB也有,但因为当时是非OC产品,故而两个BIOS的设置是一样的。而这次的火神是OC产品,两个BIOS是有一定区别的。
从3DMARK的几项基准测试中可以看到,超频模式相比标准模式有1%-3%的性能提高,特别是在Steel Nomad这类的4K光追测试,提高较多。
在持续运行20分钟的Steel Nomad压力测试后,我们可以清晰的看到两个BIOS的区别。
标准模式下(即标频模式)的GPU频率在2675MHz左右,而超频模式下的GPU频率可以维持在2775MHz左右,比标准模式高100Mhz。而功耗方面标准模式几乎维持在360W一条直线,而超频模式则在375W上下浮动。
标准模式的风扇转速维持在1700RPM出头,而超频模式的风扇则达到了2000RPM,随之带来噪音相比标准模式也有一定的提高。
得益于风扇的高转速超频模式的GPU温度要比标准模式低2度左右,平均温度为62度,而标准模式为64度。于此同时,两者的显存温度相差无几,均在维持在72度左右。
通过对频率、功耗、风扇转速、温度等几个维度的观察,超频模式获得性能提升所付出的代价相对较小,超频风扇转速提高带来的噪音并不明显,故而我本次后续的全部测试均在超频模式下进行。
PS:经过对RTX 5090 D和RTX 5080两款显卡的测试,我们可以清晰的发现,新一代的GDDR7显存虽然运行频率得到大幅提升,但是同时发热也不不容小觑。
DLSS 4游戏体验
多帧生成无疑是DLSS 4最重要的特性之一,目前也由GeForce RTX 50系列显卡独占。随着RTX 50系列显卡的上市,支持的游戏也多了起来,比如《赛博朋克 2077》就在上星期推送了正式的更新版本,而《霍格沃兹之遗》目前还处于beta版。
游戏可以识别当前显卡是否支持多帧生成,从而隐藏相关选项,比如我现在拿一张RTX 4080玩《霍格沃兹之遗》时,帧生成智能选择x2,而换成RTX 5080则可以看到x2-x4的多种选项。
在《霍格沃兹之遗》的测试中,开启DLSS 性能模式+4倍多帧生成后,平均帧率由60提升至280帧,提升幅度超过360%,这与之前RTX 5090 D的情况类似。
而在1%low方面提升虽然没有平均帧率那么明显,但差不多150%的提高也不赖。
在PCL方面,随着帧生成倍率的增加,延迟有一定程度上的提高,但总体仍在正常范围之内,除了DLSS质量模式的3倍以上帧生成和DLSS平衡模式的4倍帧生成等情况以外,其余均不高于原生渲染的延迟,可见DLSS 4对延迟方面的帮助还是比较大的。
在《赛博朋克 2077》的测试中,多帧生成均展示了其强大效能,特别时最低帧率从原生渲染的15.45帧提高到了204.81,提升幅度超过10倍,可见DLSS 4对应这种原生帧率较低的极端情况也是游刃有余。
在3DMARK的DLSS 4测试过程中,最高帧率的性能+4倍帧生成也可以得到460%以上的提升。
从这部分的测试可以看出,GeForce RTX 5080的多帧生成相对于原生渲染获得的性能提升幅度要大于GeForce RTX 5090 D,可见DLSS 4对于较低成本的平台的帮助作用要更大。
其他游戏体验
在3DMARK基准测试中,除了1080P的Fire Strike测试,其余测试iGame GeForce RTX 5080 Vulcan OC 16GB均为位于GeForce RTX 4080和RTX 4090两张公版显卡中间的位置。
接下来我选取了包括《黑神话:悟空》《F1 24》《赛博朋克2077》《极限竞速:地平线》《荒野大镖客2》《消失的光芒2:重装上阵版》等多款游戏,测试了几张显卡在不同分辨率下的传统光栅、光线追踪等游戏的性能测试。
可以看到在较高负载的情况下,七彩虹iGame GeForce RTX 5080 Vulcan OC 16GB显卡的性能相比NVIDIA GeForce RTX 4080 Founder's Edition 16GB要高20%左右,基本符合一代显卡的正常提升。
总结:更低成本实现4K高刷
半价实现够用性能
截止目前,GeForce RTX 50系列最高端的两个型号GeForce RTX 5090 D和RTX 5080都正式与大家见面了。RTX 5090 D超高的规格和猛兽般的性能毫不留情地占据了游戏显卡天花板的位置,但是其16499起售的天价让许多玩家望而却步。
GeForce RTX 5080首发价格8299起售,相比于上一代的4080,传统光栅性能大约提升20%,再加上最新的DLSS 4多帧生成技术的加持,可谓是加量不加价。
GeForce RTX 5090 D带来的4K 240帧体验对于大多数玩家来讲性能严重过剩,此时GeForce RTX 5080显然是一个更高性价比的替代方案。如果说DLSS 4的多帧生成用在GeForce RTX 5090 D上仅仅是锦上添花,而用在GeForce RTX 5080便是如虎添翼,使其可以轻松实现4K 120帧的高品质游戏体验,4K和高刷一样也不少,更重要的是价格只要其大哥5090 D的一半而已。
更加智能的iGame火神
Vulcan 火神系列显卡,定位于iGame显卡的风冷旗舰,七彩虹iGame GeForce RTX 5080 Vulcan OC 16GB延续了这个系列的定级做工,其核心功能LCD智屏新增旋转机械结构,可实现角度调节,配合iGame Center打造完整的软硬件生态,拥有极高的交互性。新一代“旋涡” 散热装置由风镰扇叶,导流型鳍片,豪华热管,真空冰片技术组成,轻松应对游戏、创作、AIGC等高负载场景。无论是高端游戏玩家还是内容创作者,强大的硬件都会成为重要的助力
iGame GeForce RTX 5080系列显卡将于1月30日与RTX 5090 D系列显卡一起,在七彩虹官网商城、京东、天猫、拼多多、抖音等电商平台及全国授权零售经销渠道开售,让我们一起迎接神经网络渲染的游戏新时代吧!
本文来自:什么值得买