RTX 30系显卡里面最后的一块拼图,那张传言已久的RTX 3090 Ti显卡昨天就正式和大家见面了。这张搭载着一个满血GA102的核心堪称是目前规格最强大的游戏显卡,而它的GA102-350核心也是目前NVIDIA Ampere游戏架构里面规格最完整的核心。
面对着这张目前消费级别终极的卡皇,各大厂家自然也是不会落下,纷纷推出自家的非公版RTX 3090 Ti来满足发烧友玩家的需求。这当中当然也少不了耕升这个大家都很熟悉的名字,以及他们这次带来的RTX 3090 Ti炫光超OC显卡。这张新的炫光显卡不仅有着强悍的性能,更有着出乎意料的灯光效果。
完全体的GA102核心现身
完全体的GA102核心这次终于来了,它仍然沿用了从NVIDIA Pascal架构开始定下的GPC-TPC-SM层级架构,完全体的GA102核心一共具有7组完整的GPC,每组GPC包含6组TPC,每组TPC包含2组SM,所以完整的GA102核心拥有84个SM单元。
而且在Ampere架构中,每个SM单元拥有的CUDA核心数现在为128个,这就使得GeForce RTX 3090 Ti一共拥有10752个流处理器的超大规模。但是,与之前的GeForce RTX 3090相比,GeForce RTX 3090 Ti主要只是多了些流处理器吗?并不是这样。
我们先来看一下GeForce RTX 3090 Ti与TITAN RTX、GeForce RTX 3090和GeForce RTX 3080 Ti规格参数对比:
从定位上来说,GeForce RTX 3090 Ti以及GeForce RTX 3090都是上代TITAN RTX的继任者,上一代TITAN RTX的定位是面向AI和数据科学的解决方案,不过从目前这一代来看,TITAN这个系列似乎是被砍掉了,于是GeForce RTX 3090 Ti以及GeForce RTX 3090被录入了GeForce阵容,但是他们的目标群体很明确——面向8K游戏玩家及重度创作者,而这两者之中,其实更加偏向于重度创作者用户。
带纠错码(ECC)的24GB GDDR6X显存
如果说GeForce RTX 3090定位是生产力工具的一个鲜明的特点是24GB大容量的GDDR6X显存的话,那么GeForce RTX 3090 Ti在这上又渐进了一步,那就是其显存配置不仅容量大,而且支持ECC纠错码了,这是笔者个人认为GeForce RTX 3090 Ti相比GeForce RTX 3090区别最大的两个地方之一。同时这也让GeForce RTX 3090 Ti看着很像设计与可视化解决方案领域的专业卡——RTX A6000。
但是GeForce RTX 3090 Ti与RTX A6000各有长处,RTX A6000的典型特点是可以配备最高达48GB的显存容量,但是GeForce RTX 3090 Ti的特点是配备了比RTX A6000更快的显存——GDDR6X。相对来说,设计与可视化生产流程更加偏重于需求大容量,而游戏需要低延迟,所以对显存速度也有要求,越快越好,当然,游戏的分辨率以及贴图质量也影响着显存容量的需求。
所以这里我们可以看到一个GeForce RTX 3090 Ti一个无出其右的点——那就是它的显存特点综合了GDDR6X的“快”、24GB的“大”容量以及支持ECC纠错码的“稳”,可以说是一个没有短板的多面手。
驱动的控制面板中有显存的ECC开关,默认是关闭的,对于创作软件来说开ECC会增加稳定性,而对于游戏用户来说,就不用打开了,由于多了一步纠错码计算,会稍微影响性能,默认不动就好。
频率提升巨大
上面说显存支持ECC纠错码是笔者个人认为GeForce RTX 3090 Ti相比GeForce RTX 3090区别最大的两个地方之一,而第二个地方并不是更多的流处理器,而是频率。
对于GeForce RTX 3090的GA102-300和GeForce RTX 3090 Ti的GA102-350这样的大核心来说,同时拥有高频是比较难的,因为即使可以高频,它也会面临功耗和发热的难题,毕竟随着频率的提升,功耗与发热是以超越线性的比例提升的,这也是为什么我们看到每一代的旗舰卡往往频率并不是同架构中最高的。
而这次的GeForce RTX 3090 Ti确实令人惊讶,它的Boost频率达到了1860MHz,相比GeForce RTX 3090的1695MHz提高了大约10%,相比较而言,流处理器单元只不过提高了不到3%而已。
显存带宽终于越过1 TB/s大关
在GeForce RTX 3090身上,显存带宽已经来到了936 GB/s,距离1 TB/s大关只差临门一脚了,这最后一脚由谁来实现呢?当然是NVIDIA自己,于是这一次于猛兽尽头更进一步的GeForce RTX 3090 Ti终于实现了超越1 TB/s的显存带宽,达到了1008 GB/s,这是GeForce显卡历史上第一次跨过1 TB/s的带宽。
而且除了这个第一,GeForce RTX 3090 Ti也是第一款采用新型PCIe 5.0外接供电接口的显卡。
同样的,基于新一代Ampere架构的GeForce RTX 3090 Ti显卡也具有这一代Ampere显卡的一些通用特性,并且相比上一代Turing架构有很大的进步。
NVIDIA Ampere架构简介
GeForce RTX 30系显卡上的SM单元相比GeForce RTX 20系的,最大变化是加倍了针对传统计算的FP32单元、引入第二代RT Core以及第三代Tensor Core。
大家都知道在Turing架构中,NVIDIA整数型(INT32)和单精度浮点型(FP32)两种不同的数据类型交给两种不同的ALU进行计算。不过现代游戏应用中最为常见的还是FP32,因此为了提高计算效率NVIDIA在NVIDIA Ampere 架构上引入了可同时支持INT32或FP32两种数据类型的新ALU。也就是说,现在有两条不同的数据路径,一条能够同时处理整数或者单精度浮点,另一条则单纯处理单精度浮点计算。
负责进行实时光线追踪运算的专用硬件单元RT Core在NVIDIA Ampere 架构上也更新到了第二代,最主要是增加了动态模糊的加速运算支持。NVIDIA在其中新加入的插值算法可以在保证动态模糊精确性的同时提高了实时光线追踪效率,官方表示最高可达8倍于上代的速度。另外在基础的BVH计算上,第二代RT Core也可以比第一代快2倍。
Tensor Core这个负责运行AI计算的硬件单元在NVIDIA Ampere 架构上也升级到了第三代。其实之前发布的A100计算卡上已经用上了新的第三代Tensor Core,它能够提供比第二代Tensor Core高出4倍的效能,不过游戏卡上面的Tensor Core进行了一定的精简,其FP16 FMA计算的吞吐量只有GA100核心中的Tensor Core的一半。
而第三代Tensor Core带来的更强劲AI运算有些什么用呢?答案就是DLSS。随着GeForce RTX 30系显卡一同发布的,还有DLSS的更新版 – DLSS 8K。顾名思义,DLSS 8K就是通过深度学习技术将画面分辨率拉伸至8K的新版DLSS,具体来说就是把1440P的画面拉伸至4320P,像素数量跨越了整整9倍。
再之后就是HDMI 2.1这个备受期待的新输出端口了。在HDMI 2.1之下,显卡可以用单线材做到8K60Hz或者4K120Hz的输出。对于想用大尺寸电视打游戏的玩家来说是一个不错的福音。
显卡规格
其实这次NVIDIA发布的RTX 3090 Ti公版显卡在规格上面已经很不错,而我们这次评测的耕升RTX 3090 Ti炫光超OC显卡就可以说是在公版的基础上把性能挤压得更加彻底。为了做到这一点,耕升RTX 3090 Ti炫光超OC是把Boost频率从公版的1860MHz一下子提升到了1905MHz。出厂预超频这一点其实在它的“OC”后缀上面就已经可以得知。
除此之外,耕升RTX 3090 Ti炫光超OC的其他规格就和公版RTX 3090 Ti的是差不多。显存同样都是24GB的GDDR6X,不过在供电方面仍然是以一个12VHPWR的16P接口来满足480W的TGP功耗需求。
视频输出接口部分,耕升RTX 3090 Ti炫光超OC拥有3个DP 1.4以及1个HDMI 2.1接口,HDMI 2.1对于想要拥有4K@120Hz以及HDR体验的玩家来说基本上是必需的了,而到了RTX 3090 Ti这个级别的显卡,部分网游在4K下面也基本上可以达到100多帧的表现,所以4K@120Hz这个功能这时候就很重要了。
总的来说,耕升RTX 3090 Ti炫光超OC的规格可以说是应有尽有,也是展示了一张顶端旗舰卡皇应有的水平。
显卡外观
沉稳之余不失光彩,这是笔者在看到这张显卡之后的第一个想法。如果有朋友是记得的话,在之前的RTX 30系显卡上,特别是RTX 3090上,耕升是使用了一个名为炫光之眼的散热器,配以风扇边框的RGB灯效来营造出不错的视觉效果。而这次在RTX 3090 Ti上面,就出现了一个从未有在耕升其他显卡上出现过的炫之黑曜石散热器。
既然是用了黑曜石这个名字,那整张显卡的特色也很明显,那就是黑。整个波浪形的塑料导流罩都用了黑色配色,配以中间2把白色的100mm风扇以及1把90mm风扇,在视觉上形成强烈的对比,但同时观感又不失协调。
不过同时也是由于波浪形导流罩的关系,耕升RTX 3090 Ti炫光超OC其实是一张属于3.5槽的显卡,玩家在购买的时候需要留意一下机箱兼不兼容。
如果大家以为这个导流罩就只是通体全黑就没事了,那就大错特错了。“炫之黑曜石”里的黑曜石就是以黑色配色来代表,而里面「炫」的成份当然就是要由RGB灯效来呈现。在这个黑色导流罩之下是满布了ARGB灯珠,玩家可以用耕升自家的GW-SOUL软件来调控想要的灯光效果。
不得不说,这张显卡在通电开机之后,即便是在默认状态下的灯光效果也已经是很赏心悦目的,流光的效果配上黑色的线条以及风扇的黑色边框,整体效果非常好看。显卡顶部还有耕升的英文名字GAINWARD以及LOGO同样都是拥有RGB灯效。
不过在问了一下编辑部其他同事之后,笔者发现,虽然我自己是觉得这个外观挺好看,但是也有一些同事表示接受不了。由此可见,炫之黑曜石散热器的外观是属于那种Hit or Miss的类型。
看完了显卡正面来看看其他地方。如同现在的任何高端显卡一样,耕升RTX 3090 Ti炫光超OC也是拥有一块全覆盖的背板。上面印有GAINWARD以及GEFORCE RTX的字样,并且在末端做了开孔镂空设计,可以让散热器上的部分热空气从这里散发到机箱其他地方,从而增强显卡的散热能力。
显卡的顶部除了刚刚提到了RGB灯效部分之外,还拥有另一组GEFORCE RTX的字样。当然,那个首次在显卡上出现的PCI-E 5.0供电规范 12VHPWR供电接口也是有出现的。相比起之前的双8P或者三8P接口,一个12VHPWR接口所占的地方要少很多很多,不但有利于外观设计,对于玩家走线也很有帮助。
而为了让手中持有旧款电源的玩家也可以顺利用上这块显卡,随着显卡还会附带一条三个8P转12VHPWR的转接线。
整体而言,耕升RTX 3090 Ti炫光超OC的外观就笔者个人而言是很好看的。
显卡拆解
虽然这张耕升RTX 3090 Ti炫光超OC显卡是个大块头,但是要拆起来也是没有甚么难度的。
显卡本身的PCB也是很巨大,而上面也基本上是没有多少空余的地方,都是塞满了各种组件。但是相比起散热器,PCB的长度还是要短不少的。
PCB中间的就是那个GA102-350核心,旁边那一圈就是来自美光的24GB GDDR6X显存,具体型号为D8BZC。由于每颗显存都是2GB的容量,因此在PCB正面铺上12个就已经足够24GB了,不需要像RTX 3090那样在背面也贴上12个。这对于RTX 3090 Ti的散热来说有很好的加成,毕竟再也不需要顾虑显卡背面的发热量会过大。
在核心供电方面,耕升RTX 3090 Ti炫光超OC是用了20相的核心供电,用的MOSFET是美国芯源系统的MP86957,最大电流70A,而核心PWM控制芯片则同样是美国芯源系统的MP2891。
RTX 3090 Ti这次的TGP高达480W,因此显卡的散热器也必须要有一定的份量才可以压制得住。耕升RTX 3090 Ti炫光超OC的散热器拥有8根热管,对于RTX 3090 Ti来说也是基本上足够的了。
测试平台与说明
既然这次是测试耕升RTX 3090 Ti炫光超OC这张目前的游戏究极卡皇,那么测试平台也必须要够高端才对得住它的身价。这次笔者是以Core i9-12900K以及32GB的DDR4 3600MHz以存来搭建了一套测试平台,配上1000W的电源来确保显卡的功耗可以全部发挥出来。
显卡性能基准测试
我们以3DMark作为显卡基准性能测试,测试项目包括Fire Strike、Fire Strike Extreme、Fire Strike Ultra、Time Spy、Time Spy Extreme以及Port Royal六个项目。其中Fire Strike、Fire Strike Extreme、Fire Strike Ultra三个项目分别测试的是显卡在DX11游戏中的1080p分辨率、2K分辨率和4K分辨率下的性能指数,Time Spy、Time Spy Extreme两个项目则是显卡在DX12游戏中的2K分辨率和4K分辨率下的性能指数,Port Royal是测试的显卡实时光线追踪的性能指数,具体成绩见下表,表中所列成绩均为3DMark显卡单项的得分。
很显然,耕升RTX 3090 Ti炫光超OC的得分对比起之前最强的卡皇RTX 3090也是要高不少的,不论是那个项目都有所提升。可以看到,即便是在用来测试1080P以及2K下DX11游戏性能的Fire Srike及Fire Strike Extreme中,耕升RTX 3090 Ti炫光超OC都有着分别7%以及9%左右的提升,而在测试4K下DX11游戏性能的Fire Strike Ultra中则更加是有接近11%左右的提升。
测试DX12下游戏性能的Time Spy及Time Spy Extreme也是一样,耕升RTX 3090 Ti炫光超OC也是要领先RTX 3090大概11%至12%左右。至于在测试光追性能的Port Royal内,耕升RTX 3090 Ti炫光超OC同样也是要领先11%左右。
4K游戏性能测试
接下来就是游戏帧数方面的测试。这次我们是找来了5款光栅化游戏,以及5款光追游戏来测试。以RTX 3090 Ti的性能来说,4K以下的分辨率基本上没有甚么测试的必要,也对不起它卡皇的定位,因此这次笔者只会测试其在4K分辨率中的游戏帧数。测试的所有游戏在画质选项方面都会调至最高或者Ultra。而在测试光追帧数时,笔者也不会打开任何DLSS选项。
可以看到,在光栅化游戏当中,耕升RTX 3090 Ti炫光超OC对比起RTX 3090是有3%至13%左右的领先优势,平均下来是要领先大概9%左右。在《赛博朋克 2077》这样的一款典型吃配置的3A大作当中,耕升RTX 3090 Ti炫光超OC的帧数是超过了52帧,而在像是优化很好,或者对配置要求不算很高的游戏中,这张RTX 3090 TI更加是可以做到80多帧甚至100多帧的成绩。
而在光追游戏下面,耕升RTX 3090 Ti炫光超OC就要领先于RTX 3090平均10%左右了,最低也有5%而最高也去到了接近15%。这里其实已经可以看到,哪怕是没有开DLSS,耕升RTX 3090 Ti炫光超OC已经可以让部分游戏在4K下开光追以60帧左右的帧数来跑了。
就游戏帧数而言,耕升RTX 3090 Ti炫光超OC能够领先RTX 3090平均10%左右也是很强的了,毕竟这两张都是属于顶级显卡,理论上来说已经很难拉开差距,但RTX 3090 Ti却是硬生生做到了。
创作性能测试体验
不过虽然说RTX 3090 Ti的游戏性能是很不错,但其实它的重点是面向于那于对于大显存有需求的重度创作者,因此笔者这次当然也要测试一下耕升RTX 3090 Ti炫光超OC的创作应用体验是怎样的。
首先在Davinci Resolve 17里面,本次测试的是一个8K RED RAW素材。耕升RTX 3090 Ti炫光超OC由于拥有24GB的超大显存,因此即便是为这段素材添加一些特效都是没有问题的。可以看到这时候显存占用已经达到了22GB了。而如果我们是换成一张RTX 3080 Ti的话,为同样的素材添加同样的特效,RTX 3080 Ti的12GB显存其实已经完全不够用了,这时候软件也会提示显存不足而报错。
而在渲染软件Blender里面,用我们的测试素材进行渲染的话,耕升RTX 3090 Ti炫光超OC的24GB显存是足以完成整个最终渲染的工作,但换成RTX 3080 Ti的话就会因为显存不够因而报错,不能完成渲染。
温度测试
在这个环节中,笔者会以开放式平台来测试显卡的温度,测试时环境温度约为21℃。满载温度是在3DMark Time Spy Extreme测试中取得的,而待机温度则是开机以后记录10分钟。
由于耕升RTX 3090 Ti炫光超OC是拥有风扇智能停转功能,因此它的风扇在待机时一直也没有转动,这也是为甚么待机温度会慢慢的一直往上升,不过在10分钟内也只升高8度算是比较不错了,也证明哪怕风扇不转,在待机情况下显卡也不会有太热。至于满载时的温度,这张耕升RTX 3090 Ti炫光超OC的最高温度为74度,温度也是控制得不错的。而且在这时候风扇转速也只有60%,如果想让显卡更加低温的话可以手动调整风扇曲线,不过在噪音方面可能就会有点高了。
噪音测试
这部分的测试是会在我们的一套专用设备上进行测试,测试出来的分贝值是代表在1米处的噪音量。我们会测试显卡在默认情况下烤机最高时转速的音量,以及把显卡风扇转速拉满时凡音量。
经过换算,耕升RTX 3090 Ti炫光超OC在默认情况下的满载噪音约为40.8dBA,而风扇转速在100% RPM时的音量则是在47.4左右。这种程度的噪音在使用时不算高,但是也不算低,因此大家在使用时可能最戴上耳机,或者把音响的音量调大一点。
功耗测试
通过我们手中的PCAT套件,可以分别精确地测量显卡PCI-E、外接电源接口瓦特数,显卡最大功耗在3DMark Time Spy压力测试中获得,待机功耗则是在进入系统后记录1分钟取平均值。
作为拥有着高达480W TGP的功耗大户,RTX 3090 Ti的功耗是不低的。由于在待机时风扇没有转动,因此耕升RTX 3090 Ti炫光超OC的待机功耗是在26W左右。而一旦开始满载的话,功耗就会瞬间上升去450W以上,平均下来满载功耗是达到了475W,和官方宣称的差不多。因此虽然NVIDIA官方是建议为RTX 3090 Ti至少配备一个850W的电源,但是我们更加建议用一个1000W或以上的电源来确保稳定性。
超频测试
而在最后的超频环节,笔者把耕升RTX 3090 Ti炫光超OC的核心频率提高155MHz,显存频率也提升1000MHz,最终也可以在这样的超频下稳定下来。
在这个超频幅度下,耕升RTX 3090 Ti炫光超OC在3D Mark Time Spy里面的得分为12015分,比起在默频时得分高出8%左右。考虑到这张显卡的定位以及其默认的频率,加上厂家默超频的设置,能够有8%左右的成绩提升已经是比较出色的了。
总结
正如笔者在开篇所说,RTX 3090 Ti是一张性强的显卡,而耕升的RTX 3090 Ti炫光超OC则是在性能强劲的基础上加入了不错的外观,让整张显卡由内到外都完全符合一张高端显卡的定位。
只不过,耕升的RTX 3090 Ti炫光超OC在游戏内的表现固然是非常好,即便是在4K分辨率之下都是基本上没甚么压力,但是它更加耀眼的地方是在于那24GB的显存可以重度创作变得省心。RTX 3090 Ti本身的定位是更加偏向于给那些对于显存容量有高要求的创作者,毕竟24GB的显存就已经比肩以往的TITAN系列显卡。
因此,如果大家是经常需要重度创作的创作者,或者是一名深度发烧友好玩家,需要在8K下打游戏,那这张15999元的耕升RTX 3090 Ti炫光超OC显卡会是一个非常不错的选择