3060的功耗3080的性能!NVIDIA RTX 4070首发评测
3060的功耗3080的性能!NVIDIA RTX 4070首发评测
一、前言:比想象中性能更强的RTX4070显卡
GeForceRTX4070解禁发布之前,不少人对它有点迷惑。
首先,它的CUDA核心(流处理器)与上代RTX3070完全相同,都是5888个。另外一点就是它的显存位宽只有192Bit,RTX3070则是256Bit。
有鉴于此,很多玩家预测RTX4070的性能不会比RTX3070强多少,大概也就是RTX3070Ti的水准。
RTX4070真的如此不堪吗?当然不是!
RTX4070使用了与RTX4070Ti相同的AD104核心,完整的AD104核心共有7680个CUDA核心(分为5组GPC/30组TPC/60组SM)、240个第四代TensorCore张量核心、60个第三代RTCore光追核心、240个纹理单元、80个ROP单元、3MB一级缓存、48MB二级缓存。
完整的AD104核心
AD104-250核心(RTX4070)
RTX4070做了部分精简,拥有4组GPC共5888个流处理器、184个TensorCore、46个RTCore和5888个流处理器单元、64个ROP单元、36MB二级缓存。
这其中很多参数与RTX3070相同,比如流处理器、TensorCore、RTCore,2款显卡一模一样,而ROP单元数量和显存位宽甚至还不如RTX3070。
不过不要忘了,RTX4070采用的是第四代TensorCore和第三代RTCore,相比RTX3070都领先了一代。
另外在台积电4N制程工艺加持下,RTX4070的加速频率高达2475MHz,实际游戏频率更是高达2800MHz,相比RTX3070提升了接近50%。
如此巨大的频率自然也会带来更强的游戏性能。
AD104的晶体管数量2倍于GA104,而流处理器数量却并没有翻倍,这是因为大量的晶体管用在了二级缓存上。
RTX4070二级缓存容量高达36MB,9倍于RTX3070,更大容量的二级缓存可以降低GPU对于显存带宽的需求。
另外,虽然显存位宽只有192Bit,但是由于采用了频率高达21Gbps的GDDR6x显存,位宽达到了504GB/s,而256Bit的RTX3070位宽只有448GB/s。
更大容量的二级缓存再加上更高的显存带宽,RTX4070的性能到底会比RTX3070强多少呢?
二、图赏:可以看作是迷你版的RTX4090
和巨大的包装盒比起来,RTX4070显得十分小巧。
送来一条2x8Pin转16Pin的电源线,RTX4080是3x8Pin、RTX4090上是4×8Pin。
看起来就像是RTX4080的缩小版。
背面。
依然是16Pin供电接口,不过功耗很低,完全不可能出现烧化接口的情况。
3个DP1.4和1个HDMI2.1接口。
拆掉外框。
铜底+热管的散热设计。
非常mini的PCB板,改造成ITX版型也不难。
5+3相供电电路设计,虽然简单,但也足够应付200W的TGP。
背面空空如也。
RTX4070采用的是AD104核心,芯片面积295mm2,拥有358亿晶体管。
GPU旁边是6颗美光GDDR6X显存,单颗2GB,总容量12GB,等效频率21GHz,带宽504GB/s。
RTX4070就是迷你版的RTX4090/4080。
三、理论性能测试:3DMark运行频率可达2800MHz
测试平台如下:
1、3DMarkTimeSpy
在2K分辨率3DMarkTimeSpy测试中,RTX4070图形分数达到了17924分,核心温度最高68℃,热点温度最高86℃,核心运行最高频率为2820MHz,最高风扇转速1709PM,最高功耗173W。
在4K分辨率3DMarkTimeSpyExtreme测试中,RTX4070图形分数达到了8587分,核心温度最高69℃,核心运行最高频率为2805MHz,最高风扇转速1700RPM,最高功耗173W。
2、3DMarkFireStrike
在2K分辨率3DMarkFireStrikeExtreme测试中,RTX4070图形分数达到了21351分,核心温度最高63℃,核心运行最高频率为2835Hz,最高风扇转速1409RPM,最高功耗169W。
在4K分辨率3DMarkFireStrikeUltra测试中,RTX4070图形分数达到了10095分,核心温度最高64℃,核心运行最高频率为2835Hz,最高风扇转速1410RPM,最高功耗168W。
四、1080P与2K游戏测试:都比RTX3080强
1、刺客信条:英灵殿
2、德军总部:新血脉
3、地平线:零之曙光
4、孤岛惊魂5
5、孤岛惊魂6
6、古墓丽影:暗影
7、极限竞速:地平线5
8、赛博朋克2077
9、巫师3
10、无主之地3
11、战争机器5
1080P分辨率测试数据汇总如下:
2K分辨率测试数据汇总如下:
五、4K游戏测试:稍弱于RTX3080
1、刺客信条:英灵殿
2、德军总部:新血脉
3、地平线:零之曙光
4、孤岛惊魂5
5、孤岛惊魂6
6、古墓丽影:暗影
7、极限竞速:地平线5
8、赛博朋克2077
9、巫师3
10、无主之地3
11、战争机器5
测试数据汇总如下:
4K分辨率下,RTX4070相比RTX3070Ti的领先优势降到了13%,比起RTX3070快了25%,但被RTX3080反超,落后后者5%。
六、DLSS3游戏测试之一:3款无光追DLSS3游戏
此次我们一共测试了8款游戏,包括4款支持DLSS3但无光追的:《3DMark》、《超级突破》、《毁灭全人类》。
另外还有4款同时支持DLSS与光追的游戏:《暗影火炬城》、《光明记忆》:《无限、生死轮回》、《赛博朋克2077》。
所有DLSS3以及光追测试都是在2K分辨率下进行。
1、3DMark
DLSS2模式下帧率为121FPS,比默认的65FPS提升了133%。
DLSS3的成绩为132FPS,相比默认提升了156%。
2、超级人类
这是默认最高画质,RTX4070的帧率为158FPS。
DLSS3的画质与原生画质相比有那么一点差别,不过不仔细看到话,很难发现差异。
3、毁灭全人类2:重新探测
最高画质下,RTX4070的帧率为114FPS。
开启DLSS3之后,帧率来到了222FPS,近乎翻倍。
七、DLSS3游戏测试之二:4款支持DLSS3的光追游戏
1、暗影火炬城
开启光追时,帧率为127FPS。
2、光明记忆:无限
开启RTX时,游戏的帧率为105FPS。
开启DLSS3之后,帧率提升到了225FPS,提升了114%。
3、生死轮回
开启光追之后,游戏的帧率仅有56FPS。
打开DLSS3之后,帧率提升到了180FPS,提升幅度搞到221%。
4、赛博朋克2077
开启光追之后,游戏的帧率仅有38FPS。
打开DLSS3之后,帧率提升到了136FPS。
测试数据汇总如下:
八、功耗测试:烤机仅67度、能效比二倍于RTX3070Ti
1)、烤机测试
使用Furmark来对RTX4070进行烤机测试,测试是室温为28度。
将Furmark的参数设定为1920*1200分辨率、0AA。
运行14分钟之后,RTX4080的温度稳定在67度附近,功耗稳定在196W,烤机时GPU频率为2460MHz,CPU风扇转速只有1794RPM,基本上听不到风扇的噪音。
2)、真实游戏功耗测试
1、GTAV
1080P分辨率下,RTX4070的功耗为117W,而RTX3070Ti则高达202W。
2K分辨率下,RTX4070功耗是165W,运行频率2805MHz,温度56度。
RTX3070Ti的功耗为262W,运行频率1905MHz,温度73度。
2、绝地求生
这是1080P分辨率。
左边是RTX4070,功耗186W,温度65度。
右边是RTX3070Ti,功耗285W,温度80度。
2K分辨率下,RTX4070功耗190W,RTX370Ti功耗是288W。
3、古墓丽影:暗影
1080P分辨率下,RTX4070功耗183W,温度59度,运行频率2805MHz。
2K分辨率下,RTX4070功耗188W,RTX3070Ti则是282W。
测试数据汇总如下:
在1080P分辨率下,RTX4070在3A游戏中的平均功耗只有171W,2K分辨率也只有186W;就算是到了4K分辨率,平均功耗也不到190W,这个功耗不到RTX3070Ti的2/3。
虽然RTX4070的TGP是200W,但实际上基本上没有游戏可以跑到这个数字。相比之下,RTX3070Ti可以轻松跑满290W的TGP。
九、StableDiffusion与RTXVSR体验
1、StableDiffusion出图速度测试
如今已是AI时代,ChatGPT是最火的聊天机器人,而当前最火的AI作图工具则是StableDiffusion,只需要输入一句话、或者特定的关键词,就能生成一幅你想要的图像。
只不过StableDiffusion也是有要求的,你需要一张显存容量6GB以上的NVIDIA显卡。
下面我们来看看RTX4070的出图速度。
生成图像宽度864、高度1264,采样迭代步数70。
实测RTX4070出图耗时82秒,显存占用5GB,功耗168W。
RTX2070Super耗时122秒,功耗210W。
RTX3070Ti耗时86秒,GPU功耗277W,温度76度。
RTX3070出图耗时95秒,GPU功耗210W。
小结:4张显卡中,RTX4070不仅出图速度最快,功耗也是最低的,比RTX3070Ti低了110W。
另外我们这里只是出一张图,如果是大量出图,从中筛选优质图片,耗时会更久,这个时候高端显卡可以节约大量时间。
2、RTXVSR效果体验
其实很早之前就有AI图片画质增强工具,但是视频超分辨率技术一直是空白,主要是处理视频需要极高的算力。近期NVIDIA上线了RTXVSR视频超分辨率技术,可以利用TenserCore张量核心硬件单元,智能锐化和强化特征和边缘,同时消除恼人的压缩伪影。
想使用RTXVSR视频超分辨率技术,只需要下载最新版本的GeForce显卡驱动和Chrome浏览器即可。
驱动安装完成之后,在NVIDIA控制面板中会出现RTX视频增强选项,一共有4档可供选择,1档画质最低,4档画质最好。
左边是360P分辨率视频,右边是RTXVSR4x画面,可以增强后的画面已经达到了1080P的画质水准,线条更加清晰、背景也纯净了很多。
就算是1080P视频,经过RTXVSR4x增强后,画面中的噪点、锯齿都减轻了很多,细节更为丰富。
十一、总结:不仅仅只是一款游戏显卡
2022年12月上市的AMD次旗舰RX7900XT,其性能能媲美RTX4080,价格仅售7499元,比对手足足便宜了2000元。
然而4个月过去了,如今许多非公RX7900XT已经降到了6000元以下,比RTX4070Ti还便宜不少,但依旧无人问津,真是让人唏嘘不已。
原因很简单,显卡只是单纯的游戏性能强是远远不够的,能效比、生产力、光线追踪等等这些综合起来,重要性上远远超过GPU的传统游戏性能。在这些方面,AMD显卡落后的已不是一点半点。
就拿目前大受欢迎的AI作图工具StableDiffusion来说,A卡直接就无法识别……
以下是本次测试小结:
1、性能
RTX4070最适合1080P和2K分辨率。我们测试了11款游戏,在2K分辨率下,除了《赛博朋克2077》“只有”92帧之后,其他10款游戏的帧率都超过了100FPS,平均帧率比RTX3080还要强1%。
如果和RTX3070Ti相比,RTX4070在1080P和2K分辨率下的优势接近20%,和RTX3070相比,领先优势则接近30%。
我们也测试了图灵时代的RTX2070Super,这款显卡已经根本上时代,RTX4070比它快了近70%。
2、功耗
RTX4070的TGP为200W,不过根据我们的测试,这块显卡在游戏中的功耗实际上是很难触及到200W的。
我们测试了6款3A大作的真实游戏功耗,在1080P分辨率下RTX4070的平均功耗是171W,而RTX3070Ti是264W,RTX3080则是300W。
2K分辨率下,RTX4070在6款游戏中的平均功耗是186W,RTX3070Ti和RTX3080则分别是279W、313W。
4K分辨率下,RTX4070在6款游戏中的平均功耗为188W,RTX3070Ti是286W,而RTX3080已经跑到了320W的TGP上限。
三款显卡中,RTX4070在1080P和2K分辨率下的性能最强,但功耗还不到3080的60%。
3、DLSS3和光追
目前能玩的DLSS3游戏多达数十款,我们测试了7款。
在开启DLSS2之后,游戏帧率提升幅度为95%。打开DLSS3,游戏帧率提升幅度达到了136%。
而与RTX3070Ti相比,RTX4070在开启DLSS3之后领先前者超过50%。
4、附加价值
此次我们还体验了StableDiffusion与RTXVSR技术。
和RTX3070Ti相比,RTX4070在StableDiffusion中的出图速度不仅更快,同时功耗也低了110W。如果要生成大量图片,RTX4070仅仅160W的功耗对于机箱内部的散热也不会造成太大影响。
至于RTXVSR,这是一个实打实的视频画质增强技术,实测360P视频通过RTXVSR4x增强,最终画面效果甚至可以媲美1080P视频。1080P视频经过增强后,画面观感与4K分辨率已相差无几。
但是笔者感觉RTXVSR技术其实用在大屏电视上效果更好,如今86寸甚至100寸电视已经开始普及,这么大的屏幕,如果视频分辨率1080P,锯齿感会非常明显。
5、价格
NVIDIAGeForceRTX4070建议零售价4799元起,此次NVIDIA备足了库存,首批商家的非公版将会有一半以上以建议零售价进行销售,甚至第三方渠道首发特惠低于4799元的也会有一些。
也许这会是第一块大家都买得起的RTX40系显卡!