本文的標題是《NVIDIA RTX 3070首測 比肩RTX 2080Ti》來源于:由作者:陳李杰采編而成,主要講述了距離NVIDIA GeForce RTX 30系顯卡的發布會已經過去了將近兩個月的
距離NVIDIA GeForce RTX 30系顯卡的發布會已經過去了將近兩個月的時間,各個品牌的非公版顯卡紛至沓來,RTX 3080/3090的喧囂剛剛過去,現在RTX 3070也正式和大家見面了。
70這個型號對于玩家來說有著非常大的魔力,乃至發布會中黃仁勛都親口說道“70一直以來都是最受歡迎的型號,不管是970、1070還是2070”。
而這并不是毫無根據,以此次的RTX 3070為例,相比旗艦級產品RTX 3080的5499元售價,RTX 3070只要3899元,價格便宜1600元,但性能屬于中高端行列,根據NVIDIA官方的描述,RTX 3070的性能甚至要比RTX 2080Ti還要強上一點。
NVIDIA GeForce RTX 3070
通過NVIDIA Ampere架構所帶來的性能暴漲,究竟能不能讓昔日的萬元卡皇黯然失色,下面為大家帶來NVIDIA GeForce RTX 3070 Founders Edition版顯卡的首發評測。
01NVIDIA GeForce RTX 3070 外觀
首先來看GeForce RTX 3070顯卡的外觀,相比一同發布的另外兩兄弟,RTX 3070要小巧不少,長寬比給人非常舒服的感覺。
在外包裝上,一向是NV的極簡風格,方方正正的硬紙盒子,主色調以黑色為主,輔以玫瑰金色紋路,與RTX 3080相同。
NVIDIA GeForce RTX 3070
RTX 3070的整體外觀相較RTX 3080的差別還是比較大的,在之前的評測中我們講過RTX 3080采用了一前一后的風扇散熱設計,顯卡尾部的風扇主動將熱氣排至上方再由整體的散熱系統排出。
NVIDIA GeForce RTX 3070背板外露的散熱鰭片
雖然RTX 3070正面的設計與上一代相同,但背面其實另有玄機。這款顯卡依舊采用了超高密度的PCB板設計。
NVIDIA GeForce RTX 3070
相比RTX 3080的推拉式散熱,RTX 3070采用推式風扇設計,顯卡前端的風扇將熱空氣從機箱背部支架排出;顯卡尾部直接由正面導流罩和大量的外露散熱鰭片組成,形成中空狀態,風扇依舊會將熱氣通過散熱鰭片向上排出。根據官方的說法,與公版的RTX 2070相比,RTX 3070流式系統的靜音提高16dBA,散熱性能提升44%。
NVIDIA GeForce RTX 3070供電接口
NVIDIA GeForce RTX 3070電源轉接線
除此之外的一些細節部分,側面的GeForce RTX logo取消了LED燈,改為噴涂印刷。供電接口還是熟悉的單12pin,不過轉接線卻有些許不同,由于RTX 3070的功耗更小,采用了12pin轉8pin。所以對于大部分玩家來說,意味著可以不用大動干戈換電源,直接升級顯卡。
NVIDIA GeForce RTX 3070視頻輸出接口
在視頻輸出接口上,RTX 3070采用DP1.4a*3 + HDMI 2.1的4接口,同樣可支持單線8K的視頻輸出。
NVIDIA GeForce RTX 3070
單從外觀來講,個人認為RTX 3070沒有RTX 3080好看,但整體工藝同樣精致,只有電源的轉接線依然略有瑕疵,由于線材比較硬,從“雙馬尾”成了現在的“一柱擎天”,不過RTX 3070側面的logo并不發光,所以倒也不是很顯眼。
02NVIDIA Ampere下的RTX 3070
NVIDIA GeForce RTX 3070同樣采用了NVIDIA Ampere架構,我們首先來看一下RTX 3070的提升。
第一代RTX架構 Turing下的2070
第二代RTX架構 Ampere下的3070
相較于初代的Turing RTX架構,NVIDIAAmpere架構在算力上有著成倍的增長,這一點在RTX 3070中依舊有體現,每個時鐘執行2次著色器運算,而Turing為1次,RTX 3070的著色器性能達到20.3 TFLOPS單精度性能,而Turing為7.9 TFLOPS。
NVIDIAAmpere架構翻倍了光線與三角形的相交吞吐量,RT Core達到39.7 RTTFLOPS,而Turing為23.8 RT TFLOPS。
全新的Tensor Core可自動識別并消除不太重要的DNN權重,處理稀疏網絡的速率是Turing的兩倍,算力高達162.6 TensorTFLOPS,而Turing為60.3 TensorTFLOPS。
NVIDIA GeForce RTX 3070的GPU核心擁有174億個晶體管,392平方毫米的面積,基于三星的8nm NVIDIA定制工藝,另外在RTX 3070中我們都知道仍然采用了GDDR6顯存,不過不同于RTX 3080的Micron,RTX 3070采用了三星的GDDR6顯存。
我們在發布會中經常聽到性能翻倍的說法,其實是因為本次NVIDIAAmpere的**在Turing基礎上增加了一倍的FP32運算單元,這就使得每個**的FP32運算單元數量提高了一倍,同時吞吐量也就變為了一倍。
而通常我們計算顯卡的CUDA數量,并不是把**中的所有單元加起來計數,而是只統計FP32單元的數量,所以這樣一來,**中的【FP32 : INT32】 從 1:1 變為 2:1。
RTX 3070共有5888個CUDA,其實它只有2944個INT32單元,但由于內部的FP32數量翻了一倍,所以最終實現了5888這個驚人的數字。
而這樣粗暴的提升CUDA數量對于游戲有幫助嗎?**是有,不僅有提升還很大。其實通常在游戲中浮點運算相比整數計算要常用的多,圖形、算法以及各種計算**作中著色器工作負載通常需要混合使用FP32算數指令,而FP32的加速也有助于光線**降噪著色器。
光追工作原理示意
在此次的NVIDIAAmpere架構中,NVIDIA官方宣布為第二代RT Core,它和第一代有什么不同呢。首先要知道RT Core的工作原理是,著色器發出光線**的請求,交給RT Core來處理,它將進行兩種測試,分別為邊界交叉測試(Box Intersection testing)和三角形交叉測試(Triangle Intersectiontesting)。基于BVH算法來判斷,如果是方形,那么就返回縮小范圍繼續測試,如果是三角形,則反饋結果進行渲染。
而光線**最耗時的正是求交計算,因此,要提升光線**性能,主要是對兩種求交(BVH/三角形求交)進行加速。
RT Core的變化
在Turing的RT Core中,可以每個周期完成5次BVH遍歷、4次BVH求交以及一次三角形求交,在第二代RT Core 里,NVIDIA增加了一個新的三角形位置插值模塊以及一個的額外的三角形求交模塊,這樣做的目的是為了提升諸如運動模糊**時候的光線**性能。
運動模糊渲染原理
第二代RT Core可以讓光線**與著色同時進行,進行的光線**越多,加速就越快,它將光線相交的處理性能提升了一倍,在渲染有動態模糊的影像時,按照NVIDIA自己的實測,比Turing快8倍。
稀疏深度學習
除了光線**的強化,Ampere架構的Tensor Core也得到了極大地加強,在第三代Tensor Core中,NVIDIA引入了稀疏化加速,可自動識別并消除不太重要的DNN(深度神經網絡)權重,同時依然能保持不錯的精度。
首先原始的密集矩陣會經過訓練,刪除掉稀疏矩陣,再經過訓練稀疏矩陣,從而實現稀疏優化,進而提高Tensor Core的性能。
與此次RTX 30系顯卡一同發布的還有一項新技術——RTX IO。目前很多游戲動輒幾十G甚至百G的安裝空間,對于存儲空間的負擔暫且不提,但存放在硬盤中的數據,如果顯卡想要讀取到,需要先由CPU從硬盤中讀取壓縮過的數據,經過解壓縮再發送到顯存中。
雖然隨著NVMe SSD的推出,讀取速度相較機械硬盤能夠快20倍,但受制于傳統I/O限制,NVMe高達7GB/秒的高速讀寫對于CPU是極大的負擔。
傳統的數據交換
在這個過程中,會占用多個CPU核心,壓力急劇增大,占用較多的內存,而此時其實GPU是處于閑置狀態的。RTX IO的作用就是越過CPU解壓再傳輸數據這一步,直接從PCIE總線讀取硬盤上經過壓縮的數據,并且完成無損GPU解壓,降低CPU占用,變向提升了性能。
RTX IO可以極大解放CPU負擔
當然這項技術作為系統底層的運行方式改變,還需要借助微軟發布的DirectStorage來實現,對于目前容量的游戲來說,RTX IO的改善效果有限,但假以時日等游戲容量上百G成為常態的時候,這項技術將會發揮巨大的功效。
同時搭配新增的HDMI2.1接口,可以支持單線8K的視頻輸出,而上一代HDMI2.0僅支持4K 98Hz的視頻輸出,如果想要連接8K電視,則需要更多的線纜支持。
033DMARK 理論性能測試
首先介紹一下測試平臺,為了保證此次評測能夠發揮RTX 3070顯卡的最佳性能,主板和CPU采用了目前桌面旗艦級配置,具體如下。
在測試成績上,基準測試采用3DMARK,游戲性能測試使用游戲自帶Benchmark,同時為了減小誤差,每項測試成績均測試3遍取平均值。
GPU-Z參數
首先看一下GPU-Z的參數,RTX 3070采用了GA104核心,三星8nm,芯片面積達到了392平方毫米,相比RTX 3080的628小了236平方毫米,擁有5888個CUDA,頻率為1500-1725MHz,采用8GB GDDR6顯存,位寬為256bit,顯存帶寬達到了448GB/s,光柵單元和紋理單元分別為96和184。
下面先進行的是用來衡量顯卡DX11理論性能的3DMARKFS套裝:FS,FSE,FSU三者分別對應顯卡在1080P、2K、4K的理論性能,取顯卡分數實際測試結果如下:
3D MARK FS套裝測試
在針對顯卡DX11性能的3DMARK FS套裝測試中,RTX 3070和RTX 2080Ti互有勝負;但是相比RTX 2070的提升非常大,在FS中分數高45%,在FSE中分數高50%,在FSU中分數高56%。而RTX 3070與RTX 3080的差值比較穩定,均在28-29%之間。
3D MARK TS套裝測試
在針對DX12環境下的Time Spy和Time Spy Extreme測試中,RTX 3070和RTX 2080Ti同樣互有勝負,另外不難發現RTX 3070獲勝的測試項均為4K分辨率下的成績。
RTX 3070相比RTX 2070的TS分數高52%,TSE中分數高60%。而相比RTX 3080的差值為31-33%。
3D MARK 光追測試
PortRoyal是3DMARK中專門針對光追性能的測試項,RTX 3070的測試結果要優于RTX 2080Ti;相比RTX 2070提升53%。
在理論測試中,RTX 3070可以說和RTX 2080Ti的成績不分伯仲,下面進行游戲測試環節。不過遺憾的是我們手頭沒有公版RTX 2080Ti,無法進行對比測試。上面理論測試的環節我們也是使用之前的測試成績進行對比。
04游戲性能測試
在游戲性能測試中,我們選擇了、《古墓麗影:暗影》、《德軍總部新血脈》《孤島驚魂5》、《刺客信條:奧德賽》、國產游戲《邊境》、《光明記憶:無限》的benchmark跑分軟件。
《古墓麗影:暗影》游戲測試
在《古墓麗影:暗影》中,由于加入了光追和DLSS效果,所以我們也分為2組6測,為了照顧以前沒有DLSS時的測試分數,第一組為預設最高畫質下,RTX OFF/DLSS OFF;第二組為預設最高畫質下,RTX 超高/DLSS ON。
其中RTX 3070比RTX 2080的分數提升比較穩定為10%左右;對比RTX 2070在1080P分辨率下,高36%和37%;2K分辨率下高40%和39%;4K分辨率下高37%和42%,整體提升幅度在30-40%之間;而RTX3080相比RTX 3070的提升幅度在40%左右,可見作為旗艦卡,RTX 3080相當暴力。
《德軍總部新血脈》游戲測試
在《德軍總部新血脈》中,由于自帶兩個benchmark,所以我們的數據取跑分均值。其中RTX 3070比RTX 2080在1080P分辨率下的分數高16%,2K分辨率下高30%;4K分辨率下高25%。
《刺客信條:奧德賽》游戲測試
接下來是《刺客信條:奧德賽》,其中RTX 3070比RTX 2080在1080P分辨率下分數高18%;2K分辨率下高19%;4K分辨率下高23%。
《孤島驚魂5》游戲測試
《孤島驚魂5》同樣算是優化比較到位的3A大作,RTX 3070比RTX 2080在1080P分辨率下分數高14%;2K分辨率下高36%;4K分辨率下高41%。
《光明記憶:無限》游戲測試
《光明記憶:無限》是由飛燕群島工作室開發的《光明記憶》新系列,目前還沒有游戲提供試玩,不過benchmark的跑分軟件官方已經提供,玩家可以在steam上自行下載。另外我們在測試的時候由于無法關閉光追選項,故所有測試成績均為“RTX 最高/DLSS 質量”模式下進行。
在1080P分辨率下,RTX 3070比RTX 2080分數高17%,2K分辨率下高38%,4K分辨率下高41%。
《邊境》游戲測試
《邊境》同樣是一款來自柳葉刀工作室的國產3A大作,具體發售日期不明,目前僅提供了benchmark跑分軟件。同樣的目前跑分軟件不支持關閉光追選項,所以在測試時我們選擇“RTX 最高/DLSS 質量”下進行。
在1080P分辨率下,RTX 3070比RTX 2080分數高29%,2K分辨率下高34%,4K分辨率下高31%。整體看下來,RTX 3070相比RTX 2080的游戲分數提升為30%左右。
05溫度與功耗測試
在溫度功耗測試方面,室溫24℃,我們并沒有采用全封閉式的機箱,而是采用測試平臺的方法,這樣做可以最大限度的保證顯卡除了自身散熱外將風道等外因減小到最低。
功耗測試(點擊查看大圖)
功耗測試中,我們選擇FurMark軟件進行拷機測試,功耗僅計算顯卡自身。相比旗艦級的RTX 3080,RTX 3070的功耗要小得多,在峰值情況下整體平均在210W-220W之間。
溫度方面,本次的RTX 3070依然控制在75℃左右,在官方數據中RTX 3080采用的雙軸流式設計空氣流量相較于之前的設計增加55%,散熱效率提升30%,而RTX 3070采用了傳統的正面雙風扇設計,其中的散熱效率會有一定區別,但就RTX 3070本身而言,更高的頻率,發熱量也會有所提升。
06軟硬兼施 鑄就Ampere
好的硬件沒有軟件的加持,相當于空有長柄沒有槍頭,想要發揮十成威力則必須軟硬搭配,反之亦然。此次隨著發布會共同推出的還有以下幾項非常值得大家關注。
NVIDIA Reflex
以往我們關注延遲大多從顯示器上了解到幾毫秒極速響應,但那只是作為最終端的顯示輸出效果,你是否想過從系統內部到實際看到的畫面有多大延遲?
NVIDIA Reflex
在20系顯卡中NVIDIA反復提及的“幀能贏”,在30系顯卡中也做了更進一步的突破,除了NVIDIA將推出自己的電競顯示器NVIDIA 360Hz G-SYNC ESPORTS,還有NVIDIA Reflex技術。
以往如果想測量系統延遲需要高速相機以及定制的LED鼠標電路。而使用帶有NVIDIA Reflex技術的顯示器將內置精確的延遲分析工具,可在CPU和GPU中優化渲染管道,極大減少延遲時間,將系統延遲整體降低至30ms以下。不過就像圖中所示,為此你需要一個支持反射延遲分析的鼠標。
NVIDIA Broadcast
NVIDIA Broadcast是一款易用且專業的直播軟件,它的強大之處就在于主播不再需要任何的背景布置,只需要一個普通的攝像頭和一張GeForce RTX系列的顯卡即可。
它戳我臉!
這款軟件可以讓你雜亂無章的房間立即變成直播間,其內置了音頻降噪、背景虛化、虛擬背景、頭部**等功能。NVIDIA Broadcast的工作原理是利用AI算法通過DGX超級計算機深度學習而來。
NVENC編碼
同時RTX 30系顯卡擁有目前最好的硬件解碼器,大部分用戶的電腦在直播時打開OBS推流后CPU占用會直接飆升到50%左右,而基于GPU的NVENC解碼可以極大地減輕CPU負擔。
NVIDIA Studio
對于內容創作者來說,提到軟件可能大部分只會想到內容創作的相關軟件,但NVIDIA專為內容創作者推出的NVIDIA Studio驅動則是承擔著連接創作軟件和顯卡功能的關鍵。
NVIDIA Studio
NVIDIA Studio驅動經過更新與優化,對于最新版本的Adobe系列軟件支持更為穩定,同時附帶更出彩的創作功能。利用NVIDIA CUDA技術,GPU加速**可實現更快的實時視頻編輯并加速渲染輸出,并讓原本只能進行軟件編碼輸出的視頻輕松得到硬件的支持。另外在AI計算方面的優勢,包括自動標記片段、****和人臉識別等功能,都有顯著的速度提升。
以GPU渲染為14.98秒 而CPU渲染為11分鐘
當然NVIDIA Studio的加速創作絕不止Adobe一家,DaVinci、Keyshot、Blender、D5等專業軟件中都有非常亮眼的表現。不僅能提供強大且穩定的運行環境,更能以GPU加速,有效提升創作效率。
07銷量冠軍預定
NVIDIA GeForce RTX 3070從性能來說,與RTX 2080Ti不分伯仲,但是售價只有3899元,用中端卡的價格體驗上一代旗艦級的性能,這筆買賣簡直不能用劃算來形容,而是撿到了。
NVIDIA GeForce RTX 3070
另外在規格上,RTX 3070雖然依然采用12pin接口供電,不過里面只有6針的接口,也就是說在非公版顯卡中有可能會使用單8pin的供電接口。而從功耗上來說,RTX 3070的默頻功耗為220W,比RTX 2080 SUPER還要低,建議電源為650W,可以搭配大部分現役電源繼續使用。這對于想用新顯卡又不想整套換配件的玩家來說無疑是最大的福音。
20系與30系顯卡參數對比
在游戲表現上,RTX 3070可以說相當驚艷,目前市面上大部分游戲都可以在4K分辨率下獲得60FPS的高幀率體驗,并且在評測中我們都是以預設最高畫質下測試,很多不必要的**在真正游戲時大可以關掉,來獲得更高的幀率。
NVIDIA GeForce RTX 3070
個人認為,如果你想體驗全新的30系顯卡所帶來的性能暴漲,但又不想花上中千的價格,那么RTX 3070是最合適的。盡管在不久的將來還會有入門級的RTX 3060,性能估計也會在RTX 2070之上,但體驗到的依然是20系顯卡中高端的水準。
總的來說,NVIDIA GeForce RTX 3070做到了性能與價格兼顧,比肩RTX 2080Ti的性能,看齊RTX 2070的價格,1.6倍于RTX 2070的性能讓20系顯卡,正在以飛快的速度謝幕。如果你想升級顯卡,體驗4K游戲的超清畫質,又不想“大動干戈”,這樣一款低功耗高性能的顯卡最適合你。
NVIDIA GeForce RTX 3070
目前非公版顯卡的解禁時間為2天之后,也就是10月29日21:00,屆時各個渠道的售賣也會一同開啟,另外有爆料稱RTX 3070的供貨量將會大很多,是時候去試試手氣搶一塊了。
(7545771)
本文原作者為陳李杰,轉載請注明:出處!如該文有不妥之處,請聯系站長刪除,謝謝合作~
原創文章,作者:陳李杰,如若轉載,請注明出處:http://www.uuuxu.com/20220225205288.html