首先我們來看GeForce RTX 3060這個型號,這款卡是首次采用GA106核心的入門級顯卡,而此前發(fā)布的GeForce RTX 3060 Ti采用的是與GeForce RTX 3070相同的GA104,在核心內(nèi)部做了改動。
第一代NVIDIA RTX架構 Turing下的RTX 2060
第二代NVIDIA RTX架構 Ampere下的RTX 3060
相較于上一代的Turing RTX架構,NVIDIA Ampere架構在算力上有著成倍的增長,這一點在RTX 3060中依舊有體現(xiàn),每個時鐘執(zhí)行2次著色器運算,而Turing為1次,RTX 3060的著色器性能達到12.7 TFLOPS單精度性能,而Turing為6.5 TFLOPS。
NVIDIA Ampere架構翻倍了光線與三角形的相交吞吐量,RT Core達到24.9 RT TFLOPS,而Turing為19.5 RT TFLOPS。而且第二代光線追蹤最重要的不僅僅是性能提升,還增加了對游戲中運動模糊部分場景的光線追蹤計算加速。
例如最新發(fā)布的《賽博朋克2077》中,當玩家在游戲中遭遇賽車,追逐,打斗等激烈運動場景,第二代光追在架構上可以確保顯卡渲染幀率相對更平穩(wěn),游戲體驗上不會有頻繁掉幀帶來的頓挫感。
《賽博朋克2077》
全新的Tensor Core可自動識別并消除不太重要的DNN權重,處理稀疏網(wǎng)絡的速率是Turing的兩倍,算力高達102 Tensor TFLOPS,而Turing為51.6 Tensor TFLOPS。
在評測開始前,筆者為大家總結一些該顯卡的特點,也方便大家有針對性的閱讀:
總的來說,映眾GeForce RTX 3060冰龍超級版在外觀上去掉了側面的小風扇散熱,但由于入門級顯卡RTX 3060自身的功耗降低,溫度同樣控制在出色的62℃。性能上無需多說,它與RTX 2070的性能差距不超過2%,在游戲中的差距更是縮小到1幀的范圍。并且RTX 3060的發(fā)售價格與RTX 2060相同,可以說以入門級的價格買到上一代中端產(chǎn)品的性能,非常劃算。
01 映眾GeForce RTX 3060冰龍超級版 外觀
RTX 3060在功耗上相比本代的中高端卡要小得多,所以各廠商也有相對更大的自由度來改良自己的產(chǎn)品。下面我們先來看映眾GeForce RTX 3060冰龍超級版的外觀和改動。
映眾GeForce RTX 3060冰龍超級版
映眾GeForce RTX 3060冰龍超級版顯卡依舊采用了金屬槍灰色和黑色的碰撞拼接設計,這也是RTX 30冰龍家族式設計語言,導流罩表面復雜的金屬拼接加上螺絲點綴,給人一種機械龍翼的感覺。另外雖然RTX 3060本身的功耗較小,但這款顯卡依舊采用了三風扇的主動散熱設計,3個92mm鐮刀形風扇葉進行散熱,能有效的對內(nèi)部進行散熱,保證顯卡的穩(wěn)定運行環(huán)境。。
映眾GeForce RTX 3060冰龍超級版背板展示
映眾GeForce RTX 3060冰龍超級版顯卡的背板尾部采用鏤空設計,配合一體式的背板可以讓熱風迅速穿透散熱鰭片以及背板,令顯卡溫度進一步下降,另外在背板靠近芯片部位也有散熱孔設計,以便發(fā)熱嚴重的元件能快速散熱。
映眾GeForce RTX 3060冰龍超級版附贈的燈片
另外包裝內(nèi)還附贈了兩個燈片,可裝在顯卡側面的燈箱上方,能夠進一步增加顯卡的背光效果,完美彰顯冰龍之美。
映眾GeForce RTX 3060冰龍超級版?zhèn)让嬲故?/strong>
在此前的RTX 30系顯卡中,4風扇散熱一直是該系列標志性的體現(xiàn),而RTX 3060由于自身功耗的減小,發(fā)熱量也隨之減少,為了節(jié)約成本則去掉了顯卡側面風扇。
映眾GeForce RTX 3060冰龍超級版視頻輸出接口
視頻輸出接口上,映眾GeForce RTX 3060冰龍超級版采用DP 1.4a*3 HDMI 2.1的4接口設計,另外新的HDMI 2.1接口可支持單線8K的視頻輸出。
映眾GeForce RTX 3060冰龍超級版供電接口
在供電接口上,映眾GeForce RTX 3060冰龍超級版采用了單8pin供電,而且由于RTX 3060的自身功耗較小,實測滿載功耗僅為160W左右,外接供電的150W加上板子的75W,在不超頻的情況下是足夠的。
02 NVIDIA Ampere架構下的RTX 3060
映眾GeForce RTX 3060冰龍超級版采用了NVIDIA Ampere架構,我們首先來看一下GeForce RTX 3060的參數(shù)提升。
完整的GA106核心
完整的GA106 GPU包含3個GPC(圖形處理集群)15個TPC(紋理處理集群)以及30個SM(流處理器)組成,GPC是占據(jù)主導地位的高級模塊,擁有所有的關鍵圖形處理單元,每個GPC包含一個專用光柵引擎。在新的NVIDIA Ampere架構中,每個GPC還包含了兩個ROP分區(qū),每個分區(qū)包含8個ROP單元。
GeForce RTX 3060采用GA106核心,擁有132億5000萬(13250 million)個晶體管,276平方毫米的面積,基于三星的8nm NVIDIA定制工藝,來自三星的GDDR6顯存。
本次NVIDIA Ampere的SM在Turing基礎上增加了一倍的FP32運算單元,這使得每個SM的FP32運算單元數(shù)量提高了一倍,同時吞吐量也就變?yōu)榱艘槐丁?/p>
而通常我們計算顯卡的CUDA數(shù)量,并不是把SM中的所有單元加起來計數(shù),而是只統(tǒng)計FP32單元的數(shù)量,所以這樣一來,SM中的【FP32 : INT32】 從 1:1 變?yōu)?2:1。
GeForce RTX 3060共有3584個CUDA,其實它有1292個INT32單元,但由于內(nèi)部的FP32數(shù)量翻了一倍,所以最終實現(xiàn)了3584的CUDA數(shù)量。
而這樣粗暴的提升CUDA數(shù)量對于游戲其實有著非常大的幫助,通常在游戲中浮點運算相比整數(shù)計算要常用的多,圖形、算法以及各種計算操作中著色器工作負載通常需要混合使用FP32算數(shù)指令,而FP32的加速也有助于光線追蹤降噪著色器。
03 3DMARK 理論性能測試
首先介紹一下測試平臺,為了保證此次評測能夠發(fā)揮映眾GeForce RTX 3060冰龍超級版顯卡的最佳性能,主板和CPU采用了目前桌面旗艦級配置,具體如下。
在測試成績上,基準測試采用3DMARK,游戲性能測試使用游戲自帶Benchmark,同時為了減小誤差,每項測試成績均測試3遍取平均值。
GPU-Z參數(shù)
首先看一下GPU-Z的參數(shù),GeForce RTX 3060采用GA106核心,三星8nm工藝,芯片面積276平方毫米,擁有3584個CUDA,映眾GeForce RTX 3060冰龍超級版的Boost頻率為1837MHz,相較公版的1777MHz有一定提升。采用12GB GDDR6顯存,位寬為192bit,顯存帶寬達到了360 GB/s,光柵單元和紋理單元為48和112。
下面先進行的是用來衡量顯卡DX11理論性能的3DMARK FS套裝:FS,FSE,FSU三者分別對應顯卡在1080P、2K、4K的理論性能,取顯卡分數(shù)實際測試結果如下:
3D MARK FS套裝測試
在針對顯卡DX11性能的3DMARK FS套裝測試中,我們可以看到映眾GeForce RTX 3060冰龍超級版的性能與RTX 2070相差不大,整體約為2%,并且由于1837MHz高于公版的頻率,分數(shù)也有小幅提升。不過因為采用GA106芯片,性能要比采用GA104芯片的RTX 3060 Ti相差較大。
3D MARK TS套裝測試
而在針對DX12環(huán)境下的Time Spy和Time Spy Extreme測試中,映眾GeForce RTX 3060冰龍超級版的分數(shù)與RTX 2070進一步縮小,分數(shù)幾乎持平。
3D MARK 光追測試
PortRoyal是3DMARK中專門針對光追性能的測試項,映眾GeForce RTX 3060冰龍超級版的成績相較RTX 2070的成績低2%,同時要比RTX 3060 Ti的成績低32%,不過相較RTX 2060的成績提升更明顯,達到39%。
在理論測試中,映眾GeForce RTX 3060冰龍超級版顯卡明顯對位上一代RTX 2070,綜合能力相差約1-2%。不過作為RTX 30系中的入門卡,顯卡的價格定位與上一代RTX 2060相同,但綜合性能要比它高20-25%左右,性價比十足。當然現(xiàn)在最緊要的是能買到顯卡,而價格何時能回落目前還無法預測。
04 游戲性能測試
在游戲性能測試中,我們選擇了《德軍總部新血脈》、《孤島驚魂5》、《刺客信條:英靈殿》、《無主之地》,國產(chǎn)游戲《光明記憶:無限》的benchmark跑分軟件。
另外在游戲測試中,由于顯卡驅(qū)動的版本更新和游戲更新非常影響游戲幀數(shù),所有benchmark跑分成績均以本次成績?yōu)闇省?/p>
《刺客信條:英靈殿》游戲測試
首先我們來看看號稱眾生平等的刺客信條,游戲選擇推出不久的《刺客信條:英靈殿》,在實測中我們發(fā)現(xiàn)雖然理論成績上有所區(qū)別,但游戲中映眾GeForce RTX 3060冰龍超級版的分數(shù)與RTX 2070差距很小,幾乎只在1幀左右。
《德軍總部新血脈》游戲測試
《德軍總部新血脈》并且由于自帶兩個benchmark,所以我們的數(shù)據(jù)取跑分均值。映眾GeForce RTX 3060冰龍超級版在2K分辨率下也能跑出85幀的高水準,而這只是一張入門級顯卡,RTX 30系的實力確實不容小覷。
《孤島驚魂5》游戲測試
《孤島驚魂5》同樣算是優(yōu)化比較到位的3A大作,不過相比德軍總部的分數(shù)相對低一些,不過在2K分辨率下也能做到62幀的流暢運行。
《無主之地3》游戲測試
《無主之地3》是一款采用了卡通渲染風格的游戲。雖然畫風較卡通,但對于顯卡的要求卻比較高,比英靈殿甚至更吃配置。在“惡棍”特效下,映眾GeForce RTX 3060冰龍超級版只能在1080P分辨率下穩(wěn)定流暢運行。
《光明記憶:無限》游戲測試
《光明記憶:無限》是由飛燕群島工作室開發(fā)的《光明記憶》新系列,所有測試成績均為“RTX 最高/DLSS 質(zhì)量”模式下進行。由于這個演示demo涵蓋了大量復雜的光追元素,很少有顯卡能在4K分辨率下流暢運行。
05 溫度與功耗測試
在溫度功耗測試方面,室溫24℃,我們并沒有采用全封閉式的機箱,而是采用測試平臺的方法,這樣做可以最大限度的保證顯卡除了自身散熱外將風道等外因減小到最低。
功耗測試(點擊查看大圖)
功耗測試中,我們選擇FurMark軟件進行拷機測試,功耗僅計算顯卡自身。作為一款入門級顯卡映眾GeForce RTX 3060冰龍超級版的功耗滿載最高為160W左右,建議搭配550W及以上電源。
溫度測試
溫度方面,本次的映眾GeForce RTX 3060冰龍超級版經(jīng)過半小時左右的拷機,溫度穩(wěn)定為62℃左右,可以看到雖然去掉了側面的散熱小風扇,但3風扇加上整體的散熱設計,也使得這款顯卡有非常好的溫度控制效果。
06 部分游戲光追及DLSS效果展示
上面我們測試了部分游戲的光追和DLSS性能表現(xiàn),這些效果具體在游戲中是什么表現(xiàn),下邊筆者選擇了兩款游戲給大家展示一下。
《賽博朋克2077》RTX ON(點擊查看大圖)
《賽博朋克2077》RTX OFF(點擊查看大圖)
在《賽博朋克2077》中,光追效果隨處可見,而在游戲中也運用到了不同的光追效果,包括最常見的光追反射、陰影,還有環(huán)境光遮蔽、漫反射照明以及全局光照等比較高級的效果。
《堡壘之夜》RTX ON(點擊查看大圖)
《堡壘之夜》RTX OFF(點擊查看大圖)
堡壘之夜的光追效果還是比較明顯的,其中加入了反射、全局照明和路徑追蹤等效果。卡車車身上的反射較為明顯,角色身上的環(huán)境光在打開光追后更為寫實,另外仔細看的話遠處建筑物的玻璃同樣有光線的反射,整體畫質(zhì)改善非常明顯。
《魔獸世界9.0》RTX ON(點擊查看大圖)
《魔獸世界9.0》RTX OFF(點擊查看大圖)
《魔獸世界9.0》同樣作為一款卡通渲染的網(wǎng)游來說,魔獸的年代更加久遠,此次加入光追效果在整體視覺上沒有堡壘之夜明顯。不過如遠處的樹木陰影,以及近處石臺下方的陰影都比較明顯。
《控制》RTX ON(點擊查看大圖)
《控制》RTX OFF(點擊查看大圖)
《控制》這款游戲所采用的引擎物理效果非常出色,同時光追開關的對比也是肉眼可見的明顯。包括玻璃上的人物反光,遠處地面的植物反光都比較清晰,同時打開光追后屋頂處的明暗對比也更加明顯。
DLSS模式對比
DLSS的對比測試我們選擇《賽博朋克2077》這款游戲,2K/RTX ON/DLSS關閉 原生畫質(zhì)下作為標準,在打開DLSS質(zhì)量模式后可以看到整體畫面幾乎沒有任何變化,廣告牌的字樣邊緣依然很清晰。在DLSS平衡和DLSS性能模式中依然有著不錯的狀態(tài),整體相較原生畫質(zhì)并無二致。
07 軟硬兼施 鑄就Ampere
好的硬件沒有軟件的加持,相當于空有長柄沒有槍頭,想要發(fā)揮十成威力則必須軟硬搭配,反之亦然。此次隨著發(fā)布會共同推出的還有以下幾項非常值得大家關注。
NVIDIA Reflex
以往我們關注延遲大多從顯示器上了解到幾毫秒極速響應,但那只是作為最終端的顯示輸出效果,你是否想過從系統(tǒng)內(nèi)部到實際看到的畫面有多大延遲?
NVIDIA Reflex
在20系顯卡中NVIDIA反復提及的“幀能贏”,在30系顯卡中也做了更進一步的突破,除了NVIDIA將推出自己的電競顯示器NVIDIA 360Hz G-SYNC ESPORTS,還有NVIDIA Reflex技術。
以往如果想測量系統(tǒng)延遲需要高速相機以及定制的LED鼠標電路。而使用帶有NVIDIA Reflex技術的顯示器將內(nèi)置精確的延遲分析工具,可在CPU和GPU中優(yōu)化渲染管道,極大減少延遲時間,將系統(tǒng)延遲整體降低至30ms以下。不過就像圖中所示,為此你需要一個支持反射延遲分析的鼠標。
NVIDIA Broadcast
NVIDIA Broadcast是一款易用且專業(yè)的直播軟件,它的強大之處就在于主播不再需要任何的背景布置,只需要一個普通的攝像頭和一張GeForce RTX系列的顯卡即可。
寵物派對直播
這款軟件可以讓你雜亂無章的房間立即變成直播間,其內(nèi)置了音頻降噪、背景虛化、虛擬背景、頭部追蹤等功能。NVIDIA Broadcast的工作原理是利用AI算法通過DGX超級計算機深度學習而來。
NVENC編碼
同時RTX 30系顯卡擁有目前最好的硬件解碼器,大部分用戶的電腦在直播時打開OBS推流后CPU占用會直接飆升到50%左右,而基于GPU的NVENC解碼可以極大地減輕CPU負擔。
NVIDIA Studio
對于內(nèi)容創(chuàng)作者來說,提到軟件可能大部分只會想到內(nèi)容創(chuàng)作的相關軟件,但NVIDIA專為內(nèi)容創(chuàng)作者推出的NVIDIA Studio驅(qū)動則是承擔著連接創(chuàng)作軟件和顯卡功能的關鍵。
NVIDIA Studio
NVIDIA Studio驅(qū)動經(jīng)過更新與優(yōu)化,對于最新版本的Adobe系列軟件支持更為穩(wěn)定,同時附帶更出彩的創(chuàng)作功能。利用NVIDIA CUDA技術,GPU加速特效可實現(xiàn)更快的實時視頻編輯并加速渲染輸出,并讓原本只能進行軟件編碼輸出的視頻輕松得到硬件的支持。另外在AI計算方面的優(yōu)勢,包括自動標記片段、特效追蹤和人臉識別等功能,都有顯著的速度提升。
以GPU渲染為14.98秒 而CPU渲染為11分鐘
當然NVIDIA Studio的加速創(chuàng)作絕不止Adobe一家,DaVinci、Keyshot、Blender、D5等專業(yè)軟件中都有非常亮眼的表現(xiàn)。不僅能提供強大且穩(wěn)定的運行環(huán)境,更能以GPU加速,有效提升創(chuàng)作效率。
08 入門價格中端性能
映眾GeForce RTX 3060冰龍超級版去掉了側面的小風扇散熱,但由于入門級顯卡RTX 3060自身的功耗降低,溫度同樣控制在62℃。而風扇空缺的部分非常巧妙的以燈片做裝飾,不僅起到了點綴作用,還增加了顯卡的背光面積。
映眾GeForce RTX 3060冰龍超級版
除此之外,映眾GeForce RTX 3060冰龍超級版的外觀依舊繼承了RTX 30系列的家族風格,尺寸幾乎無變化,但重量減輕了不少,這也是少有的可以不用顯卡支架直接側裝在主板上的顯卡。
映眾GeForce RTX 3060冰龍超級版
性能上無需多說,相信看過上面所有測試的用戶會發(fā)現(xiàn)映眾GeForce RTX 3060冰龍超級版幾乎與RTX 2070的性能差距不超過2%,在游戲中的差距更是縮小到1幀的范圍。并且RTX 3060的發(fā)售價格與RTX 2060相同,可以說以入門級的價格買到上一代中端產(chǎn)品的性能,非常劃算。
映眾GeForce RTX 3060冰龍超級版
雖然同樣作為入門級顯卡,但RTX 3060相比RTX 2060,采用了全新的NVIDIA Ampere架構,擁有更純熟的第二代RT Core和第三代Tensor Core,在光線追蹤和AI學習方面都有不同程度加強,對于目前的游戲?qū)兄玫男阅鼙憩F(xiàn)。
信很多做設計的用戶都在選擇專業(yè)顯卡還是游戲顯卡上糾結過,本站之前的一篇文章《專業(yè)圖形顯卡和普通游戲顯卡的區(qū)別》也做過介紹,不過當時沒有進行具體的顯卡對比實測,這里我們就分別找來兩張quadro專業(yè)顯卡和 geforce游戲顯卡,通過實測的方式告訴大家到底該如何選擇。
專業(yè)顯卡是什么?什么樣的人適合買專業(yè)顯卡?專業(yè)顯卡可不可以用來打游戲?游戲顯卡能不能代替專業(yè)顯卡?本文將一一為你解答。
一、什么是專業(yè)顯卡? Geforce、Quadro、Tesla產(chǎn)品線介紹
首先我們需要了解一下nvidia推出的顯卡產(chǎn)品線。
1、Geforce——游戲顯卡
它是銷售產(chǎn)品線最廣,也是大家最熟悉的系列,主要面向普通消費者,主業(yè)用來玩游戲,但也可以用在設計、渲染、剪輯等生產(chǎn)力工作上。它的應用最為廣泛,從入門到高端各個定位的型號都有,如果你只是一般用戶,沒有什么特殊需求,那么選擇Geforce系列就可以了。
2、Quadro——專業(yè)繪圖顯卡
Quadro是特別針對繪圖領域以及特定的3D渲染需求,比如像是各種CAD軟件,包括3ds MAX、Auto CAD、Solidwork等,而推出的專業(yè)顯卡。能用它的大多數(shù)都是靠這行吃飯的,比如建筑師、設計師等等。
3、Tesla——深度學習運算顯卡
用于學術、深度運算等領專業(yè)域,和99%的用戶都沒什么關系。
二、Geforce和Quadro的架構一樣嗎?
由于Geforce和Quadro是兩種不同產(chǎn)品線的顯卡,所以很多人可能會誤認為它們兩個的架構也不一樣,但其實Quadro產(chǎn)品所用的GPU架構和Geforce是完全相同的。
這里本文就找了一張Quadro K2200顯卡和Geforce GTX750Ti來為大家做對比測試。
K2200和GTX750Ti都屬于Maxwell架構,而且它們都用的是同一顆名為GM107的核心,并且連CUDA核心數(shù)量,SM單元、L1、L1緩存都是一樣的規(guī)格。
那么問題就來了,既然用的是一模一樣的核心,為什么還要分出兩種不同的系列?更重要的是它們直接的差價還很大。750ti當年的首發(fā)價格是999元,而K2200差不多在2500元。這么一比,同樣的核心,只是系列不同,差價卻高達2倍之多,這不是明搶么?
所以本站就為大家?guī)韮煽钕嗤诵牡腉eforce和Quadro系列顯卡,用測試對比的方式來為大家解答這個問題。
三、K2200顯卡和GTX750Ti參數(shù)規(guī)格對比
在核心規(guī)格上,二者的確沒有什么差異,不過還是有一些細節(jié)有所不同。首先是核心頻率部分,雖然這里看起兩張想看的頻率相差不大,但實際上Geforce顯卡的頻率普票都會拉的更高,會比原廠預設高不少,因為Geforce顯卡通常都是用來打游戲的,追求的是單位時間內(nèi)更快速的運算,更高的頻率意味著每秒運算的數(shù)據(jù)量就越多,也就可以渲染出更多的幀數(shù),游戲畫面自然更加流暢。
而用于繪圖的Quadro,追求的是畫面細節(jié)的精確度,如果刻意去追求頻率的話,除了可能會造成顯卡不穩(wěn)定外,在超頻運算的狀態(tài)下也可能會增加運算出錯的幾率,從而導致渲染出來的圖像不夠精確。所以專業(yè)顯卡一般都會維持原廠預設的頻率,以確保可以穩(wěn)定的運算。
顯存方面,專業(yè)顯卡為了應付模型復雜的圖像運算,一般都會配備較大的顯存,因為越高分辨率或者規(guī)模越大的設計圖,就需要占用更大的顯存空間,所以專業(yè)顯卡提供的顯存容量一般都要比同核心的游戲顯卡更大。比如同樣是使用TU102核心的Quadro RTX8000和Geforce RTX2080Ti,前者的顯存是48G,后者只有11G,這就是用途上的不同而產(chǎn)生出的規(guī)格差異。
另外在接口規(guī)格上,Quadro一般也要比Geforce好一些。像K2200就有兩個DP1.2接口,可以同時外接兩個4K 60Hz的屏幕,因為對于繪圖需求來說,上到更高分辨率的屏幕就可以看到更多的畫面細節(jié);而本文測試的這張GTX750Ti就只提供了兩個HDMI 1.4,最高只能輸出4K 30Hz的畫面(不過現(xiàn)在隨著DP1.4及HDMI2.1的普及,Geforce的顯卡現(xiàn)在也能很好的支持高分辨率屏幕了)
而在功耗方面,Geforce顯卡往往會因為額外的超頻以及需要足夠的瞬間輸出性能,所以功耗一般都比Quadro要高。雖然GTX750Ti官方標注的功耗比K2200低,但實際上本文用的這種GTX750Ti是需要額外6pin供電的,在運行時的功耗肯定要比官方標注的功耗更高。而Quadro顯卡為了能有穩(wěn)定的表現(xiàn),所以一般都會維持原廠預設頻率,因此功耗和發(fā)熱量都比較低。
三、Geforce和Quadro最大的不同其實是驅(qū)動程序
大家可能聽說過這樣一句話“一臺電腦如果沒有操作系統(tǒng)的話那就是一堆廢鐵”。對于顯卡來說,驅(qū)動就像是它的操作系統(tǒng),你可以試下不給你的顯卡打驅(qū)動,然后去玩游戲是個什么效果。
Geforce和Quadro的驅(qū)動有著很大的區(qū)別。Geforce的驅(qū)動主要針對Directx做優(yōu)化,來強化它的游戲及部分生產(chǎn)力的性能,對于新上市的游戲,Geforce的驅(qū)動兼容性也比較好,即便是有什么bug出現(xiàn),Geforce驅(qū)動也會在第一時間進行修復。而Quadro則是針對各類專業(yè)軟件,比如AutoDesk、Solidwork、ANSYS、PTC、Siemens進行深度合作優(yōu)化,在運行OpenGL程序庫時能發(fā)揮更好的性能,而對于游戲就不會像Geforce那樣頻繁更新。
所以有人甚至說,買專業(yè)顯卡并不會為了硬件規(guī)格去的,而是為了它的驅(qū)動優(yōu)化,可見驅(qū)動對于專業(yè)顯卡的重要性。
四、Geforce和Quadro性能對比測試
1、3D Mark測試
在3D Mark Fire Strike測試中,K2200的得分是4288,比GTX750Ti要低11%。由于3D Mark主要是以顯卡的游戲性能為主,會對DirectX做優(yōu)化,所以Geforce顯卡在這項測試中優(yōu)勢很明顯。
2、游戲測試
本文測試的這兩款顯卡都屬于入門型號,所以游戲畫質(zhì)設定在1080P分辨率,畫質(zhì)為中檔。
在英雄聯(lián)盟中,GTX750Ti以185幀的優(yōu)勢完勝K2200。而在GTA5和巫師3這兩款游戲中,二者的表現(xiàn)非常接近,這是因為GTA5和巫師3對于顯存容量需求比較大,2G顯存的GTX750Ti在運行這兩款游戲的時候顯存都被吃滿,顯存成了制約GTX750Ti游戲性能發(fā)揮的瓶頸,如果換成4G版本的GTX750Ti的話,差距就會被拉開了。
專業(yè)顯卡能不能玩游戲?
從游戲測試中來看,好像專業(yè)顯卡也可以用來打游戲,但是你別忘了這兩張顯卡價格差有多大,花了2倍多的價格,游戲性能還不及GTX750Ti,得是人傻錢多的才會拿專業(yè)顯卡去打游戲吧。
所以對于專業(yè)顯卡能不能玩游戲這個問題的答案就一目了然了:能玩,但是性價比非常非常低。
3、專業(yè)軟件測試
由于專業(yè)軟件測試的數(shù)據(jù)不好以圖表的方式呈現(xiàn),所以就以文字來敘述。
在SPECviewperf測試中,我們用其自帶的模擬情景來測試顯卡的繪圖性能。首先是3Ds MAX,它模擬了多個窗口的立體圖形。這兩張顯卡在該項測試里并沒有太大差異,因為3Ds MAX是支持DriectX的,所以Geforce系列的顯卡也能發(fā)揮出和Quadro差不多的性能表現(xiàn)。不過當測試場景變的復雜的時候,顯存壓力開始增大,4G顯存的K2200的表現(xiàn)就比2G顯存的GTX750Ti要好很多。
接下來測試的是以OpenGL為主的Catia,在這項測試中,Quadro專業(yè)顯卡的優(yōu)勢就發(fā)揮出來了。在飛機流體渲染環(huán)境中,雖然兩張顯卡跑起來都很吃力,但K2200還是要比GTX750Ti高出2倍的幀率,并且這里顯存都沒有吃滿,所以可以推論Quadro顯卡在這里的優(yōu)化做的更好,渲染效率更高。尤其是在汽車渲染的部分,K2200能跑到170幀,比GTX750Ti高出100多幀,差距最大的時候甚至能達到10倍,相當夸張。
最后在Maya測試中,這兩個顯卡的表現(xiàn)也差不多,因為Maya目前已經(jīng)支持DriectX,所以用Geforce顯卡也會有不錯的表現(xiàn)。
相關文章:
《設計電腦配置推薦》
《做圖用什么顯卡好,圖形渲染CPU重要還是顯卡重要》
《麗臺P1000和T1000有什么區(qū)別?哪個性能更強?》
們拿到了已經(jīng)被大家念叨半個多月的RTX 3080公版卡。
關于這卡的梗我覺得應該已經(jīng)不用多介紹了。NVIDIA新一代Ampere核心GPU采用了三星的8nm制程,在性能和功耗上都實現(xiàn)了新的飛躍。按照NVIDIA的說法,中端的RTX 3070性能就超過了上一代卡皇RTX 2080Ti,高端的RTX 3080性能則大概是RTX 2080的兩倍左右,上面還有更強力的旗艦RTX 3090。
性能強也就罷了,定價也充滿了驚喜,RTX 3070參考價499美元,RTX 3080定價699美元。也就是說,3000左右塊錢的中端卡就能擁有幾個月前價值萬元的旗艦卡的性能。
之前我們此前有一篇文章,匯總了一下網(wǎng)友們知道這個性能和這個價位之后的表現(xiàn)。
新卡公布不久,游研社作為第一批測評媒體就拿到了公版顯卡。由于NDA的原因,相關的測試內(nèi)容現(xiàn)在才能發(fā)布。這幾天把我們也憋得心癢難耐。
測試之前還是先說說外觀吧。很多人應該已經(jīng)見過網(wǎng)上流出的一些新卡尺寸的示意圖了,特別是這張:
不過實際到手之后,帶散熱的公版RTX 3080和公版RTX 2080三維其實相差不大,放一般的中塔機箱肯定是沒問題的,絕大部分兼容300mm長顯卡的M-ATX和ITX機箱也肯定能放下。當然RTX 3090就是另外一個故事了。
而且公版RTX 3080這個尺寸,其實也有點“虛胖”。PCB尺寸挺短的,有半截都是空心的散熱結構。改成水冷頭的話,可能也就ITX短卡的大小。
這半截其實上下通透
這個結構做的確實非常漂亮,比起上一代RTX 20系列的“煤氣灶”,顏值和科技感都上了一個檔次。
這是NVIDIA公版卡非常獨特的散熱設計。和傳統(tǒng)顯卡的散熱設計不同,這個新設計正反兩面都有風扇。正面的風扇結構有點像老式的渦扇散熱,冷風下吹,熱量從機箱背面排出。背面的風扇則將冷風上吸,引導進入CPU散熱的風道。
這種散熱既有下吹式的高效率,也像渦扇散熱一樣減小了機箱的積熱。采用新散熱,主要的原因還是這代顯卡的規(guī)格又有了一次躍升。8000多個CUDA核心,比RTX 2080Ti幾乎翻倍。68個RT核心比2080Ti也增長了30%。得益于8nm制程和新架構帶來的高效率,功耗增長得不多,但是TDP也到了320W。
在測試中,公版散熱單烤Furmark在74度左右,整體效率還是可以的。這種設計會對CPU散熱會增加一些壓力,但是具體影響還是要看CPU散熱形式、承載能力和風道走向。我們在測試的時候,CPU核心溫度確實比測RTX 2080Ti的時候要高一些,但是由于沒有和傳統(tǒng)散熱形式的RTX 3080作嚴格對比,這個差異沒有什么價值。
我們這次使用的測試平臺是AMD 3900X + 技嘉X470 Gaming Elite的組合。內(nèi)存頻率定在3000MHZ,使用兩塊西數(shù)SN750作為系統(tǒng)和倉庫盤。這個配置應該比較接近現(xiàn)在常見的中高端游戲電腦,對普通玩家的參考價值會更大一些。作為顯卡性能對比的基準,我們用了一塊公版的RTX 2080Ti。兩個月前還是不可一世的消費級旗艦,現(xiàn)在就已經(jīng)有點準備老驥伏櫪的意思了。
我們先測了一些基準性能。3DMark測了兩項:考驗綜合DX12 4K游戲性能的Time Spy Extreme,和考驗光線追蹤性能的Port Royal。
沒有光線追蹤的常規(guī)游戲方面,我們測試了《荒野大鏢客2》和《巫師3》兩款比較經(jīng)典,對PC優(yōu)化也不錯的大作作為基準。《荒野大鏢客2》在4K最高畫質(zhì)下使用游戲內(nèi)置Benchmark,《巫師3》則在4K最高畫質(zhì)下,開啟最高檔的Hairworks,對于顯卡性能是一個挺嚴苛的考驗。兩款游戲最終平均幀數(shù)提升都超過40%,想想RTX 3080首發(fā)價格只有RTX 2080 Ti的一半,不由得讓人感嘆科技的進步。
RTX 30系列的NVIDIA Ampere架構GPU使用了第三代Tensor Core,效率和性能都有一定優(yōu)化。《德軍總部:新血脈》是一款和NVIDIA新技術結合比較好的游戲,從我們的測試來看,這款游戲開啟DLSS后的表現(xiàn)十分驚艷,運行速度和畫面質(zhì)感提升也很明顯。在4K最高特效,開啟光追和DLSS之后,RTX 3080 Benchmark跑到了154FPS,比RTX 2080Ti提高了37%。
不過這種性能提升在不同游戲中還是存在一定差異。《控制》在4K,光追高,不開DLSS的情況下性能提高了25%左右,開啟DLSS之后,幀數(shù)大概有22%的提升。
《死亡擱淺》不支光線追蹤,但是支持DLSS。RTX 3080對比RTX 2080 Ti,未開啟DLSS時的性能提升了32%,開啟DLSS后性能也提升了40%。
總體來說, RTX 3080傳統(tǒng)渲染性能在幀數(shù)上的表現(xiàn)要比2080 Ti強30%-40%左右,確實差不多也就是RTX 2080的兩倍。而RTX和DLSS相關的性能,比起上代顯卡也有了顯著的提升。
我們還測試了一下RTX 3080運行《光明記憶》benchmark時的光線追蹤性能。這款游戲使用了大量的光線追蹤渲染技術,在開啟光追之后對顯卡的負擔非常大。如果不開啟DLSS,只開啟光線追蹤,RTX 2080Ti在1080P分辨率下尚能流暢運行,4K分辨率下就和幻燈片差不多了。
RTX 3080在不開啟DLSS,光追高的設置下,在1080P下跑出了70FPS的成績,而開啟DLSS性能模式后,則猛增到了132FPS。同樣的設置,不開啟DLSS,4K分辨率只有16FPS,勉強好過幻燈片,而開啟DLSS之后已經(jīng)可以相對流暢地運行了。
《堡壘之夜》這款歐美人氣極高的大作,借著RTX 30系列顯卡的發(fā)布,也宣布支持光線追蹤技術。RTX 3080在4K分辨率下開啟光線追蹤和DLSS平均幀數(shù)能到50-55FPS,相當可玩。
《堡壘之夜》開啟/關閉光線追蹤的對比
硬性能只是一個層面。進一步整合CUDA、Tensor Core和RT Core之后,Ampere架構的RTX 3080還有著更低的渲染延遲。
在Furmark烤機測試中RTX 3080(黃色)渲染延遲要顯著低于RTX 2080Ti(黑色)
在這個基礎上,NVIDIA還提供了一個叫做NVIDIA Reflex的技術,配合支持NVIDIA G-SYNC的顯示器,可以有效降低整個系統(tǒng)的操作延遲,提高電競選手的表現(xiàn)。目前Reflex已經(jīng)確定支持《堡壘之夜》、《無畏契約》、《APEX英雄》等游戲。
低系統(tǒng)延遲對于電競游戲的意義不需要我們再多說什么了。高刷新率顯示器能夠立竿見影地縮短電競選手的反應時間,而NVIDIA Reflex則在這個基礎上更進一步,從根源上減輕系統(tǒng)延遲,消滅卡頓。
我們分別用RTX 2080Ti和RTX 3080進行了幾場《堡壘之夜》吃雞模式的戰(zhàn)斗。RTX 2080Ti 在4K分辨率下有一個情況很明顯:游戲整體幀數(shù)挺高的,但是遇敵接戰(zhàn)的時候,偶爾會有一些操作與視覺反饋之間微妙的卡頓。
特別時這種大戰(zhàn)一戶口本的情況
而開啟Reflex之后,這種卡頓基本上就消失了。跑圖的時候,物品交互,瞄準射擊,體感延遲都降低了不少。
新的NVIDIA Broadcast功能則或充分利用了RTX 30系列顯卡的AI優(yōu)勢,優(yōu)化了直播推流的效率,還推出了AI降噪、虛擬背景、人像跟蹤等非常實用的功能。
除了推薦有升級需求的玩家放心買爆之外,RTX 3080也讓我們看到了幾個值得關注的未來趨勢。
一個是供電系統(tǒng)的變化。這次RTX 3080公版采用了一個12pin的供電接頭,從設計來看和英特爾今年新推的10pin主板供電設計很像,應該都是基于全新的ATX12VO供電標準。這個標準會大大簡化機箱內(nèi)走線,電源體積可能也會比以前要精簡很多,很可能隨著下一代CPU/主板的發(fā)布而開始普及。這一兩年打算整體升級電腦的玩家可以多關注一下。
這個新的12pin接口尺寸非常迷你
另外一個趨勢,倒是和這次沒登場的RTX 3070有關。從對比測試的結果和我們平時的游戲體驗來看,雖然絕對性能被新卡碾壓,但是舊皇2080Ti在4k分辨率下的游戲體驗已經(jīng)非常優(yōu)秀,沒有光線追蹤的游戲基本都可以高特效60FPS以上流暢運行。如果同樣性能水平RTX 3070能夠穩(wěn)定在3000元左右的價位,對于大部分玩家來說,淘汰1080P顯示器的時間已經(jīng)快到了。