欄目導(dǎo)航

新聞資訊

新聞資訊

本期我們的主題是主機(jī)中最基礎(chǔ)的硬件之一——顯卡。

很多玩家在選購(gòu)顯卡的時(shí)候都是抱著一種“貴的顯卡肯定好”的態(tài)度，雖然道理沒錯(cuò)，但是很多時(shí)候都會(huì)變成，花了很多錢，但是自己實(shí)際使用時(shí)根本用不了這么多性能；而且往往學(xué)生黨們對(duì)于顯卡的理解還停留在顯存和頻率這兩個(gè)點(diǎn)上，真要讓他對(duì)比一下Nvidia GTX 1070和GTX 1060 3G的區(qū)別時(shí)，卻說(shuō)不出個(gè)所以然來(lái)。

TITAN Xp星球大戰(zhàn)典藏版（圖片來(lái)源于網(wǎng)絡(luò)）

所以本次筆者為那些想要更換顯卡，但是又不太了解顯卡的學(xué)生玩家們進(jìn)行一個(gè)詳細(xì)的科普，讓你們?cè)敿?xì)的去了解一下顯卡的各個(gè)參數(shù)究竟是起什么作用的，在今后選擇顯卡的時(shí)候，能有更多的幫助。

顯卡核心

既然要給大家科普一下顯卡的各種參數(shù)，首先先推薦給大家一款非常好用的軟件，GPU-Z是TechpowerUP推出的軟件之一，一些熟悉DIY的玩家對(duì)它肯定不會(huì)陌生，這款軟件也是大多數(shù)顯卡愛好者和游戲玩家都配備的，所以就以GPU-Z來(lái)為大家進(jìn)行詳細(xì)的解析。

GPU-Z絕對(duì)顯卡愛好者必備工具，它可以輕松幫助你看到一切顯卡參數(shù)，甚至可以幫你看到一些電壓和顯卡溫度能監(jiān)測(cè)數(shù)據(jù)。接下來(lái)就讓我們看看，在GPU-Z上顯示的這些參數(shù)究竟是干什么用的，首先來(lái)看一下整體的顯示界面。

GPU-Z整體截圖

這個(gè)我們要分為上下兩個(gè)部分來(lái)看，第一部分主要包括芯片的生產(chǎn)信息，其中包括：GPU型號(hào)、顯卡完整名稱、修訂版本號(hào)、晶體管數(shù)量、芯片尺寸、以及采用的納米級(jí)工藝等。也包括一些BIOS版本和生產(chǎn)設(shè)備ID和制造商子廠商等信息。這些游戲基本上對(duì)于GPU有興趣的專業(yè)人士可以多關(guān)注一下，對(duì)于普通游戲玩家來(lái)說(shuō)，只要認(rèn)出芯片型號(hào)和制造工藝就可以了。

上半部分參數(shù)

GPU-Z的后半部分的信息才是最為重要的，其中大部分是關(guān)于該顯卡主要指標(biāo)，其中包括：流處理器數(shù)量、紋理單元、光柵單元、顯存容量、以及顯存類型、顯存帶寬等，其中也記錄了顯卡核心頻率和顯存頻率。

下半部分參數(shù)

這個(gè)時(shí)候很多就該開始抱怨了，這都什么跟什么啊？這么多參數(shù)而且還這么亂，小白表示完全看不懂，所以所以接下來(lái)筆者就帶領(lǐng)讀者們?cè)敿?xì)分析一下這些主要參數(shù)分別都起到什么作用。

對(duì)于玩家來(lái)說(shuō)，買顯卡就是為了性能，所以性能的高低直接影響著玩家的體驗(yàn)效果，不過(guò)大多數(shù)玩家在挑選顯卡時(shí)都是靠顯存來(lái)辨別的，這種方法雖然不能說(shuō)是錯(cuò)誤的，但是容易誤導(dǎo)玩家，例如架構(gòu)和頻率等發(fā)生變化的話，那么如果單從顯存來(lái)判斷的話，很容易出現(xiàn)誤差。

GP104架構(gòu)圖

而真正對(duì)于顯卡性能起到很關(guān)鍵作用的，則是流處理器數(shù)量和核心頻率，不過(guò)這兩點(diǎn)往往被玩家們忽視或者說(shuō)不明所以。

流處理器的數(shù)量在同等級(jí)的架構(gòu)中可以說(shuō)直接影響性能。因?yàn)樵蕉嗟牧魈幚砥骶鸵馕吨礁叩奶幚砟芰Γ粤魈幚砥鞯氖找嬉彩敲恳环侄加刑岣叩?。這一點(diǎn)非常容易被大部分人忽略掉。

TITAN X

還有一點(diǎn)需要大家注意一下，流處理器數(shù)量只能用于判斷同一個(gè)GPU架構(gòu)內(nèi)的性能，對(duì)于不同的架構(gòu)不能直接通過(guò)流處理器數(shù)量判斷性能，所以這也就是為什么不建議拿N卡和A卡直接比較流處理器數(shù)量判斷性能的原因。

而另一個(gè)對(duì)顯卡性能起到關(guān)鍵作用的就是——核心頻率。它可以代表顯卡的工作頻率，通?？梢岳斫鉃轭l率越高得到的性能也就越多。所以玩家們往往選擇超頻提高性能，也是玩家為數(shù)不多可以通過(guò)自己的手段拉高性能的方式之一，畢竟頻率是“活”的，但顯卡規(guī)格是“死”的。

VEGA

如果說(shuō)了這么多還不是很明白的話，那么可以總結(jié)成一句話：在架構(gòu)和流處理器相同的情況下，核心頻率越高，顯卡的性能就越強(qiáng)。而流處理器數(shù)量對(duì)核心顯卡頻率也存在著一定的影響，例如：流處理器數(shù)量越多的顯卡，可超頻的提升空間越大，而流處理器越少，核心頻率低的顯卡，性能也就低并且功耗也會(huì)降低。

前面提到了很多小白玩家在選擇顯卡的時(shí)候，最注重的就是顯存，當(dāng)然這也跟商家在宣傳時(shí)，著重宣傳這部分所導(dǎo)致，這里并不是說(shuō)顯存不重要，相反，顯存對(duì)于顯卡的性能影響來(lái)說(shuō)非常重要，但顯存也有著許多的指標(biāo)，例如：類型、容量、帶寬、位寬、速率等。這些指標(biāo)都有著或多或少的關(guān)系。

GTX 1080上使用的GDDR5X顯存

在這里大家要明確一點(diǎn)：顯存是為顯卡服務(wù)的，它的作用是將GPU核心運(yùn)算出的數(shù)據(jù)進(jìn)行短暫的存儲(chǔ)，也就是說(shuō)顯存和GPU之間需要頻繁地交換數(shù)據(jù)，所以顯存對(duì)顯卡性能有著至關(guān)重要的作用。

GDDR5X顯存顆粒

那么筆者就來(lái)說(shuō)說(shuō)決定顯存性能的首要因素，那就是顯存類型。目前最主流的顯存類型為GDDR5，還有就是在GTX 1080發(fā)布后，NVIDIA所使用的GDDR5X顯存，以及更高級(jí)一些的R9 Fury X上的HBM顯存和Vega及Volta上使用的HBM2顯存

GDDR5X顯存特性

GDDR5顯存的極限速率為9Gbps，單顆容量最高可達(dá)2GB；GDDR5X目前可以達(dá)到11Gbps，但理論極限可以達(dá)到16Gbps，根據(jù)協(xié)議單顆最高容量同樣為2GB；HBM顯存的極限速率為1Gbps，單顆容量為1GB，而2代HBM則可以達(dá)到2Gbps的速率，容量最高可達(dá)單顆8GB。

GDDR5顯存將成為GPU性能提升的阻礙

最后跟前面一樣，一句話總結(jié)：顯存確實(shí)對(duì)于顯卡性能有影響，但是也要具體去看顯存的類型以及其他方面，如果小白玩家對(duì)于前面的長(zhǎng)篇大論還是理解不清的話，那么記住這句話就完全足夠用了。如果你對(duì)此想更深一步了解，那么請(qǐng)記住顯存類型決定了顯存的位寬，而顯存帶寬則直接由顯存位寬和顯存速率所決定。

在了解到以上信息之后，相信您已經(jīng)對(duì)顯卡有了更多更詳細(xì)的認(rèn)識(shí)。后續(xù)我們會(huì)針對(duì)不同的購(gòu)買需求，通過(guò)實(shí)例來(lái)為大家介紹如何在裝機(jī)時(shí)購(gòu)買到一款適合自己的顯卡產(chǎn)品。

喜歡就關(guān)注我哦~

于PC來(lái)說(shuō)，決定游戲體驗(yàn)的硬件無(wú)非就是CPU、顯卡和內(nèi)存。顯卡在游戲中起著決定性的作用，往往高一級(jí)的顯卡就能有更流暢的表現(xiàn)，而CPU的頻率以及核心數(shù)量則是加分項(xiàng)，某些游戲?qū)Ω哳l率或者多核心都有特定的加成，內(nèi)存方面的影響稍遜于前兩者，但對(duì)于游戲幀數(shù)的提升也有一定的幫助，這主要體現(xiàn)在內(nèi)存的單、雙通道上。那么除了這三大件以外，決定游戲體驗(yàn)的還有什么呢？

可能大家往往會(huì)忽視一點(diǎn)，作為畫面輸出終端的顯示器才是我們游戲體驗(yàn)的最后一環(huán)，無(wú)論前端的CPU怎么計(jì)算、顯卡怎么渲染，最后都得輸出到顯示器上。從某種角度來(lái)說(shuō)，顯示器上的畫面流暢與否直接決定了我們游戲體驗(yàn)的好與壞。所以說(shuō)，顯示器是除CPU、顯卡、內(nèi)存之外決定游戲體驗(yàn)的另一大硬件。

隨著近幾年FPS和MOBA游戲的火熱，顯示器領(lǐng)域也逐漸衍生出一個(gè)新的分支，即電競(jìng)顯示器。不同于傳統(tǒng)的顯示器，電競(jìng)顯示器一般有著更大的屏幕尺寸、更高的分辨率和刷新率等等，這些參數(shù)對(duì)于電競(jìng)游戲的影響至關(guān)重要。下面，筆者就對(duì)電競(jìng)顯示器中的各類參數(shù)進(jìn)行一番簡(jiǎn)單解讀，幫助大家更好的了解電競(jìng)顯示器。

1、分辨率

我們先從最容易理解的分辨率說(shuō)起，大家在選購(gòu)顯示器的時(shí)候經(jīng)常會(huì)看到1080P、2K、4K等等，這些數(shù)字指的就是屏幕的分辨率。簡(jiǎn)單來(lái)說(shuō)，分辨率指的就是屏幕所能顯示的像素?cái)?shù)量，分辨率越高，顯示的像素就越多，畫面就越清晰；分辨率越低，顯示的像素就越少，畫面顆粒感就越嚴(yán)重。

不同分辨率對(duì)比

就目前的電競(jìng)顯示器來(lái)說(shuō)，分辨率從1080P到4K都有涉及，1080P和2K分辨率所占比重較多，4K分辨率的電競(jìng)顯示器最少，價(jià)格也是隨分辨率的升高而增加。

2、刷新率

144Hz VS 60Hz

刷新率指的是顯示器在一秒內(nèi)頁(yè)面刷新的次數(shù)，單位是赫茲（Hz），刷新次數(shù)越高，圖像就越流暢，反之圖像就會(huì)出現(xiàn)延遲、撕裂等現(xiàn)象。目前電競(jìng)顯示器的刷新率大多在100Hz以上，比如120Hz、144Hz、165Hz甚至240Hz等。

3、曲率

曲面屏往往有著更好的包裹感

曲率是曲面屏幕的一個(gè)重要參數(shù)，指的是屏幕的彎曲程度，數(shù)值越小代表曲面顯示器的彎曲程度越大，相比較傳統(tǒng)的平面顯示器，曲面顯示器會(huì)有更好的包裹感，玩游戲會(huì)有更好的體驗(yàn)。目前電競(jìng)顯示器的曲率以1800R居多，也有一小部分1900R、2000R的電競(jìng)顯示器。

4、超寬屏

21：9的屏幕用有更寬廣的視野

超寬屏也叫作帶魚屏，僅就目前的電競(jìng)顯示器來(lái)說(shuō)，它指的是21：9甚至更高的32：9的屏幕比例，這種比例的屏幕相較于常見的16：9的屏幕來(lái)說(shuō)視野更加寬廣，由此帶來(lái)的沉浸感也會(huì)更強(qiáng)。

航嘉X3481CK電競(jìng)顯示器

比如這款來(lái)自航嘉的X3481CK電競(jìng)顯示器就擁有目前電競(jìng)顯示器的主流參數(shù)，34英寸屏幕，分辨率為3440×1440，屏幕采用21：9的超寬比例和1800R曲率，刷新率為100Hz，并且還搭載了OVER DRIVING過(guò)驅(qū)動(dòng)技術(shù)、FPS/RTS一鍵切換、分屏技術(shù)、濾藍(lán)光等功能，對(duì)于游戲玩家來(lái)說(shuō)會(huì)有非常不錯(cuò)的體驗(yàn)。

VIDIA RTX 40系顯卡終于與我們見面，按照以往的慣例，通常都是游戲級(jí)別的“80”型號(hào)顯卡率先與我們見面，不過(guò)此次最先推出的卻是“90”級(jí)別的產(chǎn)品。

其實(shí)根據(jù)目前的情況來(lái)看，GeForce RTX 4090率先推出，也是為了照顧到仍在市售的RTX 30系產(chǎn)品。還記得在RTX 30系顯卡推出時(shí)，大部分RTX 20系顯卡其實(shí)已經(jīng)停產(chǎn)，整體的更新?lián)Q代節(jié)奏明顯。

而目前GeForce RTX 3090的價(jià)格基本不足萬(wàn)元，也已經(jīng)停產(chǎn)。所以在此時(shí)推出GeForce RTX 4090，其實(shí)并不足以影響到RTX 30系整體的銷售。

每一次“90”級(jí)別的產(chǎn)品NVIDIA官方，其實(shí)很少宣傳游戲領(lǐng)域，不過(guò)此次在性能懸殊如此大的情況下，即便是NVIDIA對(duì)于它的游戲性能也是侃侃而談。

順帶一提，本次NVIDIA將限量推出GeForce RTX 4090 FE公版，將會(huì)于北京時(shí)間10月12日晚9點(diǎn)在京東首發(fā)上市。喜歡公版設(shè)計(jì)或是想要收藏的玩家務(wù)必下手，只有當(dāng)你拿在手里后，才能夠感受到什么叫滿分工業(yè)設(shè)計(jì)。

01 NVIDIA GeForce RTX 4090 概覽

今年的GeForce RTX 4090在外觀上變化不大，不過(guò)包裝還是一如既往的精美，并且此次NVIDIA還加入了環(huán)保的理念。

外包裝依舊采用了啞光黑色硬紙盒，而且可以清楚地看到“GeForce RTX 4090”字體的變化，GeForce RTX的英文字樣更圓滑，而數(shù)字則更“厚實(shí)”。

從側(cè)面可以看到，本次顯卡的包裝除了外圈的硬紙盒，內(nèi)部全部采用了黑色瓦楞紙。在盒子兩側(cè)還有黑色膠帶防止運(yùn)輸過(guò)程損壞。

打開后的包裝有點(diǎn)像帳篷形狀，這張“性能怪獸”靜靜躺在那里，而且有意思的是，顯卡周圍的裝飾紋路自帶“震驚”效果。

拿出顯卡后，包裝內(nèi)還附贈(zèng)了一根16pin轉(zhuǎn)8pin*4的轉(zhuǎn)接線。其實(shí)本次GeForce RTX 4090的建議電源與GeForce RTX 3090 Ti相同，都是850W，所以如果在RTX 30系配備了高瓦數(shù)電源的玩家大可以放心升級(jí)。

NVIDIA GeForce RTX 4090 FE顯卡的整體尺寸為304×137×61mm，占用3槽空間。其實(shí)長(zhǎng)度相較RTX 30系顯卡沒有變化，甚至比RTX 3090 Ti還少了10mm，但整體的質(zhì)感和分量都有所提升，整卡約為2.2kg，這還是以簡(jiǎn)約設(shè)計(jì)著稱的公版，很難想象各家AIC的顯卡到底會(huì)有多重。

NVIDIA GeForce RTX 4090的整體設(shè)計(jì)依舊沿用了RTX 30系顯卡的外觀，但由于架構(gòu)升級(jí)，發(fā)熱量增大，散熱自然也需要同步升級(jí)。本次的GeForce RTX 4090風(fēng)扇尺寸再次增大，基本已經(jīng)達(dá)到了顯卡整體框架的直徑，而在散熱風(fēng)扇增大的基礎(chǔ)上，最大氣流動(dòng)態(tài)增加20%，同噪音等級(jí)的氣流動(dòng)態(tài)增加15%。

視頻輸出接口上，依舊采用了HDMI 2.1 + DP 1.4a*3的四接口設(shè)計(jì)。HDMI 2.1可支持4K 120Hz HDR、8K 60Hz HDR，對(duì)于目前階段的產(chǎn)品來(lái)說(shuō)完全夠用。

至于呼聲較高的DP 2.0，其實(shí)目前絕大部分消費(fèi)級(jí)游戲顯示器都沒有實(shí)裝，且DP 1.4a標(biāo)準(zhǔn)也能夠支持8K 60Hz刷新率的顯示器。所以，綜合來(lái)看，絕對(duì)夠用。

況且，我們真的需要那么極致的規(guī)格嗎？羊毛出在羊身上的道理大家都懂。

另外由于公版采用的雙軸流散熱系統(tǒng)，所以在視頻輸出接口部位能夠看到大量的散熱鰭片，這一點(diǎn)與上一代相同。

本次GeForce RTX 4090的整卡功耗為450W，采用單16pin的輔助供電。目前已有部分電源廠商發(fā)布了最新的ATX 3.0標(biāo)準(zhǔn)高端電源，自帶12VHPWR的16pin供電接口，最高可支持600W供電。所以不出意外的話，或許下一代顯卡也將采用這樣的單16pin來(lái)供電。

雖然目前所有顯卡廠商基本都會(huì)附贈(zèng)一根轉(zhuǎn)接線，不過(guò)8pin*4的雜亂程度可想而知，有條件的話，一個(gè)ATX 3.0標(biāo)準(zhǔn)的電源簡(jiǎn)直不要太整潔。

需要注意的是，目前適用于RTX 30系列的12pin接口和電源轉(zhuǎn)接器與RTX 40系列顯卡不兼容。

另外在RTX 40系顯卡中，即便是首發(fā)的旗艦GeForce RTX 4090也不支持NVLink，所以想要重現(xiàn)往日的四路泰坦是不可能了。

最后來(lái)看一下GeForce RTX 4090內(nèi)部的PCB板，依舊采用了“深V”的異形PCB，依舊緊湊的排布了所有的元器件，沒有一點(diǎn)浪費(fèi)，并且在如此緊湊的環(huán)境下搭載了20+3相供電。整整齊齊，堪稱藝術(shù)品。

NVIDIA同時(shí)還強(qiáng)調(diào)，在高負(fù)載下，GeForce RTX 4090的供電更穩(wěn)定，不會(huì)出現(xiàn)劇烈的電壓、電流波動(dòng)。

02 Ada Lovelace 姓甚名誰(shuí)？

下面我們來(lái)看一下此次推出NVIDIA Ada Lovelace架構(gòu)，我們先從Ada Lovelace這個(gè)人講起，相較于Ampere，這位似乎大家更陌生一些。

Ada Lovelace（1815-1852）是英國(guó)數(shù)學(xué)家、計(jì)算機(jī)程序創(chuàng)始人，建立了循環(huán)和子程序概念，被稱為世界上第一位程序員。

Ada從小對(duì)數(shù)學(xué)有極高天賦，其父稱她為“平行四邊形公主”，后來(lái)的合作伙伴Charles Babbage稱她為“數(shù)字女巫”。在19歲時(shí)Ada嫁給了自己曾經(jīng)的科學(xué)家庭教師，婚后的她對(duì)數(shù)學(xué)熱情不減。

1842年到1843年花了9個(gè)月時(shí)間翻譯了Babbage的《分析機(jī)概論》的備忘錄，寫了很多注記，其中給出了用計(jì)算機(jī)進(jìn)行Bernoulli數(shù)求解的詳細(xì)說(shuō)明。由此，Ada被廣泛認(rèn)為是世界上第一位程序員。

而以她名字命名的語(yǔ)言——ada語(yǔ)言，已經(jīng)成為了美國(guó)軍方開發(fā)戰(zhàn)斗機(jī)等尖端武器的語(yǔ)言。

從幾行簡(jiǎn)短的生平簡(jiǎn)介中，不難看出Ada的生命雖然只經(jīng)歷了短暫的37個(gè)春秋，但卻足以被后人銘記。

這也是為什么此次NVIDIA RTX 40的先行宣傳中，用到了“以未來(lái)敬傳奇”的slogan，下面我們?cè)敿?xì)剖析一下，這次的Ada Lovelace還有哪些創(chuàng)新和超越。

03 NVIDIA Ada Lovelace架構(gòu)

本次發(fā)布的GeForce RTX 40系顯卡由全新的NVIDIA Ada Lovelace架構(gòu)打造，采用TSMC 4nm定制工藝（TSMC 4 nm NVIDIA Custom Process），旗艦核心AD102達(dá)到了恐怖的760億個(gè)晶體管，而在RTX 30系顯卡中為280億個(gè)。

與上一代NVIDIA Ampere相比，NVIDIA Ada Lovelace在相同功率下，具有2倍以上的性能提升。最高可達(dá)到90-TFLOPS的著色器數(shù)據(jù)吞吐量，而本次發(fā)布的GeForce RTX 4090則達(dá)到83-TFLOPs，相比上一代NVIDIA Ampere則只有40-TFOPs。

完整的AD102核心共有18432個(gè)CUDA，其中包含12個(gè)圖形處理集群(GPCs)， 72個(gè)紋理處理集群(TPCs)， 144個(gè)流式多處理器(SMs)。144個(gè)第三代光追核心（RT Cores）、576個(gè)第四代張量核心（Tensor Cores）。另外可以看到Boost頻率也從1.9GHz猛增到了2.5GHz。

另外一點(diǎn)在架構(gòu)圖上沒有體現(xiàn)的是，AD102核心還包含288個(gè)FP64雙精度浮點(diǎn)核心(每SM 2個(gè))，用來(lái)確保FP64代碼正確處理，包括FP64張量核心代碼。

通常來(lái)講，單精度浮點(diǎn)運(yùn)算會(huì)用于深度學(xué)習(xí)模型訓(xùn)練，而雙精度浮點(diǎn)運(yùn)算則用于數(shù)值模擬工作。通常游戲卡都會(huì)砍掉FP64，這既節(jié)省了成本，又對(duì)游戲本身沒有影響。而專業(yè)卡都保留有FP64，目的就是為了精度更高訓(xùn)練與計(jì)算。

此次資料中只提到了AD102核心搭載了288個(gè)FP64，尚不知道后續(xù)的推出的產(chǎn)品有無(wú)變更。

了解了完整的GA102核心，我們?cè)賮?lái)看一下RTX 4090的核心，其實(shí)知道了RTX 4090的參數(shù)，我們大概也能了解到后續(xù)可能推出的“Ti”系列究竟相差在哪。

相比完整的GA102來(lái)說(shuō)，RTX 4090共有16384個(gè)CUDA，其中包含11個(gè)GPC、64個(gè)TPC以及128個(gè)SM單元，第三代RT Cores為128個(gè)，第四代Tensor Cores為512個(gè)。

其實(shí)根據(jù)完整的架構(gòu)圖就能看出，此次Ada架構(gòu)整體結(jié)構(gòu)性的改動(dòng)并不大，這一點(diǎn)從SM單元便能清晰印證，同樣的FP32 CUDA核心，同樣的FP32/INT32混合CUDA核心，同樣的L1級(jí)緩存等等。當(dāng)然，每個(gè)SM單元內(nèi)部的Tensor Core升級(jí)為第四代。

不過(guò)變化最為顯著的，則是第三代光追核心，我們結(jié)合兩代架構(gòu)來(lái)看。在第二代光追核心中，包含負(fù)責(zé)邊界交叉測(cè)試的Box Intersection Engine引擎，和負(fù)責(zé)三角形交叉測(cè)試的Triangle Intersection Engine引擎。

而在第三代光追核心中，還增加了兩個(gè)新的引擎：Opacity Micro-Map Engines（OMM）和Displaced Micro-Mesh Engines（DMM），這兩個(gè)新的硬件單元可以極大地提升光追性能（具體原理后文詳細(xì)介紹）。

至此，每2個(gè)SM單元組成一個(gè)TPC單元，每6組TPC單元組成一個(gè)完整的GPC頂層單元（在部分核心中，會(huì)出現(xiàn)5組TPC組成一個(gè)GPC單元的情況）。

而每個(gè)GPC單元又搭載一個(gè)獨(dú)立的光柵引擎、兩組ROP分區(qū)（每組包含8個(gè)ROP單元）。

過(guò)多關(guān)于數(shù)數(shù)的部分就不再介紹了，畢竟此次架構(gòu)圖的大面上與NVIDIA Ampere架構(gòu)基本相同，下面我們分別來(lái)看看，除了性能Ada架構(gòu)還有哪些升級(jí)。

Shader Execution Reordering （SER）著色器執(zhí)行重排序

SER主要的作用是提升著色器性能，它可以將效率低下的工作負(fù)載，動(dòng)態(tài)重組為更高效的工作負(fù)載。主要針對(duì)光線追蹤的性能提升非常大。

簡(jiǎn)單地說(shuō)，GPU在執(zhí)行類似工作的時(shí)候效率最高。但隨著光追效果越來(lái)越強(qiáng)大，每個(gè)場(chǎng)景可能有數(shù)百萬(wàn)條光線照射在不同材質(zhì)上，而我們知道不同材質(zhì)的反射率，以及反射效果也是不同的。所以這樣就為著色器創(chuàng)建了大量的、發(fā)散的，效率低下的工作負(fù)載。

SER則可以將這些雜亂的指令重新分門別類，動(dòng)態(tài)重組為更高效的工作負(fù)載。根據(jù)NVIDIA的說(shuō)法，SER可將著色器性能最多提升2倍，并將游戲幀率最高提升25%。

舉個(gè)簡(jiǎn)單的例子，當(dāng)光線第一次從發(fā)射端到碰撞端是非常有規(guī)律的射線，而碰撞到物體后的二次光追，則會(huì)出現(xiàn)大量發(fā)散的、無(wú)規(guī)律的反射，這對(duì)于光追負(fù)載是非常高的。而從圖中便能看到，SER可以將這些指令進(jìn)行二次排序，以發(fā)揮出著色器的最大性能。

不過(guò)好在這么實(shí)用的功能并不是RTX 40系的專利，它是一個(gè)易于集成的SDK，目前需要游戲開發(fā)商集成在游戲中。另外由于它是一個(gè)通用的邏輯，后續(xù)也有可能直接集成在Windows的API中，這樣游戲開發(fā)者就無(wú)需特意引用，直接調(diào)用系統(tǒng)API即可。

可以說(shuō)SER對(duì)于手持RTX 20系及以上（能夠開啟光線追蹤）的N卡用戶來(lái)說(shuō)，是極大地福音。畢竟免費(fèi)提升的光追性能，誰(shuí)不喜歡呢。

第三代 RT Cores

RT Core的作用在于更快的光線追蹤計(jì)算能力，如果說(shuō)在RTX 30系顯卡中，想要暢享4K高幀率游戲有點(diǎn)吃力，那么RTX 40系顯卡中，將顯得輕而易舉。

在GeForce RTX 4090這張顯卡上，達(dá)到了191 RT-TFLOPs的處理能力，而RTX 30系顯卡最快處理能力為78 RT-TFLOPs，足足為2.4倍。并且根據(jù)NVIDIA的官方說(shuō)法，第三代RT Core的峰值RT-TFLOPs相比于前代提高了2.8倍。而這只能說(shuō)明，這張4090并非Ada Lovelace架構(gòu)的最終形態(tài)。

Opacity Micro-Map Engines

在第三代RT Cores中引入了兩個(gè)重要的硬件單元，首先是Opacity Micro-Map Engines，可以理解為微映射透明度引擎，它主要的作用是優(yōu)化光線追蹤渲染，可大幅減輕著色器的工作負(fù)擔(dān)。

比如樹葉之類的復(fù)雜物體，不同的光線都會(huì)影響它的表現(xiàn)狀態(tài)，以及樹葉之間的光線反彈，所以對(duì)于光線追蹤的計(jì)算量是巨大的。

不過(guò)Opacity Micro-Map Engines可以將光線追蹤特性烘焙到不透明蒙版中，所以那些不規(guī)則形狀和半透明的對(duì)象，也就能夠更快更精準(zhǔn)的渲染出來(lái)，從而極大減輕著色器的工作負(fù)擔(dān)。

Displaced Micro-Mesh Engines（DMM）

Displaced Micro-Mesh Engines可理解為微網(wǎng)格置換引擎，它構(gòu)建光線追蹤的BVH（Bounding volume hierarchy）的速度提高了10倍！所使用的的顯存減少了20倍！

DMM由第三代RT core本地處理，與前幾代相比，它只使用基本三角形渲染復(fù)雜幾何圖形，極大減少了存儲(chǔ)和處理需求。

具體的工作原理從圖中一目了然，新的DMM可以將面數(shù)非常多的復(fù)雜圖形做簡(jiǎn)化，創(chuàng)造出簡(jiǎn)單的模型，但整體的光線追蹤效果不變。

通過(guò)一些模型數(shù)據(jù)我們可以具體看到，新的DMM將模型簡(jiǎn)化了多少。原本1100萬(wàn)三角面的模型，經(jīng)過(guò)簡(jiǎn)化后，只有15萬(wàn)左右的微網(wǎng)格，BVH的構(gòu)建速度提升了8.5倍，小了6.5倍。

而這還不是最夸張的，越復(fù)雜的模型往往優(yōu)化的效果越好，在官方展示的這幾組對(duì)比示例中，最快可提升大于15倍的速度，容量簡(jiǎn)化20倍的模型。

第四代 Tensor Cores

除了光追單元的升級(jí)外，第四代張量核心的升級(jí)更加恐怖。它采用了新的FP8張量引擎，在GeForce RTX 4090這張顯卡上，吞吐量達(dá)到了1.32 Tensor petaFLOPs，提高了5倍。

注意這里的單位——petaFLOPs。以往的TFLOPs為萬(wàn)億次浮點(diǎn)運(yùn)算，而petaFLOPs則為千萬(wàn)億次浮點(diǎn)運(yùn)算。

DLSS 3

本次推出的DLSS 3也是RTX 40系一大賣點(diǎn)，從DLSS 2.3直接邁入了3.0版本，也能看出此次的升級(jí)之大。而DLSS 3也被NVIDIA官方稱為神經(jīng)網(wǎng)絡(luò)渲染新時(shí)代。

全新的DLSS 3在原有的DLSS超分辨率的基礎(chǔ)上，添加了光學(xué)多幀生成技術(shù)，以生成全新的幀，而不像原來(lái)只能生成像素。

DLSS 3結(jié)合了DLSS超分辨率、DLSS幀生成和NVIDIA Reflex這三大技術(shù)，能夠重建八分之七的像素，極大提高性能。

在GPU受限的游戲中，比如2K分辨率及以上的更高分辨率，DLSS 2能夠?qū)侍岣?倍，DLSS 3則能夠提升4倍。

本次DLSS 3跨越了一個(gè)大版本，從想法和原理上也再度升級(jí)，完全“猜想”1幀的技術(shù)，我們解釋起來(lái)簡(jiǎn)單，但實(shí)施起來(lái)需要大量的推理與演算，以及絕對(duì)超前的想法。

不過(guò)“憑空”生成的1幀，在延遲上絕對(duì)要比DLSS 2高。所以此次完整的DLSS 3中，捆綁了NVIDIA Reflex，可以有效幫助減小延遲。

這也不負(fù)NVIDIA給它起了個(gè)“神經(jīng)網(wǎng)絡(luò)渲染新時(shí)代”的名號(hào)?？v觀目前市面上的XeSS、FSR技術(shù)，DLSS絕對(duì)稱得上“巨人的肩膀”。當(dāng)然，連年的創(chuàng)新，苦的是手持上一代顯卡的玩家，想體驗(yàn)DLSS 3的幀生成，目前唯一的辦法就是購(gòu)入一張RTX 40系顯卡。

New Optical Flow Accelerator

New Optical Flow Accelerator光流加速器是在第四代Tensor Cores中最新引入的，這也是為何DLSS 3中的幀生成為RTX 40系顯卡獨(dú)享。

光流加速器在原本DLSS 2的基礎(chǔ)上，還可以計(jì)算兩個(gè)連續(xù)幀內(nèi)的光流場(chǎng)，能夠捕捉游戲畫面從第1幀到第2幀的方向和速度，從中捕捉粒子、反射和光照等像素信息。并分別計(jì)算運(yùn)動(dòng)矢量和光流來(lái)獲得精準(zhǔn)的陰影重建效果。

以《賽博朋克2077》為例，在第一幀，光流加速器會(huì)捕捉到每一個(gè)像素中的粒子、反射和光照等信息。并在第二幀中查找匹配的像素區(qū)域，計(jì)算幀之間的差值。

如果說(shuō)原來(lái)DLSS 2能夠“猜”出一張圖剩下的像素，那么DLSS 3除了這些，還能夠“猜”出下一幀的畫面。

另外由于DLSS 3的幀生成是在GPU中處理和運(yùn)行的，所以即使遇到CPU瓶頸的游戲，AI同樣能夠提升幀率。這也是為什么在此次發(fā)布會(huì)中說(shuō)到，DLSS 3能夠突破CPU的限制來(lái)提升幀數(shù)。

雙AV1編碼器

本次升級(jí)的第八代NVENC編碼器可以說(shuō)是直播、視頻、后期工作者的極大福音。它首次加入了對(duì)AV1編碼的支持，最顯而易見的效果就是直播。

相比傳統(tǒng)的H.264編碼，AV1編碼的效率平均提升了40%，在同碼率下AV1編碼的畫質(zhì)將更好。目前大部分直播的分辨率和清晰度，均受限于平臺(tái)規(guī)定的最大比特率。以Twitch限制的8Mbps為例，可以看到在同等帶寬下，同為2K 60幀的畫面，采用AV1編碼的清晰度明顯比H.264更高。

說(shuō)起直播，OBS相信大家都不陌生，在10月份即將發(fā)布的補(bǔ)丁中，OBS就加入了對(duì)NVENC的AV1編碼支持

當(dāng)然，直播只是我們更容易見到的AV1優(yōu)勢(shì)，在視頻工作的所有環(huán)節(jié)，AV1編碼都可以帶來(lái)極大提升。

所以，如圖所見。NVIDIA已經(jīng)為廣大用戶鋪好了一條完整的生態(tài)鏈，從編碼API、軟件、平臺(tái)到播放器，將全面支持AV1編碼。

另外再說(shuō)一下NVIDIA一直強(qiáng)調(diào)的雙AV1編碼。顧名思義，即部分顯卡內(nèi)搭載了兩個(gè)編碼器，它所帶來(lái)的效果也是顯而易見的。

首先，根據(jù)官方宣傳的，在4K H.265的導(dǎo)出速度上，RTX 4090是RTX 3090 Ti的2.2倍；在8K H.265的導(dǎo)出速度上更是達(dá)到了2.5倍。這部分的提升，大家常用的剪映同樣適用，感興趣的用戶不妨親自體驗(yàn)一下。

除了導(dǎo)出速度，8K 60幀的視頻錄制在以前簡(jiǎn)直難以想象，而雙編碼器的好處就是可以將圖像一分為二，兩個(gè)編碼器分別處理7680×2160的圖像信息，最后拼合完整。

關(guān)于編碼部分，可能大部分用戶的感受不深，但當(dāng)有一天，你想錄屏的時(shí)候，卻發(fā)現(xiàn)顯卡不支持，才會(huì)發(fā)覺它的重要性……

隨著圖像逐漸進(jìn)入到超清時(shí)代，硬件編碼和渲染幾乎已經(jīng)成為不可或缺的幫手。雖然論質(zhì)量，硬件編碼仍不及CPU軟編，但軟編做到了極限畫質(zhì)，也要承受時(shí)間的無(wú)窮長(zhǎng)。甚至在一張8K渲染圖中，兩種編碼方式的時(shí)間差距就已經(jīng)達(dá)到了幾個(gè)小時(shí)，遑論一段10秒的CG動(dòng)畫。在不斷進(jìn)步的硬件編碼中，質(zhì)量和時(shí)間也在不斷地被挑戰(zhàn)和刷新。

04 測(cè)試平臺(tái)簡(jiǎn)介

首先介紹一下測(cè)試平臺(tái)，為了保障NVIDIA GeForce RTX 4090這張怪獸的性能發(fā)揮，我們的平臺(tái)也再次進(jìn)行了全面更新。

不過(guò)由于手頭上沒有旗艦處理器，采用了本代中高端產(chǎn)品，并且電源和顯示器上進(jìn)行了著重升級(jí)。

本次因?yàn)樾阅艽蠓?jí)，且DLSS 3的加入，所以真正的4K時(shí)代已經(jīng)來(lái)了。我們選擇了愛攻&保時(shí)捷（Porsche Design）聯(lián)合設(shè)計(jì)的PD32M。設(shè)計(jì)理念這里不再多講，但這款顯示器的性能也著實(shí)強(qiáng)悍。

首先配備了4K/144Hz的硬性指標(biāo)，并且采用MiniLED背光技術(shù)，支持1600尼特峰值亮度，8000萬(wàn)：1動(dòng)態(tài)對(duì)比度，通過(guò)HDR1400認(rèn)證。

10.7億顯示色數(shù)， 97% DCI-P3、99% Adobe RGB覆蓋率，色彩精準(zhǔn)度ΔE<2(平均值)，色彩呈現(xiàn)更加精準(zhǔn)、豐富。

RTX 40系顯卡性能暴漲的同時(shí)功耗也有較大幅度上漲，鑫谷昆侖KL-1250G金牌全模組電源配備原生的12VHPWR 16pin線材，無(wú)需轉(zhuǎn)接線，扎實(shí)的做工設(shè)計(jì)、高品質(zhì)日系電容等用料，保證電源的穩(wěn)定性和長(zhǎng)壽命，1250W的額定功率提供了較大的冗余，輕松應(yīng)對(duì)RTX 4090，80Plus金牌認(rèn)證可提供高達(dá)90%的轉(zhuǎn)換效率，讓高功率電源更加節(jié)能省電。

首先看一下GPU-Z的參數(shù)，NVIDIA GeForce RTX 4090采用AD102核心，采用TSMC 4nm定制工藝（TSMC 4 nm NVIDIA Custom Process），芯片面積608平方毫米，這里相對(duì)于RTX 30系的GA102的628平方毫米更小。

擁有16384個(gè)CUDA，相比RTX 3090 Ti的10752多52%，Boost頻率達(dá)到了2520MHz，而RTX 3090 Ti為1860MHz，提升非常大。

采用24GB GDDR6X Micron顯存，位寬為384bit，顯存帶寬達(dá)到了1008.4 GB/s，光柵單元和紋理單元為176和512。

05 理論性能測(cè)試

下面先進(jìn)行的是用來(lái)衡量顯卡DX11理論性能的3DMARKFS套裝：FS,FSE,FSU三者分別對(duì)應(yīng)顯卡在1080P、2K、4K的理論性能，取顯卡分?jǐn)?shù)實(shí)際測(cè)試結(jié)果如下：

在針對(duì)顯卡DX11性能的3DMARK FS套裝測(cè)試中，GeForce RTX 4090的提升非常驚人，可以看到在分辨率越高的情況下這張顯卡提升越大，其中FS提升了48%；FSE提升了66%；FSU則暴力提升了75%。

綜合來(lái)看，在整個(gè)FS套裝的測(cè)試中，GeForce RTX 4090相較GeForce RTX 3090 Ti的提升約為63%。

而在針對(duì)DX12環(huán)境下的Time Spy和Time Spy Extreme測(cè)試中，GeForce RTX 4090相較GeForce RTX 3090 Ti的提升分別為：TS提升56%；TSE提升69%，綜合下來(lái)約為63%。

PortRoyal是3DMARK中專門針對(duì)光追性能的測(cè)試項(xiàng)，GeForce RTX 4090相較GeForce RTX 3090 Ti的提升約為56%。

綜合來(lái)看，GeForce RTX 4090的理論性能相較GeForce RTX 3090 Ti的提升約為61%。根據(jù)CUDA數(shù)量來(lái)看，這個(gè)成績(jī)還是比較合理的。

不過(guò)，其實(shí)在功耗測(cè)試中，我們發(fā)現(xiàn)這張卡被限制了比較大的功耗，這一點(diǎn)我們后邊會(huì)進(jìn)行詳細(xì)說(shuō)明。

在本次測(cè)試中，我們使用3DMARK的測(cè)試版進(jìn)行了DLSS 3的相關(guān)測(cè)試。其中DLSS關(guān)閉為52.19幀，DLSS 3開啟后為154.98幀。

另外我們也測(cè)試了GeForce RTX 3090 Ti在該程序下成績(jī)，其中DLSS關(guān)閉為32.73幀，由于不支持DLSS 3，所以在DLSS 2下的成績(jī)?yōu)?/span>83.63幀。

以兩代不同架構(gòu)的產(chǎn)品來(lái)說(shuō)，對(duì)比有些不公平，我們對(duì)比自身的不同提升。

GeForce RTX 4090在開啟DLSS 3后，相比關(guān)閉提升了197%；而GeForce RTX 3090 Ti在開啟DLSS 2后，相比關(guān)閉提升了155%。

當(dāng)然DLSS 3最夸張的還不止數(shù)字上這么簡(jiǎn)單，我們?cè)賮?lái)看看這張圖。

在8K（7680×4320）分辨率下的DLSS 3測(cè)試中，GeForce RTX 4090在DLSS關(guān)閉的情況下僅有12.7幀，屬于PPT范疇了，而在開啟DLSS 3后，一躍達(dá)到了86.11的流暢水準(zhǔn)，提升了578%！

通過(guò)DLSS的測(cè)試，其實(shí)給我的震驚很大。感覺老黃在RTX 30系顯卡中說(shuō)的“8K游戲體驗(yàn)”在RTX 40系顯卡中，終于能有機(jī)會(huì)實(shí)現(xiàn)了。順便做一下預(yù)告，在后續(xù)我們也會(huì)拿到一款8K顯示器來(lái)對(duì)游戲進(jìn)行真實(shí)測(cè)試，看看8K到底離我們還多遠(yuǎn)。

06 常規(guī)游戲性能測(cè)試

由于本次RTX 40系加入了DLSS 3新技術(shù)，所以后面會(huì)進(jìn)行單獨(dú)測(cè)試，這里依然選擇主流的幾款3A大作進(jìn)行游戲性能對(duì)比。

首先在《地平線5》中，可以明顯看到，不止在1080p分辨率下，即使在2K分辨率中，受限CPU的情況依然明顯。可以說(shuō)如果你入手這張GeForce RTX 4090，4K/144Hz的顯示器應(yīng)該是最低配置。

性能方面，GeForce RTX 4090相比GeForce RTX 3090 Ti的提升分別為：1080p提升32%；2K提升35%；4K提升56%，綜合提升41%。

在《刺客信條：英靈殿》中，GeForce RTX 4090相比GeForce RTX 3090 Ti的提升分別為：1080p提升48%；2K提升51%；4K提升40%，綜合提升46%。

在《無(wú)主之地3》中，GeForce RTX 4090相比GeForce RTX 3090 Ti的提升分別為：1080p提升43%；2K提升63%；4K提升65%，綜合提升57%。

《光明記憶：無(wú)限》的光追測(cè)試軟件是獨(dú)立于游戲的測(cè)試工具，比游戲中用到的光線追蹤技術(shù)更多，測(cè)試條件為“RTX最高/DLSS質(zhì)量”。所以測(cè)試幀數(shù)相對(duì)較低，但實(shí)際游戲配置相當(dāng)親民。

性能方面，GeForce RTX 4090相比GeForce RTX 3090 Ti的提升分別為：1080p提升42%；2K提升54%；4K提升60%，綜合提升52%。

在另外一款國(guó)產(chǎn)游戲《邊境》的跑分軟件中，情況基本與《光明記憶：無(wú)限》相同，測(cè)試條件均在“RTX最高/DLSS質(zhì)量”下進(jìn)行。

在《邊境》中，GeForce RTX 4090相比GeForce RTX 3090 Ti的提升分別為：1080p提升50%；2K提升67%；4K提升77%，綜合提升65%。

07 DLSS 3性能測(cè)試

由于本次新技術(shù)DLSS 3的推出，將有35款游戲?qū)⒂诮谕瞥鋈碌腄LSS 3功能，本次我們也拿到了部分游戲的測(cè)試版。

另外《超級(jí)人類》、《生死輪回》、《逆水寒》“拂云庭“、《微軟模擬飛行》、《瘟疫傳說(shuō)：安魂曲》都將在10月陸續(xù)發(fā)布支持DLSS 3的版本。

《賽博朋克2077》、《F1 22》、《瘟疫傳說(shuō)：安魂曲》、《微軟模擬飛行》、《逆水寒》本次進(jìn)行了DLSS 3的測(cè)試，另外Unity和虛幻引擎也提供了本次的測(cè)試程序。

本次DLSS 3的測(cè)試圖標(biāo)比較繁瑣，并且增加了1% Low FPS和延遲的測(cè)試，普通的FPS好理解，那么這個(gè)1% Low FPS是什么意思。

首先，游戲benchmark通常測(cè)試的FPS即為，一段時(shí)間內(nèi)的游戲平均幀。而1% Low FPS則是將一段時(shí)間內(nèi)的幀數(shù)從大到小排列，取最小的1%出來(lái)，再對(duì)這1%的數(shù)求平均值。

其實(shí)簡(jiǎn)單來(lái)說(shuō)，這兩個(gè)數(shù)值都不能代表我們?cè)谟瓮鏁r(shí)，具體哪一刻的感受，但FPS更注重整體，而1% Low FPS則是從最差的里面求平均，更謹(jǐn)慎一些。

看懂了1% Low FPS，我們?cè)賮?lái)看這張圖表，在坐標(biāo)軸左側(cè)的為延遲（越低越好），坐標(biāo)軸右側(cè)的均為幀數(shù)（越高越好），并且由于牽扯到正負(fù)坐標(biāo)，所以兩側(cè)的值有可能會(huì)不同。

由于目前測(cè)試DLSS 3的游戲均為測(cè)試版，所以難免出現(xiàn)BUG。

在《微軟模擬飛行》中，在開啟和關(guān)閉DLSS 2的時(shí)候，分?jǐn)?shù)幾乎無(wú)變化。這款游戲是極度吃CPU資源的游戲，如果瓶頸卡在處理器上，那么傳統(tǒng)的DLSS 2的確無(wú)法提供更多的幀數(shù)加成。

而在DLSS 3中，我們能夠明顯看到幀數(shù)的大幅提升，要知道我們所有DLSS 3的測(cè)試均在4K分辨率下進(jìn)行?？磥?lái)利用幀生成來(lái)突破CPU瓶頸限制，實(shí)際表現(xiàn)確實(shí)如宣傳的那樣神奇。

不過(guò)幀生成并不是毫無(wú)弊端，這也是為什么此次測(cè)試加入了延遲。并且在開啟DLSS 3后，NVIDIA Reflex是捆綁開啟的。但相對(duì)于DLSS 2增加的這點(diǎn)延遲，在實(shí)際體驗(yàn)中的感受并不強(qiáng)。

在《賽博朋克2077》中的數(shù)據(jù)反映比較真實(shí)，可以看到在DLSS關(guān)的光線追蹤最高的情況下，即便GeForce RTX 4090顯卡也只有41幀，并且延遲達(dá)到了85.7毫秒。而在開啟DLSS 3后，幀數(shù)為127，提升了210%。雖然相比DLSS 2的延遲高了6毫秒左右，但依然維持在較低的水平。

《瘟疫傳說(shuō)：安魂曲》是即將發(fā)布的一款游戲，在DLSS 3和DLSS關(guān)之間的幀數(shù)提升，同樣達(dá)到了130%?？梢钥吹诫m然DLSS 3的延遲有所增加，但仍然比DLSS關(guān)閉后要低。

目前《F1 22》的數(shù)據(jù)測(cè)試同樣有問題，在DLSS關(guān)和DLSS 2中均沒有延遲數(shù)據(jù)。這一組主要看幀數(shù)的提升。其中DLSS 3相比DLSS關(guān)的幀數(shù)提升了124%，相比DLSS 2的提升也達(dá)到了55%。

最后則是國(guó)產(chǎn)游戲《逆水寒》的光追測(cè)試，本次我們選擇的測(cè)試demo采用了真正的全局光照。所以在我嘗試關(guān)閉DLSS運(yùn)行后，第一次電腦直接崩潰重啟，第二次僥幸能夠運(yùn)行，幀數(shù)也僅有個(gè)位數(shù)，而延遲早已上萬(wàn)。

還記得在純光線追蹤軟件中測(cè)試的《光明記憶無(wú)限》和《邊境》，在本次只有DLSS 2的情況下都能夠達(dá)到80幀左右。而《逆水寒》這款真正意義上的全局光照，在DLSS 2開啟后僅有40幀左右，著實(shí)恐怖。

當(dāng)然針對(duì)畫質(zhì)方面，我們也進(jìn)行了測(cè)試，在上圖中我們截取《賽博朋克2077》中的一角，可以看到在兩種DLSS模式下，相較原畫質(zhì)幾乎沒有明顯變化，只在柵欄處的光影效果有所不同，但對(duì)于如此大幅度的幀數(shù)提升，這點(diǎn)瑕疵幾乎可以忽略不計(jì)。

在Unity的測(cè)試程序中，有一組實(shí)時(shí)演算的光線追蹤+DLSS的幀數(shù)對(duì)比。GeForce RTX 4090在開啟DLSS 3后，實(shí)時(shí)幀數(shù)為83；而GeForce RTX 3090 Ti在開啟DLSS 2后，實(shí)時(shí)幀數(shù)為39幀，提升約為113%。

在UE5提供的測(cè)試游戲中，方便的給出了DLSS的快捷測(cè)試，這里分為DLSS關(guān)（超分辨率關(guān)+幀生成關(guān)+Reflex關(guān)）；DLSS 2（超分辨率性能+幀生成關(guān)+Reflex開）；DLSS 3（超分辨率性能+幀生成開+Reflex開）三檔測(cè)試。

其中，DLSS關(guān)的即時(shí)幀數(shù)為66幀，DLSS 2為112幀，DLSS 3為154幀。不過(guò)UE5這個(gè)測(cè)試的DLSS 3延遲為57.1ms，而DLSS 2為20.5ms，相對(duì)較高。

08 專業(yè)軟件測(cè)試

作為“90”級(jí)別的顯卡，擁有24GB的超大顯存，內(nèi)容創(chuàng)作者領(lǐng)域的應(yīng)用是必不可少的。我們使用SPECviewperf 13這款工業(yè)、專業(yè)軟件跑分測(cè)試。

對(duì)比顯卡為GeForce RTX 4090顯卡、上一代旗艦GeForce RTX 3090 Ti顯卡以及上一代游戲旗艦GeForce RTX 3080 Ti顯卡。

在SPECviewperf 13的軟件測(cè)試中，其實(shí)仍然出現(xiàn)不少問題。每款專業(yè)軟件對(duì)于性能提升的程度不盡相同，而且剛剛推出的顯卡對(duì)軟件適配也多多少少存在著問題，3DS MAX甚至出現(xiàn)了負(fù)增長(zhǎng)的情況，所以后續(xù)在軟件更新完善后將再做測(cè)試。不過(guò)目前部分軟件的分?jǐn)?shù)仍能反映出GeForce RTX 4090的強(qiáng)悍之處。

Blender是一款專業(yè)的三維渲染軟件，本次推出了固定的benchmark跑分軟件，省去了安裝軟件下載素材的麻煩。這款跑分軟件只需下載好啟動(dòng)程序，軟件會(huì)自動(dòng)渲染測(cè)試monster/junkshop/classroom共三個(gè)場(chǎng)景。

上圖為GeForce RTX 4090顯卡得分，分別為6320/2894/2937分，平均4050分；下圖為GeForce RTX 3090 Ti顯卡得分，分別為3136/1812/1549分，平均2165分。通過(guò)平均分的比較不難發(fā)現(xiàn)提升非常明顯，達(dá)到了87%，這對(duì)于以幀為渲染單位的動(dòng)畫來(lái)說(shuō)，能夠大幅度節(jié)省時(shí)間。

09 功耗及溫度測(cè)試

功耗測(cè)試中，我們選擇FurMark軟件進(jìn)行拷機(jī)測(cè)試，并采用GPU-Z檢測(cè)溫度，功耗僅計(jì)算顯卡自身。

GeForce RTX 4090這張顯卡最讓人驚嘆的地方在于溫度控制，看來(lái)改進(jìn)的散熱器效果顯著。通過(guò)14分鐘左右的拷機(jī)測(cè)試，溫度一直控制在60℃以下，核心溫度也僅有66℃，對(duì)于這張AD102的旗艦芯片來(lái)說(shuō)難能可貴。

值得一提的是，在拷機(jī)測(cè)試中我們發(fā)現(xiàn)，盡管顯卡占用達(dá)到滿載，但峰值功耗一直在300W左右徘徊，TDP也鮮有超過(guò)70%的情況。而官方數(shù)據(jù)中GeForce RTX 4090的整卡功耗為450W。

在3DMARK的TSE拷機(jī)中，功耗有所增加，但依然與450W相距甚遠(yuǎn)。

所以筆者后續(xù)嘗試了手動(dòng)增加功耗，雖然理論測(cè)試的分?jǐn)?shù)有所提升，但效果不大。所以推測(cè)在當(dāng)前參數(shù)配置下，300W是否為一個(gè)甜蜜區(qū)間？即超過(guò)該功耗后，雖然顯卡分?jǐn)?shù)有所提升，但與增加的功耗其實(shí)不成正比。又或者是首發(fā)為了穩(wěn)定性考慮，驅(qū)動(dòng)限制了較大的性能發(fā)揮，所以后續(xù)我們也會(huì)隨著RTX 40系的上市，持續(xù)觀察。

10 小改動(dòng) 大飛躍

本次GeForce RTX 4090顯卡的首測(cè)其實(shí)時(shí)間非常緊張，并且由于DLSS 3的性功能增加，大部分游戲均為測(cè)試版，其中存在著各種各樣不穩(wěn)定因素和BUG，后續(xù)我們也會(huì)持續(xù)更新測(cè)試方法及游戲。

Ada架構(gòu)的問世，其實(shí)在看到架構(gòu)圖時(shí)，并沒有帶來(lái)很驚艷的感覺。畢竟在大框架上，它和Ampere太像了，我們能看到的變化，僅僅是在光追單元增加了兩個(gè)微引擎。

然而實(shí)測(cè)后的結(jié)果確實(shí)出乎了所有人的預(yù)料，尤其是《微軟模擬飛行》，這個(gè)最新的硬件殺手能夠極大限度的榨取CPU和GPU性能。但在4K分辨率下，開啟DLSS 3后的平均幀數(shù)能夠達(dá)到150幀，這是什么概念？

以前的顯卡，包括RTX 30系的旗艦產(chǎn)品，在4K分辨率下測(cè)試3A游戲基本都無(wú)法達(dá)到100幀。而Ada和DLSS 3的橫空出世，讓4K/144不再是我們一直追求的極限，甚至唾手可得！

可以這么說(shuō)，如果你置辦一張GeForce RTX 4090顯卡，那么4K/144Hz的顯示器應(yīng)該是最低配，但這個(gè)最低配也是市面上顯示器的頂配了。變相帶動(dòng)顯示器行業(yè)發(fā)展，這也只是其中之一，視頻協(xié)議甚至也將再次升級(jí)。

除了強(qiáng)關(guān)聯(lián)的顯示器領(lǐng)域，電源、數(shù)據(jù)線、鼠標(biāo)等與之相關(guān)的領(lǐng)域也將相繼升級(jí)?？梢哉f(shuō)此次RTX 40系顯卡的推出對(duì)于整個(gè)DIY行業(yè)都是一次難得提升。

說(shuō)回顯卡本身，在外觀方面，由于沿用了RTX 30系公版的設(shè)計(jì)，整體變化不大，但做工用料依舊堪稱王道，拿在手上讓人忍不住摩挲幾下，但又生怕粘上指紋不好清除。

而此次GeForce RTX 4090散熱器的升級(jí)，除了外觀上顯得更加厚重外，散熱效果當(dāng)屬滿分。滿載拷機(jī)僅60℃，這對(duì)于一款TITAN級(jí)別的旗艦顯卡來(lái)說(shuō)著實(shí)難得，簡(jiǎn)單打打3A游戲風(fēng)扇甚至都不轉(zhuǎn)，這是一種什么體驗(yàn)。

在性能提升上，GeForce RTX 4090的理論成績(jī)，相較GeForce RTX 3090 Ti提升約為60%，根據(jù)CUDA數(shù)量來(lái)看，這個(gè)提升較為合理。不過(guò)或許是因?yàn)槭装l(fā)較為保守，我認(rèn)為仍沒有達(dá)到它的極限。

關(guān)于GeForce RTX 4090或者是RTX 40系的市場(chǎng)定位，很難說(shuō)它會(huì)快速頂上RTX 30系或者RTX 20系的地位，況且這種“超時(shí)代”的產(chǎn)物不是大部分玩家所需。而有違常理的率先推出“90”級(jí)別顯卡，NVIDIA也有意讓RTX 30系再消化一點(diǎn)時(shí)間，畢竟這個(gè)時(shí)間節(jié)點(diǎn)到了，不發(fā)點(diǎn)什么說(shuō)不過(guò)去。

最后強(qiáng)調(diào)一下，本次NVIDIA將限量推出GeForce RTX 4090 FE公版，將會(huì)于北京時(shí)間10月12日晚9點(diǎn)在京東首發(fā)上市。喜歡公版設(shè)計(jì)或是想要收藏的玩家務(wù)必下手，只有當(dāng)你拿在手里后，才能夠感受到什么叫滿分工業(yè)設(shè)計(jì)。

欧美vvv,亚洲第一成人在线,亚洲成人欧美日韩在线观看,日本猛少妇猛色XXXXX猛叫