于當前的智能手機,SoC的重要性不言而喻。作為當前安卓陣營中最先進的平臺,驍龍835在目前已經推出的旗艦機上有著:快且不熱的優秀體驗。從許多媒體的評價來看,驍龍835平臺可以稱得上近幾年綜合體驗最為出色的一款處理器。因此,我們本期的機情觀察室,就來看看驍龍835的深度性能究竟處于怎樣的水平。(注:測試數據編譯自ANANDTECH)。
小米 6 全網通 6GB+128GB 亮黑色 移動聯通電信4G手機 雙卡雙待
淘寶網:¥2499京東商城:¥2899更多商家
在驍龍835之前,驍龍處理器都被稱為SoC(系統級芯片),而到了這一代則改名為“Platform”(平臺),其用意在于高通對于移動計算平臺的整個布局,而非單獨的CPU、GPU等電器元件。驍龍835采用三星10nm FinFET LPE工藝,當前半導體工藝能達到量產的最高水準,不過此次采用的是LPE工藝,不排除高通會在后續升級一個LPP工藝的版本,類似驍龍820/821一樣。另外,根據高通官方的說法,驍龍835上采用30億顆晶體管,逼近iPhone7上采用的A10 Fusion 33億的數量,這也是高通處理器距離iPhone自主設計的A系列最近的一次。因此也帶來了良好的使用體驗。
通過這個表格,我們可以看到驍龍835采用Kryo280架構,八核心設計,最高主頻為2.45GHz,小核為1.9GHz,GPU為Adreno 540,主頻為710GHz,整個芯片封裝尺寸減小35%。而根據高通公司的數據,驍龍835功耗降低了25%(比驍龍801降低了50%)。此外,在驍龍835平臺中,還集成了雙14位Spectra 180 ISP、Hexagon 690 DSP、X16 Modem。可以看到,相比于其它家的SoC,高通在SoC上覆蓋到更多的計算區域,將處理器打造成智能手機的全面管家,通過“人無我有、人有我優”的概念,全面進駐到各區域。在筆者看來,這也是高通在這一代將移動處理器改名為“平臺”的原因。
CPU性能測試:
在驍龍820上,高通首次打造出64位自研的Kryo架構,其獨特的架構對于浮點IPC的運算有著非常不錯的性能,但在整數IPC的運算方面則還不如ARM官方的A57架構,并且在功耗方面也并不夠優秀。因此高通在驍龍835上采用全新的Kryo 280架構,盡管同名為Kryo,但此“Kryo非彼Kryo”,Kryo280并非常規升級的產物,而是采用全新架構。
簡單來說,Kryo280采用八核心類似BigLittle架構,采用四顆性能大核+四顆效率小核,不過Kryo280最具特色的,還是其成為第一個采用ARM新架構之上重新設計的架構,“Built on ARM Cortex Technology”這項技術允許供應商重新根據自己的需求修改公版架構,比如廠商可以應自己需求去定制指令窗口大小以增加IPC,但類似解碼器寬度或者是執行管道這種則超出了修改范圍。這種半定制設計可以使得廠商能夠將自己的產品與ARM公版區別開來,同時也可以省去重新開發的架構所需的時間和費用。盡管我們并不知道高通的Kryo280是基于哪個公版進行的修改,但兩個CPU集群確實都是采用了半定制設計。并且高通宣稱,其內存控制器也是自己設計的。
在GeekBench4的單線程整數跑分測試中,可以看到驍龍835相比前代的821基本上是六四開的贏面。盡管在整數IPC方面有所長進,但在Canny(邊緣檢測)、JPGE、PDF渲染方面均輸給了821,有趣的是,在之前我們麒麟960的性能測試中,也是這幾項輸給了驍龍821,而這些整數測試的成績大多依靠L1、L2緩存,因此ANANDTECH推測,可能Kryo280就是基于ARM A73公版半定制化。另外,驍龍835在GeekBench4其它子項目的成績都與麒麟960比較接近,這也并非是主頻或測試方法可以干預的。因此說明,即便通過BoC修改的半定制架構,可修改的幅度也比較有限。
而在GeekBench4單線程整數運算(加入頻率)測試中,用上表整體整數除以頻率,可以更直接的比較不同架構間的IPC。可以看到,Kryo280與A73架構成績還是比較接近,其整數IPC比A72高出6%,比A57高出14%,不過與驍龍821相比,則高出22%。
而在浮點運算中,令我們非常意外的是Kryo280的竟然全面落后驍龍821。按筆者的猜測,Kryo的浮點運算一直是其強項,而到了Kryo280,并沒有采用全自主設計,而BoC可改動的幅度又小,因此才出現了這種情況。不過可以看到,Kryo280與麒麟960的A73成績比較相當。
在之前麒麟960測試A73時,考慮到A73的NEON執行單元與A72相比并沒有改變,而降低了特殊指令的延遲,當時猜測有些測試項目受到A73解碼器寬度的變化。因此,麒麟960的A73與驍龍835的Kryo280都顯示出了相比A72減少了L2緩存的讀/寫帶寬(以及較低的L1寫入帶寬),這也可能對性能造成影響。
而將頻率計算進去,Kryo280則悲劇的敗給驍龍821 23%,不知道高通究竟是因為妥協的結果還是自己設計思路上的改變。兩年前高通在研發Kryo時,就考慮到未來的新工作所需的變化,因此將更多的工作由GPU或DSP來提高效率,因此也可以接受犧牲一些浮點運算來節省面積或功耗。
內存測試方面,Kryo280、A73、A72和A57內核都有2個地址生成單元(AGU),但A72和A57可以使用專門的AGU進行加載和儲存操作,Kryo280和A73的每個AGU都進行加載和儲存同時進行。因此,對于A73架構,這樣的策略相當于減少了內存延遲,并且增加內存帶寬。
而對于Kryo280來說,相比麒麟960還甚至增加了11%,對比驍龍821和810都有所增加。但并沒有A72到A73升級幅度大,因為在驍龍821的Kryo中,就已經可以做到單個AGU同時進行加載和儲存,只不過之前的內存延遲更高而已。
系統性能測試:
▲總分
直到目前,我們可以初步認為驍龍835的Kryo280相當于一個BigLittle組合的半定制A53+A73 CPU內核,其整數與浮點運算都接近于麒麟960.而像PCMark這樣系統級的測試,其中就包括了調用安卓標準的API接口來強調CPU、GPU、RAM以及NAND儲存的實際工作負載。但我們都知道,手機系統的體驗不僅僅取決于硬件性能,還取決于廠家對其系統的優化,包括程序的優先級以及動態電壓頻率調整的策略,以控制手機的發熱等問題。不過這并不妨礙我們看到驍龍835的原型測試機在PCMark排名第一,超越了Mate9的麒麟960,并且比驍龍821還領先了23%。
▲網頁測試
網頁測試,驍龍835的原型機表現良好,超過Mate9 10%,并且超過驍龍821 34%。不過尷尬的是采用驍龍820/821的機器全部落后于麒麟960、麒麟950,看起來還是有些悲劇。
▲寫入測試
在寫入操作時(包括對PDF文件的處理和加密),內存測試以及將文件讀取和寫入閃存時,會在CPU的大核上有所要求。因此這個測試會產生一些多變的結果。比如樂Pro3會比S7 Edge快40%,而驍龍835則與Mate9之間差異很小,不過對比驍龍821的產品,還是體現出吊打級的優勢。
▲數據操作
數據操作測試中,主要測試的是整數工作負載,用于測量從多種不同文件類型中分析數據所需的時間,然后與動圖表交互記錄幀率。驍龍835的原型機與Mate9在此相差無幾,不過也是唯二沖上5000分的,對其它821的機器又是一頓吊打。。。
▲視頻編輯測試
視頻編輯測試:采用OpenGL ES 2.0著色器提供視頻效果進行視頻編輯測試,對系統來說屬于比較輕量級的測試。在測試中,我們發現GPU基本處于空閑狀態,大多數情況下都由CPU的小核心完成。因此可以看到,基本上每款產品的成績都差不多。
▲照片編輯測試
照片編輯測試則是采用多種照片的效果和濾鏡來測試CPU和GPU,由于Adreno GPU上強大的ALU性能,驍龍835和驍龍820/821則位居前列。Adreno 540又一次吊打了Mali T系列和G71。
在Kraken 1.1測試中(使用Chrome、Safari、IE),iPhone表現最好,不過這也并不足以證明蘋果A系列芯片與安卓其它SoC之間的差異,因為它們分別采用不同的瀏覽器。而iPhone性能優勢很大一部分來自Safari的JavaScrip引擎。
而驍龍835的原型機與其它使用Chrome的手機相比,在Kraken測試中與驍龍821的產品并沒有太大差別,在JetSteam中與Mate9相近,而在WebXPRT 2015測試中,則大幅度領先驍龍820/821的產品。
GPU性能測試:
GPU方面,此次驍龍835采用Adreno 540,與之前驍龍821的Adreno 530架構基本相同,并且對ALU以及文件寄存器進行了一些優化,并且通過改進深度過濾器來減少每個像素的工作量,進一步提高性能和降低功耗。為此,高通官方宣稱Adreno 540的3D渲染相比530提高25%,GPU的主頻峰值也達到710MHz,相比Adreno 530提升了14%。
GFXBench的霸王龍測試是一款基于OpenGL ES 2.0的游戲模擬測試,我們看到驍龍835的原型機與iPhone7 Plus、Mate9都達到60幀的成績,不過Mate9與iPhone7 Plus都為1080P屏幕,而驍龍835的原型機則是第一款達到這樣成績的2K分辨率的產品。
而在離屏(固定以1080P分辨率渲染)測試中,驍龍835的性能則超過了iPhone7 Plus與Mate 9,甚至比驍龍820提升了25%,與高通官方宣稱的一致。
在GFXBench的高性能Car chase測試模擬了現代渲染管道,其中包含OpenGL ES 3.1以及安卓擴展包,主要是考驗ALU性能。在這一測試中,驍龍835吃了分辨率的虧,成績落后于一加3T以及Mate9。而當離屏狀態下,則重回第一。一般來說,廠商的PPT多少都有些夸大的意味,而在GPU部分,高通則確實做到了他們PPT中所承諾的提升,甚至在離屏測試中比Mate9的Mali G71 mp8還要強大。而Mali G71則是基于ARM最新的Bifrost架構,主頻甚至到了960MHz至1037MHz。
在3DMark中Sling Shot Extreme測試中,采用安卓上的OpenGL ES 3.1或iOS上的Metal,通過2K分辨率來進行渲染來強調GPU和內存的性能。在于A10、Exynos 8890, 麒麟960以及驍龍820,幾乎當前所有頂尖處理器在一起評比,因此驍龍835在總分測試中排名第一、圖形測試中iPhone 7 Plus高10%,比820和8890版的S7高了24%,這樣的成績還是非常有意義的。
在第二個測試中強調了GPU著色器的性能,因此我們可以看到Adreno 540有了明顯的提升,相比Adreno 530的S7提升34%,超過了Mate 9的G71 50%,高通在ALU以及文件寄存器上的提升看到了效果。物理測試主要是在CPU上運行,并且受SoC內存管理器隨機訪問的嚴重影響,因此盡管CPU表現接近,但驍龍835還是比Mate9快了14%。而或許是由于驍龍835的內存管理比麒麟960的內存延遲更低而帶寬更寬。
Basemark ES 3.1測試模擬了安卓OpenGL ES 3.1和iOS上的Metal,包括了許多后期處理、粒子和照明效果,但不像GFXBench 4.0 Car Chase測試中的計算。
在Vulkan被加入到基準測試中之前,安卓設備大多依賴OpenGL,使得對比運行Metal的圖形API的iPhone處于很大的劣勢。使得驍龍835比iPhone7 Plus落后73%。而在Basemark ES 3.1測試中,ARM的Mali GPU居然超過了Adreno,Exynos 8890的Mali-T880 MP12比驍龍820的Adreno 530快15%,而麒麟960的Mali-G71MP8在屏幕測試中比S835的Adreno 540快25%。而驍龍835則比Pixel XL提升了40%。
所有的游戲模擬測試,都展現出Adreno 540優秀的ALU性能。因此我們測試驍龍835在GFXBench中合成的ALU測試,不過奇怪的是提升的微架構相比820并沒有多少用。在表格中,驍龍835相比于驍龍820/821的提升都與主頻對應。
功耗測試:
功耗方面,通過測試驍龍820以及驍龍835兩款原型機,驍龍820的平均功耗為4.6W,而驍龍835則降至3.56W,功耗降低了23%。不過在實際使用中,不同用戶有不同的使用場景,因此這個結論暫時也只能當做參考。
總結:
如今的手機SoC包含了CPU、GPU、高性能DSP、低功率DSP、ISP、Modem、固定功能模塊(音頻、視頻解碼),在這么多電器元件中,CPU,GPU和內存性能這些都很容易測試。但能導致SoC設計中有較大差異的部分,比如DSP,ISP和其他方面的測試則并不容易,而恰好,這些則是高通的強項。
在測試中,我們猜測驍龍835的Kryo280架構可以看成一個A53+A73的半定制架構,Kryo280的大核的整數與浮點IPC與麒麟960中的A73非常接近,而與驍龍821相比之下,整數運算有了明顯提升,浮點運算則全面落后,但總體來說,進步大于落后。在測試中,毫無疑問,相比驍龍821,驍龍835有著更好的體驗。盡管測試數據都是基于高通原型機,而在筆者實際體驗量產版的驍龍835(小米6)一段時間后,感覺高通驍龍835確實有著不錯的使用體驗:穩定流暢且不熱。而給筆者最大的感覺則是相比于驍龍820,驍龍835幾乎能有“看得見般”體驗的提升。對于當前性能逐漸“擠牙膏”的智能手機,此次驍龍835確實表現非常不錯。
龍835正式公布一月之后,GeekBench網站上終于出現了一大波搭載該平臺機型的跑分信息,其中最高單核分數為2004,多核分數6233,但從GeekBench并無法得知具體機型,或者也只可能是高通自己的驍龍835開發平臺。
驍龍835架構
與去年主打的兩大旗艦驍龍821以及Exynos8890對比來看,驍龍835在單核和多核性能上小有突破,與Exynos8890的優勝在單核方面,與自家驍龍821的優勢主要在多核方面;而與麒麟960相比,驍龍835并沒有什么勝算。
驍龍835包含以下特性:
?搭載Kryo 280 CPU,包括峰值主頻可達2.45GHz的4顆性能核心,以及峰值主頻可達1.9GHz的4顆效率核心;
?集成驍龍X16 LTE調制解調器,支持高達1Gbps的Category 16 LTE下載速度,以及150Mbps的Category 13 LTE上傳速度;
?集成2x2 11ac MU-MIMO,相較于驍龍820,尺寸減小可達50%,Wi-Fi功耗降低可高達60%;
?支持802.11ad多千兆比特Wi-Fi,提供高達4.6Gbps的峰值速度;
?全球首款認證的Bluetooth 5商用技術,提供高達2Gbps的速度,以及支持大量全新使用場景的一系列特性。通過WCN3990配套解決方案,支持Bluetooth、調頻收音機、Wi-Fi和射頻;
?搭載Adreno 540 GPU,支持OpenGL ES 3.2、完整的OpenCL 2.0、Vulkan和DX12;
?支持HVX特性的Hexagon 682 DSP;
?采用Qualcomm All-Ways Aware技術,支持Google Awareness API;
?雙通道1866MHz LP DDR4x內存;
?Qualcomm定位技術,支持GPS、格洛納斯、北斗、伽利略和QZSS衛星導航系統,結合LTE/Wi-Fi/Bluetooth連接,可提供“始終開啟”的定位與情境感知功能;
?搭載14位Qualcomm Spectra 180 雙ISP,最高可支持3200萬像素單攝像頭和雙1600萬像素攝像頭,支持混合自動對焦(激光/對比/結構光/雙相位檢測自動對焦)、Qualcomm Clear Sight技術、光學變焦、支持硬件加速的人臉識別和高動態范圍(HDR)視頻錄制;
?支持4K@30fps超高清視頻拍攝、高達4K@60fps的超高清視頻播放,支持H.264 (AVC)和H.265(HEVC);
?對終端顯示與外接顯示的最大支持,包括可支持Ultra HD Premium,支持4K @60fps、廣色域顯示與10位色深;
?支持Quick Charge 4技術;
?驍龍安全平臺,包括Qualcomm SecureMSM硬件與軟件,以及Qualcomm Haven安全套件;
?Qualcomm Aqstic WCD9341音頻編解碼器,結合驍龍835支持高保真級別的DAC,支持32比特/384kHz、115dB信噪比(SNR)和超低的105dB THD+N,以及原生DSD hi-fi音頻播放。此外,驍龍835還支持Qualcomm aptX和aptX HD 藍牙音頻,同時無線連接的功耗降低一半;
?采用10納米FinFET工藝制造。
龍820是高通SoC版圖上的一個里程碑,其無論絕對性能還是能效比,對比驍龍808/810都有大幅度提升,而且商業上也非常成功。而更重要的是,這背后是高通對移動計算平臺的看法和布局——異構計算:
經過大幅增強的Hexagon 680 DSP(digital signal processor數字信號處理器)有了自己的獨立介紹,后者支持Hexagon矢量擴展(Hexagon Vector Extensions/HVX),負責圖像處理應用中的計算負載(以往在CPU/GPU上相對更費電的虛擬現實、增強現實、圖像處理、視頻處理、計算視覺等任務可交給DSP去更高效率地處理);
上面有高通第一個自主構架的64位CPU核心——Kryo,其重點提升了浮點運算性能;
加入了升級后的 Adreno GPU ,更強的ALU(邏輯運算單單元)除了提升體驗外,還讓人工智能、機器學習(物體識別)、照片和視頻中的成像優化和AR/VR體驗提升等成為可能。
驍龍835構架組成
在這個理念的基礎上,驍龍835現在是高通移動平臺的一部分,這個擁有超過30億個晶體管的SoC(然而蘋果16年9月推出的A10處理器已經有33億個晶體管了)是首個使用三星10nm工藝的產品,最終讓封裝面積對比驍龍820減少了35%。新的CPU構架和X16 LTE基帶是當中最重要的改變,其基帶已經可以提供最高1Gbps的下載速度(Cat.16),SoC里的其他部分也得到了一些相應的小升級。
三代驍龍參數對比
高通從驍龍800那一代開始就有請媒體到高通加州圣地亞哥總部,以進行功能演示和有限測試的習慣,當然,是通過高通自己的原型機(MDP移動開發平臺),后者是用于進行軟硬件測試,具備完整功能的手機或平板,只是它們的體型會比手機要大一圈。當年的驍龍810被放在了平板測試機上,而820的測試機是一部有6.2英寸巨屏的手機,到了835這一代,測試原型機繼續變小,變成了5.5英寸2K分辨率屏幕,搭載6G內存和2850mAh電池的手機。
原型機變小是個好趨勢,因為機器越小,可以用來吸收和分散熱量的面積就越小,這側面說明了驍龍835的功耗會進一步縮小。當然,這需要精確的功率測試才能確認。因為測試時間有限,所以我們專注于CPU/GPU和內存性能測試。注意,我們這里測試的是原型機和非正式版的系統,所以結果僅供參考。量產版很有可能會有比一定的出入。
820上的Kryo是高通第一個全自主設計的64位CPU,這個獨特的構架在浮點的IPC性能很強(愛搞機:IPC全稱Instruction Per Clock cycle,指每周期可處理的指令數,可以籠統理解性能=IPC*頻率),但整數IPC性能還不如ARM之前的A57構架,而且能效比也要低一點。比起使用修改820的4核Kryo構架,高通在835走了一條完全不同的道路。
新的Kryo280構架,除了名字,和原來的Kryo構架沒有任何的傳承關系。驍龍835上采用了8核心大小核構架,由4個負責極限性能輸出的大核,和4個追求“能效比”的小核組成。而這個構架最特殊的地方,其實是它是首個對ARM新構架進行改進的產品。BoC許可讓廠商可以根據需求對構架進行調整,特別是對指令預取區和發射隊列上的修改,但構架里某些部分不在許可范圍內。包括解碼器和執行管線都是動不了的,畢竟改動他們的工程太大了。高通沒有公開它是基于ARM那個構架修改的,但高通表示大小核CPU都是半自主設計的構架,而內存控制器也是高通自己設計的。
驍龍835的 Kryo 280 CPU在整數運算IPC性能(每周期可處理的指令數)對比820/821有明顯的提升,這是我們沒預料到的,畢竟Kryo核心的長處不是整數運算。雖然大部分測試中都有大增長,但JPEG,Canny和Camera等部分測試出現了倒退,這個特征和我們在Kirin 960上的A73表現很像。這些整數測試的成績和L1/L2緩存的行為,都和A73獨特的表現很類似,Kryo 280可能就是基于ARM最新的A73構架改的。
Geekbench 4單線程整數運算小項目成績
具體分數可以戳我們愛搞機之前驍龍835亞洲首秀的文章《20萬分不是夢 驍龍835亞洲首秀》,這里我們簡單對比一下驍龍835和Kirin 960在Geekbench 4的整數測試成績,它們的子項目成績的類似程度,可不是頻率和正常的測試變量可以造成的。它們的測試成績里,只有極少數特殊的項目有差異,范圍在-5%-9%之間。這再次說明了,在BoC許可內做小修改后的半自主構架,其成績其實也是可以預測的。
把頻率考慮進去之后(上表)得出每Mhz獲得的分數(意義接近同頻性能),這會更加容易比較不同構架之間的IPC性能。Kryo 280這種半自主設計的構架,成績和Kirin960上的A73并沒有很大分別,只是比A72高了6%,比A57高了14%,比起前代的驍龍820/821高了整整22%(因為Kryo核心本身在LLVM和HTML5 DOM上的表現不佳,拖低了820/821的分數)。驍龍835的成績無法橫掃其他旗艦產品,和Kirin 960上的A73一樣,小項目測試的結果和前代對比也是互有高低的。
Geekbench 4單線程浮點運算小項目成績
驍龍835的Kryo 280在820本來強項的浮點測試中的分數出現了明顯的倒退,甚至還輸給了A72。結果依舊和 Kirin 960的A73很像,連小項目的測試分數也很接近。
A73相對A72小幅倒退的部分,也是Kyro 280倒退的部分,這有點出乎我們的預料。因為他們的NEON執行單元和A72幾乎沒有變化。如果硬要說區別的話,A72在前端延遲、指令預取區和內存系統上會占優一些,但幅度不大。A73在指令解碼上的劣勢會影響成績,但不會對全局造成大的影響。對比A72,Kirin 960的A73和驍龍835D Kryo 280 都出現了 L2緩存讀/寫帶寬下降,L1緩存寫入帶寬下降的問題,這同樣對成績造成了影響。
驍龍835的浮點IPC性能比820/821低了23%,這不知道是設計思路上的妥協還是設計思路上的轉變。高通在兩年前開始設計Kryo核心的時候,應該就已經對未來那些還沒到來的需求有所預測了。從現在高通的布局來說,高通應該是覺得以后更多的計算需求會轉到GPU和DSP上,這樣可以提升整體的能效比,而“放棄”的浮點性能可以省下寶貴的芯片面積和電力。
Geekbench 4單線程內存測試成績
Kryo 280、A73、A72和A57都有2個AGU地址生成單元。但A72/A57將載入和存儲操作分開由不同AGU處理,而Kryo 280和A73 里的AGU都可以執行存取操作。在Kirin 960上,這個改變帶來了比950更加低的內存延遲和并提升了內存帶寬。
835在內存延遲控制和帶寬上,甚至比960還要強,拋除頻率差的因素后,提升依舊達到11%,對比820/821提升巨大。但在兩代Kryo的帶寬提升幅度,不如Kirin從A72升級A73構架時那么大,因為上一代Kryo的2個AGU就已經能執行載入和存儲兩種操作了,只是前代在某些場景的延遲會更高。
到現在為止,我們對驍龍835上的Kryo280的印象是,其是對A53和A73構架進行修改后的產物,無論整數還是浮點運算的IPC每周期性能,都和Kirin960很相似。像PCMark這些系統層面的測試,可以根據真實生產環境,使用安卓API對CPU/GPU/內存/NAND存儲進行測試,但除了CPU的IPC性能和內存延遲等影響外,還會受廠商對系統軟件優化的影響,后者可以控制程序優先級和DVFS動態電壓頻率調整策略,以求得性能和續航之間的平衡。
可以確認的是,和其他SoC一樣,在不同機器上的驍龍835會有較大的跑分差距。而在原型機上的驍龍835刷新了PCMark的記錄,其總分比用Kirin960的Mate 9要稍微高一些,比最快的821的機器還快了23%。
在網頁瀏覽測試中,驍龍835原型機表現優異,但只是比Mate 9高10%。在這個主要考核整數運算的測試中,其比820/821高了34%。值得注意的是,整數運算本來就吃力的820/821,排在了所有A72和A73構架的機器之后,甚至連驍龍650都打不贏。
PCMark的寫入測試對頻率敏感,需要大核的瞬間爆發性能,測試包括模擬打開PDF文件、文件加密(前兩個都是整數運算負載)、內存測試、甚至還有閃存讀寫測試。所以這個測試的結果會有很多變量,甚至820/821的機器之間都會有較大的出入,像樂視樂Pro3就比 Galaxy S7 edge還要高40%。但驍龍835原型機和Mate 9的差別微乎其微。但驍龍835比起前代進步明顯,比最快的樂Pro 3(821)還要快24%,比 Nexus 6P(810)快80%,比聯想ZUK Z1(驍龍801/8974AC)快162%。
PCMark數據處理測試同樣主要考核整數運算性能,測試包括處理一大堆不同類型的文件的速度對比,并會記錄他們和動態圖表交互時的實時幀率。驍龍835原型機和Mate9的成績依舊很接近,但它們這次和其他機器的距離拉得更開,驍龍835原型機比Pixel XL提升28%,比LG G5提升111%。和寫入測試類似,820機型間的表現差距很大,再次證明了OEM廠商的調教會對用戶體驗造成很大影響。
視頻剪輯測試中,使用的是OpenGL ES 2.0的片段著色器提供視頻特效。這是非常輕度的工作負載,大部分手機在這里,GPU和大核幾乎都是閑置狀態的,僅僅使用如A53這樣的小核,這就是為什么成績差距會這么小的原因了。
圖片剪輯測試中,提供了一堆不同的圖片特效和濾鏡,需要CPU和GPU同時工作。得益于 Adreno GPU強大的ALU(算數邏輯單元)表現,驍龍835原型機和820/821機型的表現都很好。835的 Adreno 540 GPU比Mate9上的Mali G71(ARM現在最強GPU構架)還要強了33%。
JavaScript測試中iPhone的表現都很好,但這個無法用來對比蘋果A系列芯片和安卓平臺的芯片,因為它們用的瀏覽器也是不同的,這很大部分得益于Safari瀏覽器的JavaScript引擎。安卓平臺在同樣使用最新版的Chrome瀏覽器時,驍龍835原型機不錯。雖然在Kraken測試中和820/821并沒有拉開差距外,在JetStream中又和Mate9沒有什么分別,但在后者中比820/821機器有15%到37%不等的提升。其在WebXPRT 2015 中的測試出乎預料地好,比Mate 9高了24%,比使用820的S7 edge高67%。
為了看看軟件層面造成的影響會有多大,我們使用高通內部測試的瀏覽器(專門為了驍龍SoC優化過)進行測試,結果Kraken測試值提升到了2305ms, 但JetStream提升24%到了87分(但這兩個項目還是落后iPhone很多),WebXPRT 2015 測試更是暴漲82%達到280分(終于打贏并拋離了iPhone)。
驍龍835上的 Adreno 540 和820上的 Adreno 530用的是同樣的構架,但做了小優化避免以前的瓶頸,并對對ALU和寄存器進行了優化。通過改進depth rejection(深度過濾器)減輕了每個像素點的計算負載,以提升性能表現并降低能耗。
高通宣稱在3D渲染上對比820的Adreno 530有25%的提升。雖然官方沒有說明,但很明顯,這里面一大半的提升來源于10nm制程的優勢,后者讓GPU頻率可以提高到710MHz,單單這里已經比820提升14%了。
GFXBench里的霸王龍測試是比較老的測試項目了,其基于OpenGL ES 2.0 API。和新測試不同,其結果和著色器性能沒有嚴格對應關系,這也是為什么旗艦都可以在亮屏測試里,頂到V-Sync限制的60幀。但以前達到60幀的iPhone 7 Plus 和 Mate 9都是1080P分辨率的,但這次的驍龍835原型機,是第一部達到60幀的2K屏設備。
在離屏測試中,驍龍835測試機超越了 iPhone 7 Plus和 Mate 9,比Pixel XL(820)快了25%,和高通宣稱的提升幅度接近。幾乎是Nexus 6P的Adreno 430的2倍,聯想ZUK Z1上的801上的Adreno 330的4.5倍
GFXBench 的Car Chase場景,使用了OpenGL ES 3.1和Android Extension Pack (AEP)上的最新渲染管線,和很多最新的游戲一樣,這主要壓榨的是ALU單元的性能。這個測試里,驍龍835同樣是對比前代提升25%,但更加出乎預料的是,Adreno 540的成績比Mate 9上的Mali-G71MP8高了55%,后者好歹是ARM最新的Bifrost構架的GPU啊,而且測試里還維持了960-1037MHz的超高頻。
3DMark的Sling Shot Extreme場景,安卓平臺會使用的是OpenGL ES 3.1,iOS設備用的是Metal 圖形API,該測試會同時壓榨GPU和內存系統,而且離屏測試分辨率是1440P,而不是其他測試使用的1080P。驍龍835在總分上有30%的提升,這已經是相當好的成績了,畢竟在蘋果A10、Exynos 8890、Kirin 960,和驍龍820/821 這堆SoC之間僅有8%的差距。圖形分里,驍龍835原型機比iPhone 7 Plus高10%,比820和8890版的S7高了24%。
在3DMark Sling Shot的第一個圖形測試中,畢竟構架變化不大,Adreno 540并沒有像以前Adreno 530那樣,在幾何運算里表現出現大躍進式的提升。 而面對一向在幾何運算任務重表現出色的ARM Mali系列GPU,Adreno 540仍然要強11%左右。
在注重著色器性能的第二個圖形測試,Adreno 540就發飆了,對比S7上的Adreno 530提升34% ,比Mate 9的Mali-G71高50%,高通在ALU和寄存器上的修改,在這個測試里的效果非常明顯。物理測試是在CPU上跑的,而且受SoC的內存控制器的隨機存取表現直接影響。雖然CPU表現相似,但驍龍835原型機比Mate9提升14%,主因或許是835的內存控制器,在延遲控制和帶寬都比Kirin960強。
Basemark ES 3.1 測試在安卓平臺會使用的是OpenGL ES 3.1,iOS設備用的是Metal 圖形API,但沒有GFXBench 4.0 Car Chase場景里的tessellation密鋪計算。在今年年尾加入Vulkan支持前,安卓平臺都會受到OpenGL的拖累,在蘋果的 Metal 圖形API面前根本抬不起頭。API上的差距,讓 iPhone 7 Plus 拋離驍龍835原型機73%。
在 Basemark ES 3.1的工作場景下,ARM的Mali系列GPU會更占優,離屏測試, Exynos 8890的 Mali-T880MP12比820上的Adreno 530快15%,Kirin 960上的 Mali-G71MP8 要比驍龍835的Adreno 530快25%。這個測試中,驍龍835原型機比起Pixel XL的漲幅達到了40%,比其他測試里的25%要高一截。
在這些游戲模擬測試里, Adreno 540有更好的ALU表現,所以我們很好奇它在GFXBench的綜合ALU測試里的成績。比較驚奇的是,這個構架提升在并沒有帶來什么提升。結果里,835對比820的14%漲幅、對比821的8%漲幅,都是和GPU頻率嚴格對應的,說明這個場景的瓶頸在其他地方。當然,這結果還是比Mate 9高了32%。
為了在大眾心中塑造驍龍是個平臺,而不單單是CPU或基帶的印象,高通在總部的實驗室做了很多演示。但在CES和GDC展會中,高通貌似沒有什么好展示的,基本就是把手機塞到VR/AR設備,或者直接就是搭載835的VR/AR原型機。
在同樣的VR測試中,對比820,驍龍835功耗率下降23%。當然,這是高通自己的試驗環境,真實場景使用的優勢未必會這么大。
高通的相機測試實驗室有一大堆牛逼而且很貴的設備,公開展示是為了告訴世人,高通的ISP和軟件改進都是基于大量的試驗結果的。里面除了可以控制光線強度和色溫外,連測試ISP電子防抖用的“抖動機”都是專門設計的,其可以設定不同抖動模式和頻率,方便工程師去測試EIS電子防抖系統。
有個比較有趣的展示是835工程機的虹膜識別,這個功能可以部分代替指紋識別的工作,在不方便用手的場合使用。但測試機該功能還不完善,高通的產品經理用是正常的,但作者無法使用[攤手]。
實驗室還有計算機視覺識別的展示,這個已經不是新技術了,但和同領域對手一樣,高通也受益于最近機器學習的突破性進展。
移動SoC包括了:CPU、GPU、高性能的DSP(運算用途)、低功耗DSP(協處理器)、基帶SDP(信號處理)、ISP(照片處理)、固定的功能模塊(視頻與音頻)等。所有這些部分都會影響用戶體驗,但當中很多都無法量化。
而CPU和GPU是最核心的性能部分,而且對續航影響最大,所以它們還會是我們測試的重中之重。初步的測試結果表明驍龍835的CPU部分是4+4的大小核結構,由4個修改版的A73和4個修改版的A53組成,整數和浮點IPC周期性能都和Kiirin960上的A73非常接近。對比820/821的Kryo構架,整數性能提升,浮點性能下降,但這個取舍利大于弊,其整體表現比820/821要好。
高通在VR/AR上繼續用力,不單是手機平臺,還包括了頭戴設備。VR對高分辨率、低延遲的要求,都需要非常強大的GPU性能。835的Adreno 540 GPU在構架小優化和高頻率下,有25%的性能提升,對VR設備來說肯定是好事。
另外,這些結果都是基于工程機的,無法代表最終量產的結果。但即便如此,已經幾乎可以肯定835對比820會有大幅度的提升了。但對用戶體驗的影響最大的,或許不是小幅提升的性能或什么新功能,而是10nm制程帶來的功耗/續航提升。
via:anandtech