外觀方面,OPPO A5基本延續(xù)了此前A3的設(shè)計風(fēng)格,正面配備今年流行的19:9劉海全面屏,風(fēng)格與自家的OPPO R15旗艦機也比較相近,屏占比接近88%,正面視覺效果表現(xiàn)突出。
背面方面,OPPO A5采用特殊工藝的塑料材質(zhì)后殼,中框和后殼均為塑料材質(zhì),提供幻鏡紅、幻鏡藍、幻鏡粉3種顏色可選。由于特殊工藝打造出了鉆石紋理效果,在光線下也會營造出十分絢麗奪目的幻境紋理效果,背面視覺效果同樣突出。
值得一提的是,OPPO A5取消了指紋傳感器,因為背面只有平行雙攝和Logo,背面顯得頗為簡潔。
總的來說,OPPO A5外觀設(shè)計在千元機中顯得頗為漂亮,略顯不足的地方主要在雖然外觀上沒有塑料手機的廉價感,但骨子里逃拖了塑料的本質(zhì),在同價位手機中,細究起來難免有所吐槽。
屏幕方面,OPPO A5配備一塊6.2英寸大屏,分辨率為1520x720,屏幕面板為普通的LCD屏。720P屏,幾乎是目前最入門的屏幕了,而目前1500左右的國產(chǎn)手機幾乎清一色都是1080P全高清屏幕,從這點來看A3屏幕顯得偏低一些。
性能方面,OPPO A5搭載高通驍龍450八核處理器,輔以4GB+64GB內(nèi)存組合。驍龍450是高通面向今年入門市場推出的Soc,性能相對一般,而4+64GB內(nèi)存組合,在千元機中表現(xiàn)主流,日常使用流暢度有保障。驍龍450基于14nm工藝制程,配8個A53核心,主頻為1.8Ghz,內(nèi)置GPU為Adreno 505,頻率為600MHz,基帶版本為Cat.7,CPU規(guī)格相對一般。
從安兔兔V7跑分測試來看,OPPO A5安兔兔跑分在7.3萬分,性能在如今安卓機中,屬于中低端偏入門水平。滿足日常通訊、刷微博、微信等APP肯定是沒問題的,也能流暢《王者榮耀》這樣的輕量級3D手游,只不過應(yīng)對諸如《絕地求生 刺激戰(zhàn)場》這樣的中大型游戲會有壓力,畢竟是入門千元機,并不適合玩中大型游戲。簡單來說,OPPO A5主要適合對游戲性能要求不高的日常APP、輕量級3D網(wǎng)游用戶需求,比如平時不玩大游戲的話,性能夠用。
相機方面,OPPO A5提供前置800和后置1300萬+200萬像素雙攝像頭組合,支持AI美顏,前后相機像素規(guī)格都比較一般。不過OPPO手機在相機優(yōu)化方面表現(xiàn)還不錯,前置相機方面,OPPO A5配800萬像素單攝像頭,支持AI美顏。
系統(tǒng)方面,OPPO A5運行的是基于Android 8.1 開發(fā)的 ColorOS 5.1,界面走的是簡約不臃腫路線,加入了AI美顏、AI語音助手、AI電源管理等一系列AI應(yīng)用,預(yù)裝APP比較少,系統(tǒng)中沒有廣告,系統(tǒng)體驗還是不錯的。
OPPO A5在系統(tǒng)中內(nèi)置了一些實用功能,下面簡單盤點下。比如,打開智慧識屏之后,直接用拇指按壓文本,系統(tǒng)會自動別文本的內(nèi)容,并自動匹配相關(guān)的應(yīng)用、日歷、出行信息等。
智慧識屏還能直接識別圖片中的物品、文字,同樣的方法,我們可以直接查找到鎖屏模特穿的同款衣服,又或是誘人的蛋糕。除了能提供生活信息之外,還支持韓、日、英三門語言的雙向拍照翻譯、支持英、日、韓、法、西班牙的語音翻譯,以及方便查找同款好物的智慧識物。OPPO A5支持人臉識別,基于普通的2D人臉識別技術(shù),加入了閉眼不識別的安全選項。而為了避免用戶重復(fù)解鎖的煩惱,系統(tǒng)還新增了智能解鎖功能。檢測到運動狀態(tài)和可信狀態(tài)下,OPPO A5會保持解鎖狀態(tài),不用重復(fù)識別人臉拿起就能用。
其它方面,OPPO A5系統(tǒng)中還加入了創(chuàng)新的“應(yīng)用速凍”功能,能夠智能凍結(jié)耗電應(yīng)用,避免應(yīng)用在后臺消耗電量,提升手機續(xù)航,結(jié)合大容量電池,該機續(xù)航是主打賣點之一。
從系統(tǒng)體驗來看,OPPO A5還是不錯的,簡約的系統(tǒng)界面,結(jié)合一些實用的AI功能,很適合日常使用。稍顯不足的地方在于該機取消了指紋識別,不支持指紋解鎖、指紋支付等,依靠人臉解鎖,有時候不如指紋方便實用。
續(xù)航方面,OPPO A5內(nèi)置了4230mAh大容量電池,鑒于驍龍450功耗不高,加之720P入門屏幕比較省電,另外還有系統(tǒng)優(yōu)化加持,續(xù)航上自然會有不俗的表現(xiàn)。
按照OPPO的說法,OPPO A5 不僅擁有 A 系列首次配備的 4230mAh 超大電池,還搭載了創(chuàng)新的“應(yīng)用速凍” 功能,能夠智能凍結(jié)耗電應(yīng)用。可觀看視頻約 14 小時,或玩游戲約 11 小時,忘記電量煩惱,出行更放心。不過OPPO A5并不支持快充,5V/2A充電器,充電速度比較慢,略顯遺憾。
評測總結(jié):
優(yōu)點:顏值高、續(xù)航好、系統(tǒng)好用;
缺點:720P屏幕畫質(zhì)一般、性能一般、沒有指紋識別、性價比一般。
OPPO A5走的是差異化路線,瞄準的是一些注重顏值,對性能要求不高的妹子朋友。此外,簡約無廣告的系統(tǒng),比較注重美顏自照,對于一些預(yù)算有限,不玩游戲的女性用戶也確實可以形成一些差異化競爭優(yōu)勢。當(dāng)然,如果平時比較喜歡玩游戲,追求更好的屏幕畫質(zhì)、斤斤計較性價比的話,1500左右可以買到的1080P、驍龍636/660高性價比國產(chǎn)手機是更好的選擇。
那么,如果你們對于這款OPPO A5還有什么想要說的,歡迎在評論區(qū)留言給明美無限參與一起討論吧!
兩天華為、蘋果陸續(xù)發(fā)布新機Mate 50 和 iPhone 14 ,不但手機熱賣,而且都上了熱搜。
華為Mate 50首發(fā)了衛(wèi)星通信,受到了網(wǎng)友的熱議;iPhone 14 卻因為獨特的“”藥丸屏技術(shù)”受到吐槽。
不知各位網(wǎng)友有沒有發(fā)現(xiàn)一個問題:蘋果在處理器技術(shù)上已經(jīng)“一騎絕塵”,領(lǐng)先高通、華為一代。反觀華為,不但失去了麒麟處理器,而且還被焊死在4G上。
要知道蘋果直到iPhone 4 時,才搭載了自研的A4處理器,短短十多年的時間,就實現(xiàn)了追趕、超越、吊打,這不得不令人佩服。
那么蘋果處理器究竟有多強呢?又是如何做到世界領(lǐng)先的呢?今天將一一回答。
曾幾何時,蘋果、高通、華為成為了手機處理器領(lǐng)域的三座大山,作為唯一的國產(chǎn)品牌,華為受到了國內(nèi)粉絲強烈的追捧,甚至一度超越了蘋果。
但事實上,蘋果處理器要領(lǐng)先高通、華為整整一代。
先來看處理器的自主能力:
提到自主能力,就不得不提一個公司——“ARM”。ARM是移動處理器領(lǐng)域的王者,占據(jù)了全球移動市場95%的份額。蘋果、高通、華為、三星、聯(lián)發(fā)科等等都使用了它的授權(quán)。
也就是說,沒有ARM,我們的手機也無法正常運行。所以處理器的自主能力,在很大程度上體現(xiàn)在依賴ARM的程度。
蘋果、高通、華為恰好代表了“依賴ARM”的不同層次。
第一層蘋果,只采用了ARM的指令集
蘋果A系列芯片,指令集采用ARM公版,真自主CPU核心,自主GPU核心,自主NPU核心,自主ISP芯片,自主DSP芯片。
蘋果沒有自己的基帶,采用了英特爾基帶,采購了其他公司的射頻芯片,由臺積電代工。
第二層高通,采用了ARM指令集、架構(gòu),會基于IP核二次研發(fā)
高通驍龍指令集、架構(gòu)均來自ARM公版,一度使用過自研的CPU,但效果不理想,如今又重回ARM的懷抱。
自研GPU、無NPU、自主DSP芯片、自主基帶、自主射頻芯片,由三星電子代工。
高通曾基于ARM,開發(fā)出了自己的CPU微架構(gòu)Kryo內(nèi)核,同時也開發(fā)出了自己的Adreno GPU。被稱為“魔改”。
第三層華為,指令集、內(nèi)核均來自ARM公版
華為麒麟處理器,指令集、架構(gòu)來自ARM公版,CPU采用ARM的Corter A系列架構(gòu),GPU采用是ARM的Mail G架構(gòu)。
自研NPU、自主DSP芯片、自主基帶、自主射頻芯片,曾由臺積電代工(如今沒有代工廠)
可以說,同為自主研發(fā),蘋果的自主程度最高,已經(jīng)達到了“真自主”級別,高通只能被稱為“魔改”,華為則差一點了。
華為的巔峰之作是麒麟9000,而蘋果已經(jīng)迭代到了A16,高通迭代到了驍龍8gen1,當(dāng)然這是多方面原因造成的,這里不做討論。
為了更公平的對比,我們拿同時代的處理器做對比。
蘋果A14 于2020年9月16日發(fā)布;高通驍龍888于2020年12月1日發(fā)布;麒麟9000于2020年10月22日發(fā)布。
它們都是2020年下半年發(fā)布,但A 14過于強大,不適合做討論(穩(wěn)穩(wěn)的第一)。因此拿2019年9月11日發(fā)布的 A 13對比更為合適。
CPU跑分方面:
蘋果 A 13:單核跑分1327,多核跑分3477;
驍龍888:單核跑分1117,多核跑分3683;
麒麟9000:單核跑分1001,多核跑分3639。
可以看出,單核跑分方面 蘋果 A13>驍龍888>麒麟9000。蘋果A 13單核性能最強悍。
多核跑分驍龍888>麒麟9000>A 13。蘋果A13只有6個核心,因此多核心最弱。
CPU能效比方面,這三顆處理器相差不大,性能高的功耗也相對較高。
GPU方面:
GFX3.1跑分顯示:麒麟9000得分達到了132FPS,蘋果A13和驍龍888得分123FPS。
麒麟9000GPU性能更強,同時功耗也更高達到了8.3W。蘋果 A13跑分和驍龍888相當(dāng),但蘋果功耗最低只有6W,高通功耗達到了7.7W。
綜合對比可以看出:蘋果 A13的CPU最強,GPU排在第二位;高通驍龍的CPU排在第二位,GPU最弱;麒麟9000的CPU最弱,GPU最強。
可以得出:蘋果A13>麒麟9000>驍龍888
相差一代的產(chǎn)品仍能勉強勝過麒麟9000和驍龍888。那么同代產(chǎn)品就算得上吊打了吧!
蘋果能有今天的成績,得益于它的兩次成功收購
2008年4月,蘋果以2.78億美元收購微處理器開發(fā)公司PA Semi,意外得到了150名高級工程師,其中還有一個名叫吉姆 · 凱勒的天才。
吉姆 · 凱勒被稱為“CPU游俠”,每到一處就會引領(lǐng)一場革命。
吉姆 · 凱勒分別在AMD、博通、PA Semi、蘋果、特斯拉、英特爾等公司擔(dān)任重要的技術(shù)職位,協(xié)助這些公司在芯片技術(shù)上實現(xiàn)了前所未有的發(fā)展。
在AMD,凱勒為K7、K8架構(gòu)做出了重要貢獻,AMD憑借K7、K8拿下了全球20%以上的市場份額,與英特爾大幅縮小了差距。
在博通,凱勒擔(dān)任了首席架構(gòu)師,讓博通在技術(shù)上得到了快速地發(fā)展。
2008年4月,凱勒任職的PA Semi 公司被蘋果收購,凱勒也加入了蘋果公司。
凱勒在蘋果公司任職了4年,幫助蘋果推出了A4、A5處理器,這兩款處理器分別搭載在 iPhone 4 和 iPhone 4S 上,讓當(dāng)時的 iPhone 達到了全新高度。
此后,蘋果在處理器領(lǐng)域一發(fā)不可收拾,至今仍引領(lǐng)該行業(yè),處理器性能更是吊打高通驍龍。
吉姆 · 凱勒擁有異于常人的能力:他可以在大腦中想象處理器設(shè)計圖,并逐步填充藍圖。
凱勒的原話(翻譯后)如下:
如果說我有一種超能力,我覺得應(yīng)該是可以想象出計算機的實際運行方式。在做性能建模之類的事情時,我可以在腦海中構(gòu)建起整個模型,但只是把代碼寫下來。這是一項非常有用的技能,可能一部分是天生的。也可能有部分是后天形成的,部分或許來自于我的晚期成人閱讀障礙。
天才真的與眾不同。我們的科技企業(yè)依靠人海戰(zhàn)術(shù)(無數(shù)的工程師)+996,勉強創(chuàng)造出一些不太落后的科技產(chǎn)品。而凱勒每天僅花幾個小時就足夠了。
但吉姆 · 凱勒仍然謙虛地說,自己不是真正的天才。在處理器設(shè)計中,毅力更重要,很多時候你要相信自己能做到。
凱勒每天休息7小時,喜歡在戶外工作,喜歡和孩子們共度時光,也喜歡吃飯和睡覺,就像工作一樣。(我也喜歡吃飯、睡覺)
兩年后(2010年6月8日),喬布斯發(fā)布了第四代蘋果手機 iPhone4 ,首次采用了蘋果自主研發(fā)的A4處理器,同時搭載了iOS 4操作系統(tǒng)。
從此 iPhone 可以一邊聽歌、下載,一邊上網(wǎng)、收發(fā)郵件,這得益于處理器性能的大幅度提升。
不知為什么,喬布斯在發(fā)布會上并沒有展示A 4處理器的性能。但事實證明A 4 的確很強,它完美的運行了iOS 4,同時使iPad續(xù)航能力達到了10小時。
2011年10月5日,蘋果公司發(fā)布第五代手機 iPhone 4S,這臺手機搭載了當(dāng)時最強的處理器蘋果A5。
有了A5的加成,iPhone 4S 的圖形處理速度加快了7倍,啟動應(yīng)用軟件、瀏覽網(wǎng)頁,以及做各種操作時,感覺就是“飛快”。
這塊震驚全球的A5處理器,不但加強計算和圖形性能,同時還延長了電池使用時間,性能在當(dāng)時來說達到了頂峰。
2012年,吉姆 · 凱勒離開了蘋果公司,回到了AMD,協(xié)助AMD打造了經(jīng)典的“Zen”。
2016 年到 2018 年,凱勒為特斯拉研發(fā)了 FSD 自動駕駛芯片,比之前使用的英偉達方案性能提高了20多倍。
而最近,他又為英特爾設(shè)計了3D 堆疊芯片等創(chuàng)新方法,是英特爾新架構(gòu)的策劃者之一。
吉姆 · 凱勒天才般的大腦,游俠一樣的變幻,讓蘋果、英特爾、AMD、特斯拉在芯片領(lǐng)域持續(xù)領(lǐng)跑。
如果華為能夠招募到凱勒,那華為將會速度起飛。
2010年,蘋果收購了一家名叫Intrinsity的芯片設(shè)計公司,之后便開始了自主研發(fā)手機CPU。
這里有必要解釋一下手機CPU與手機處理器。
現(xiàn)在的手機處理器不僅僅是一塊CPU了,它包括CPU、GPU、NPU、手機基帶等等。這些集成在一起,共同組成了手機處理器,也叫Soc(系統(tǒng)級處理器)。
Intrinsity,是一家小型的芯片公司,于1997年成立。公司一直與三星合作開發(fā)移動芯片。它的專長就是開發(fā)EDA工具和邏輯芯片功能。
EDA翻譯成漢語就是電子設(shè)計自動化,是芯片設(shè)計無法繞開的一項高性能工具。
至于邏輯芯片,那不是CPU還能是什么呢?
這說明,Intrinsity公司在手CPU領(lǐng)域十分專業(yè),因為低調(diào)沒有引起人們的注意。
Intrinsity公司最成功的產(chǎn)品就是自主研發(fā)的Fast14芯片技術(shù),早在2004年時就已經(jīng)依靠該技術(shù)研發(fā)出了CPU樣品,主頻達到了2GHz。
最為重要的是,采用Fast14技術(shù)后,單個硅元的性能是傳統(tǒng)設(shè)計方案的4倍,而且這種技術(shù)非常適合移動設(shè)備,因為它是嵌入式的,可以做的很小。
有了Intrinsity公司的加入,蘋果在芯片設(shè)計方面如虎添翼。就連喬布斯也自吹自擂說新品依賴“最先進的芯片”,該芯片取名A4,它可以使iPad續(xù)航能力達到10小時。
事實上A 4處理器的確成功了,并且蘋果處理器中的CPU也開始不在依賴ARM,這一點是高通和華為所不能比的。
高通號稱是魔改大師,但是如何無論如何改,依然繞不開ARM。而華為則直接采用了ARM的公版架構(gòu)。
蘋果的自研CPU可以更快的迭代,而ARM架構(gòu)需要照顧更多的客戶,因此考慮到兼容性,它的升級是漫長而緩慢的,這也是蘋果處理器性能強大的一大因素。
蘋果A16搭載在剛剛發(fā)布的iPhone 14 Pro 和iPhone 14Pro Max上。手機性能有了進一步的提升,可以說是絕對的性能王者。
蘋果A16仿生新片,采用了臺積電4nm工藝制程,集成了160億個晶體管。比A15的5nm工藝,150億晶體管,均有提升。
CPU方面,依然采用了6核心布局,包括2個性能核心、4個能效核心,比上一代A15性能提升了12.5%,功耗降低了20%。
GPU方面:共5個核心,神經(jīng)引擎依然是16核心,算力達到了每秒17萬億次,比A 15提升了8%。
同時,A16 還支持 LPDDR5 內(nèi)存,比 13 Pro 系列的 LPDDR4X 性能更強、能效更高,既能省電增續(xù)航,更大的帶寬.又能滿足 8K、VR 視頻等的需求。
在跑分方面,A16的單核成績?yōu)?950分,對比A15提升約12.5%;多核成績5500分,提升約15%。
整體來看,蘋果A 16已經(jīng)成為了性能之王,但較 A15性能提升并不大,晶體管數(shù)量也僅增加了10億個。
這也說明,在不斷逼近摩爾定律的極限時,芯片技術(shù)每向前一步都更加困難,即便是蘋果、臺積電也不例外。
高端芯片大都應(yīng)用在智能手機、個人PC、智能穿戴產(chǎn)品上,它對軍事、工業(yè)影響并不大,但它彰顯了一個企業(yè),甚至一個國家的技術(shù)實力,而且在未來的發(fā)展中越來越重要。
在處理器方面,華為的“無芯可用”與蘋果的“一騎絕塵”形成了鮮明的對比,加大研發(fā)力度,提高自主程度,已經(jīng)迫在眉睫。
華為還有機會超越蘋果嗎?5年、10年能做到嗎?
我是科技銘程,歡迎共同討論!
RM在移動計算領(lǐng)域的地位無可比擬,但這并不意味著ARM可以停滯不前。技術(shù)的發(fā)展永無止境,ARM從幾年前開始就保持了每年推出一個全新架構(gòu)的節(jié)奏。去年,ARM推出了極端注重能耗比的Cortex-A73核心和全新的Mali-G71 GPU。今年,ARM又帶來了Cortex-A75和全新的Cortex-A55核心,前者的高性能自然毋庸置疑,后者作為廣受歡迎的Cortex-A53的升級產(chǎn)品,將成為未來市場上最重要的移動CPU架構(gòu)。那么,這兩款全新的架構(gòu)有什么特點,ARM又為這些架構(gòu)搭配了哪些令人激動的新技術(shù)呢?今天,我們就一起來了解這些內(nèi)容。
作為一家全球企業(yè),ARM成立了三大設(shè)計團隊用于研發(fā)不同方向的產(chǎn)品:首先是美國德克薩斯的奧斯丁團隊,主要研發(fā)高性能產(chǎn)品,包括Cortex-A15、Cortex-A57、Cortex-A72;其次是英國劍橋,劍橋設(shè)計團隊推出了著名的小核心產(chǎn)品,包括Cortex-A5、Cortex-A7和Cortex-A53;最后一個地方是位于法國的歐洲科技中心索菲亞-安迪波斯利,ARM在這里研發(fā)了索菲亞家族的Cortex-A12、Cortex-A17和Cortex-A73,其產(chǎn)品特點是高性能功耗比。這次,ARM發(fā)布的兩款產(chǎn)品分別是Cortex-A75和Cortex-A55,前者主打高性能功耗比,后者主打小核心。
▲ARM推出了全新的Cortex-A75和Cortex-A55架構(gòu)
在描述全新的兩款CPU之前,我們先來談?wù)勑碌腄ynamIQ技術(shù)。首先,核心集群規(guī)模擴大、電源控制更為靈活。DynamIQ中,ARM允許處理器實現(xiàn)自由搭配,一個集群中處理器并不限制架構(gòu)和型號,每個集群中最多可以有8個內(nèi)核(bL技術(shù)最多允許4個),允許32個集群存在,內(nèi)核數(shù)量最多可達256個,未來還可以進一步擴展至上千個。之前的bL技術(shù)針對某一個特定的集群只有一種電壓、頻率控制,但是DynamIQ中一個集群內(nèi)最多可以擁有八種電壓和頻率控制(每一種被稱為一個控制域),這樣一來,不同的核心可以使用不同的電壓和頻率,也允許集群中某核心單獨關(guān)閉。
▲DynamIQ帶來了全新的集群設(shè)計方案。
其次,在集群搭配方面,在新的DynamIQ中,ARM認為雖然未來的處理器還是以八核心配置為主,但是八個核心都可以放在一個集群內(nèi),可以實現(xiàn)Cortex-A75和Cortex-A55的任意搭配組合,無論是“1+7”還是“2+6”,或者是“3+5”、“4+4”等都非常適合,且由于電源管理升級,不同控制域的核心可以實現(xiàn)不同的頻率、電壓方案,也可以單獨關(guān)閉。以“1+7”的方案為例,其中“1”是指一個高頻Cortex-A75大核心,提供最強大的單線程性能,其余七個是Cortex-A55核心,提供多線程和節(jié)能配置。這種方案相比傳統(tǒng)的八核心Cortex-A53方案,能夠提供最多2.41倍的單線程性能、1.42倍的多線程性能、同時核心面積也僅僅是傳統(tǒng)方案的1.13倍,幾乎沒有增加。反觀目前流行的“4+4”方案,單核心性能只能提升至1.95倍,核心面積卻增加至1.55倍,成本陡然增加。
為了實現(xiàn)上述功能,DynamIQ成為了一套復(fù)雜的控制體系,包括DynamIQ Shared Unit單元用于控制和管理整個處理器核心的電壓、頻率;DSU作為集群內(nèi)CPU和系統(tǒng)其余部分的通訊中心,實現(xiàn)數(shù)據(jù)傳輸控制的功能;除此之外還包含異步橋、探聽過濾期、L3緩存、Bus I/F、電源管理器、ACP(加速一致性端口)和外圍設(shè)備I/F等部件,實現(xiàn)電源管理、核心同步、處理器和外部設(shè)備之間的銜接等功能。
▲DynamIQ能夠帶來符合市場需求的核心搭配和性能表現(xiàn)。
緩存的改進也是DynamIQ亮點之一。在DynamIQ中,ARM將L1和L2緩存全部都設(shè)定為了核心專用緩存,這樣可以使得L2緩存的延遲降低50%以上,集群中的所有核心使用可選的L3緩存,容量可選1MB、2MB或者4MB。新的L3緩存為16路設(shè)計,技術(shù)上屬于偽獨占設(shè)計,不過ARM表示L3緩存完全獨立,幾乎不會出現(xiàn)在其他緩存中。另外,L3緩存可以分區(qū),這對運行固定工作負載的網(wǎng)絡(luò)或嵌入式系統(tǒng)以及類似的擁有大量確定性數(shù)據(jù)的應(yīng)用程序來說可能比較有意義,L3的分區(qū)最多可以分為4組,分區(qū)可以根據(jù)任務(wù)和內(nèi)核而設(shè)定。沒有分配的L3緩存可以用作所有處理器共享,并且分區(qū)在整個過程中都是動態(tài)的,可以根據(jù)需要由操作系統(tǒng)管理或者由管理程序創(chuàng)建、調(diào)整。
▲DynamIQ在各方面的改進,尤其是緩存方面。
除了上述內(nèi)容,為了更進一步的提高多核心效率和系統(tǒng)效能,ARM在DynamIQ中還加入了錯誤報告技術(shù),DynamIQ可以將檢測到的錯誤報告給軟件。另外,高速緩存存儲也是本次新加入的功能。這個功能允許GPU或者其他的加速器通過ACP或者AMBA 5 CHI端口將數(shù)據(jù)寫入L3緩存,甚至直接進入特定核心的L2緩存。ARM舉例說,使用TCP/IP加速網(wǎng)絡(luò)設(shè)備,可以將部分數(shù)據(jù)直接寫入CPU L2。這樣一來,數(shù)據(jù)不需要在處理器中進行多次中轉(zhuǎn),顯著提高了性能比你更降低了功耗,也降低了對緩存一致性機制的依賴。
DynamIQ從系統(tǒng)架構(gòu)層面改變了系統(tǒng)整體的運行方式,帶來了更高效的能源利用方式,能夠大幅度提高系統(tǒng)的能耗比。
之前我們在文中曾提到ARM的重點已經(jīng)從絕對的性能轉(zhuǎn)向更看重效能和性能功耗比。Cortex-A73就是這樣的產(chǎn)物。從宏觀角度來看,Cortex-A75是一款三發(fā)射的、11至13級的亂序執(zhí)行的處理器。相比之前的Cortex-A73,Cortex-A75為了進一步提高性能,解碼端從之前的雙發(fā)射提升到了三發(fā)射,同時也放大了后端資源。
▲Cortex-A75的架構(gòu)簡圖。
從架構(gòu)來看,Cortex-A75的解碼器和Cortex-A73的基本一樣,都能夠在一個周期內(nèi)解碼絕大部分指令。Cortex-A75每周期最多實現(xiàn)3條指令解碼,發(fā)射能力從之前Cortex-A73的4uops/周期提升到6uops/周期,提升幅度為50%。在整數(shù)方面,Cortex-A75的每個發(fā)布隊列可以提供2uops,ALU和AGU采用了獨占性設(shè)計來提高效率。這樣可以使用Cortex-A75在指令執(zhí)行的推測性上更有優(yōu)勢。峰值性能方面,Cortex-A75的每個管線可以提升至8uops,顯著超出前代產(chǎn)品。
另外,和Cortex-A73一樣,Cortex-A75面對一些簡單的分支uops時可以繞過重命名和調(diào)度階段,這將消除2個階段的延遲。一些復(fù)雜分支指令需要訪問寄存器,然后生成一些額外分支,包括ALU和AGU,這可以通過重命名和調(diào)度來隱藏部分額外的復(fù)雜性,從而提高效率。
▲Cortex-A75的設(shè)計目標(biāo)是瞄準高性能。
在NENO/FP部分,Cortex-A73和Cortex-A75都沒有調(diào)度階段,雖然uops仍被加入隊列,并且隊列之間也存在負載平衡,但由于處理方式存在差異,因此浮點隊列比整數(shù)隊列要長一兩個階段。在NENO/FP部分,Cortex-A75現(xiàn)在可以發(fā)送超過3uops/周期,每個隊列發(fā)送中可以“下沉”2uops。
更進一步的分析先從指令端開始。Cortex-A75依舊是一個“插槽式的微架構(gòu)”,這個架構(gòu)在之前的Cortex-A73上就已經(jīng)成功應(yīng)用,不過ARM迄今為止也沒有公布太多細節(jié),大概來說就是ARM設(shè)計了8個“Slat”(插槽)用于消除那些冗余指令對資源的消耗,降低系統(tǒng)功耗。
在預(yù)取方面,Cortex-A73和Cortex-A75都設(shè)計了一個非常簡單的指令預(yù)取器,它提供了一個64KB L1指令緩存,4路關(guān)聯(lián),使用的是實際索引的方案,這樣有助于降低延遲。在分支預(yù)測器上,之前Cortex-A73使用了一個全新的分支預(yù)測器和一個64路的micro-BTAC用于提高預(yù)測效率,還有靜態(tài)分支預(yù)測器以及包含嵌套子程序返回地址的返回堆棧。考慮到Cortex-A73的分支預(yù)測部分擁有優(yōu)秀的性能、功耗表現(xiàn),因此ARM將其完全繼承到了Cortex-A75中,只是在微循環(huán)微觀預(yù)測器等方面進行了微調(diào),可能會對IPC帶來一些改善。
▲Cortex-A75使用改進的分支預(yù)測單元。
實際上ARM一直在尋找進一步提升IPC的方法,Cortex-A75最大的改進就是從之前Cortex-A73的雙發(fā)射升級至三發(fā)射。根據(jù)ARM的數(shù)據(jù),Cortex-A73的大概IPC應(yīng)該在1.2個單位,在特定的測試中可以增加至1.6至1.8,不過部分測試也相應(yīng)的降低到0.4至0.6。一個雙發(fā)射的處理器雖然夠用,但是更大的吞吐量在當(dāng)前的環(huán)境下可能會有更好的表現(xiàn)。比如在發(fā)生一次分支預(yù)測錯誤后(一般1000次分支預(yù)測可能有2至4次預(yù)測錯誤),CPU需要盡可能快的重新填充流水線,所以這個時候就需要更大的吞吐量來加快流水線填充。當(dāng)然,從宏觀角度來看,選擇三發(fā)射還是雙發(fā)射,受到功耗、面積、性能等多重因素影響,它會產(chǎn)生其他一系列的問題,但是ARM顯然經(jīng)過了充分的權(quán)衡。
在接下來的重命名和調(diào)度階段,Cortex-A75和Cortex-A73基本類似。Cortex-A75沒有重新排序緩沖區(qū)或者架構(gòu)寄存器,它使用物理寄存器文件來存儲uop操作數(shù),這使得Cortex-A75能夠通過限制CPU周圍移動的數(shù)據(jù)量來減少功耗,并降低使用重新排序緩沖器引起的指令窗口瓶頸。另外,ARM還加強如旁路寫入、提高核心執(zhí)行次序、優(yōu)化L2緩存未命中的處理等。
在數(shù)據(jù)和緩存部分,Cortex-A75相對Cortex-A73做出了不少調(diào)整,比如L1和L2的數(shù)據(jù)預(yù)取部分重新調(diào)整,stride預(yù)取部分則為Cortex-A75做出了充足的優(yōu)化。從緩存角度來看,Cortex-A73和Cortex-A75的L1緩存變化不大,主要變化在L2部分。之前也曾提到,由于DynamIQ的存在,傳統(tǒng)上共享的L2緩存變成了核心獨占設(shè)計。根據(jù)ARM數(shù)據(jù),獨占的L2緩存相比共享的L2緩存,延遲時間大約降低了50%,比如指令提取從之前的20至25個周期降低到11個周期(在L1未命中、L2命中的情況下)。
▲Cortex-A75的緩存設(shè)計,擁有更高帶寬。
在容量方面,L2可以選擇搭配256KB或者512KB,其中,在單核心配置下512KB相比256KB能夠有2%的性能提升,四核心下最多可達4%至5%。此外,L1數(shù)據(jù)緩存和L2使用了完全獨占的設(shè)計,這樣兩者的數(shù)據(jù)不會有重復(fù),空間利用率也有了提高。總的來看,ARM在Cortex-A75上使用了獨占的L2緩存設(shè)計,大幅度降低了延遲并提高了命中率,同時也允許Cortex-A75使用比較簡單的指令預(yù)取部分來節(jié)約功耗和面積,是ARM在重新權(quán)衡后的新選擇。
▲Cortex-A75完全獨占的L2緩存設(shè)計,相比上代產(chǎn)品性能提升大約50%。
最后來看比較注重要的管線和執(zhí)行部分。Cortex-A75的ALU/INT管線和Cortex-A73的相同,兩個ALU都能執(zhí)行基本操作,比如加法和位移,不過只有一個ALU能執(zhí)行整數(shù)乘法和乘法累加,另一個則使用Radix-16分頻器執(zhí)行整數(shù)除法。這意味著Cortex-A75不能在一個周期內(nèi)完成2個整數(shù)乘法或者處罰,不過可以同時執(zhí)行一個整數(shù)乘法/除法和一個加法或者位移。在執(zhí)行效率方面,所有的執(zhí)行都可以在一個或者兩個周期內(nèi)完成,不過更復(fù)雜的操作需要額外的周期。
▲Cortex-A75的計算單元支持更多數(shù)據(jù)格式。
在浮點計算方面,Cortex-A75和Cortex-A73中的2個64位NENO/FP管線具有自己專用的重命名和128位的寄存器文件,每個SIMD管線都能夠執(zhí)行8個8位、4個16或 2個32位的整數(shù)或單精度浮點計算,或者每循環(huán)計算1個64位的整數(shù)或雙精度計算。值得一提的是,由于Cortex-A75更新到了ARMv8.2架構(gòu)版本,因此還能夠?qū)崿F(xiàn)對半精度的FP16支持。
總的來說,Cortex-A75架構(gòu)依靠三發(fā)射和內(nèi)和改進、L2緩存獨占等設(shè)計,基本上達到了ARM提高IPC、提高效能的目的,新支持的格式也大大擴大了新處理器核心的應(yīng)用范圍。并且由于DynamIQ的加入,ARM還能夠在核心效率上給予更佳的調(diào)配。可以說,Cortex-A75的加強是適時地也是非常恰當(dāng)?shù)摹?/p>
看完了Cortex-A75,我們再來看看Cortex-A75。從宏觀來看,Cortex-A55依舊是一個雙發(fā)射、順序執(zhí)行、8級流水線的CPU核心。根據(jù)ARM的資料,對Cortex-A55這個檔次的產(chǎn)品來說,8級流水線深度是最佳方案,因為從14nm/16nm到10nm再到7nm的轉(zhuǎn)換中沒有發(fā)現(xiàn)顯著的頻率改善(大多數(shù)工藝增益都會帶來面積縮小、動態(tài)漏電率降低),因此繼續(xù)選擇8級流水線是很有意義的,這也決定了Cortex-A55的頻率將和Cortex-A53類似。一般來說,較少的流水線等級會帶來較低的頻率,功耗和面積則沒有太大改善;較深的流水線則會帶來較高的頻率,不過功耗也會隨著頻率增加而提升。
▲Cortex-A55的架構(gòu)簡圖。
從Cortex-A55的架構(gòu)簡圖來看,Cortex-A55依舊使用了雙發(fā)射架構(gòu),每個周期可以解碼大多數(shù)指令。不過,Cortex-A55的變化在于轉(zhuǎn)向獨立的負載和存儲可以并行執(zhí)行的AGU,而不是Cortex-A53那樣單一組合型的AUG。另外,之前Cortex-A53已經(jīng)提供了非常不錯的吞吐能力,不過問題在于如果沒有準備好處理的指令或者數(shù)據(jù),或者錯誤的分支預(yù)測、或者高速緩存沒有命中的話,Cortex-A53的效率將會大幅度降低,內(nèi)核甚至?xí)nD。因此,保持提供指令以及數(shù)據(jù)對順序核心來說是至關(guān)重要的,這是Cortex-A55帶來了改進版本內(nèi)存子系統(tǒng)的原因之一。
指令端方面,Cortex-A55的L1指令緩存現(xiàn)在升級到了4路關(guān)聯(lián),而不是之前Cortex-A53的2路,不過依舊采用了VIPT(幾何索引、物理標(biāo)記)設(shè)計,這種設(shè)計常常用于L1緩存,因為可以顯著降低延遲。另外,Cortex-A55還擁有一個15-entry的L1 TLB,支持多個頁面大小。L1指令緩存可以選配16KB、32KB或者64KB,這一點和Cortex-A53有類似的地方。
▲Cortex-A55的L1緩存大幅度加強。
接下來是分支預(yù)測,一般來說,一個新的CPU架構(gòu)總會使用新的分支預(yù)測器,最起碼是重新調(diào)校的。Cortex-A55的新分支預(yù)測器采用基于神經(jīng)網(wǎng)絡(luò)的算法來提高預(yù)測精度,并加入了循環(huán)中止預(yù)測,避免在循環(huán)結(jié)束時產(chǎn)生錯誤。另外,Cortex-A55在主要的條件預(yù)測器之前,還加入了0周期微觀預(yù)測器、間接預(yù)測器等,用于在特殊情況下提高效能。
在數(shù)據(jù)方面,Cortex-A55使用了一個全新的數(shù)據(jù)預(yù)取器用于提供更高的帶寬,這個新的數(shù)據(jù)預(yù)取器能夠監(jiān)測更復(fù)雜的高速緩存未命中情況,并且可以直接預(yù)取L1、L2或者L3的緩存數(shù)據(jù)。ARM認為這樣的設(shè)計能夠為移動設(shè)備的UI性能產(chǎn)生正面影響。緩存方面,L1數(shù)據(jù)緩存依舊是4路關(guān)聯(lián)設(shè)計,不過目前是完全獨占的排他性設(shè)計,其中所有數(shù)據(jù)都不會在L2緩存中重復(fù)。L1數(shù)據(jù)緩存的大小可選16GB、32KB或者64KB。L1指令緩存的則有一定變化,從之前的PIPT也就是物理索引、物理標(biāo)記轉(zhuǎn)移至VIPT(虛擬索引、物理標(biāo)記),這可以在很多場景中降低緩存延遲。另外,L1數(shù)據(jù)緩存使用了16路方案,帶寬相比之前的10路方案顯著增大,并且ARM還降低了L1指針追溯周期,從之前的3周期降低至2周期,延遲進一步降低。
在二級緩存方面,Cortex-A55由于需要和DynamIQ搭配使用,因此也獲得了獨占的L2緩存,和核心同頻,這一點和之前Cortex-A75的改進是基本相同的,延遲降低了大約50%,從最多12個周期降低至6個周期。L2緩存可選0KB、64KB、128KB和256KB,ARM估計大量用戶會考慮128KB,但也有少部分應(yīng)用選擇256KB。在TLB方面,Cortex-A55的L2的TLB數(shù)量從Cortex-A53的512個增加到1024個,富余空間更充足了。另外,L2使用的是PIPT,實現(xiàn)簡單、功耗低。在帶寬方面,L2使用了4路設(shè)計,也是比較正常的方案。
▲Cortex-A55的L2緩存也改成獨占式方案。
在執(zhí)行單元部分,Cortex-A55的設(shè)計基本和Cortex-A53相同(也和Cortex-A75類似)。整數(shù)方面,Cortex-A55設(shè)計了2個可以執(zhí)行加法和位移操作的ALU,但只有其中一個能夠處理整數(shù)乘法和乘法累加,另一個則使用Radix-16分頻器執(zhí)行整數(shù)除法。在浮點計算方面,考慮到一部分用戶只需要整數(shù)計算而對浮點并無要求,因此Cortex-A55的2個64位NENO/浮點管線被設(shè)計成可選方案—這和Cortex-A75的浮點部分也基本類似,包括支持的規(guī)格和對ARMv8.2的支持等,提供了包括FP16半精度和INT8整數(shù)計算的支持。
▲Cortex-A55大幅度加強了AGU。
▲Cortex-A55的NENO/FP是可選式設(shè)計,支持ARMv8.2。
▲Cortex-A55還加入了大量新功能支持。
總的來看,Cortex-A55的改進主要在于分支預(yù)測、數(shù)據(jù)讀取和寫入(AGU)以及緩存部分,在執(zhí)行部分改進較少。這主要是考慮到Cortex-A55較小的核心面積和市場需求所致。實際上Cortex-A53的規(guī)格設(shè)計已經(jīng)非常優(yōu)秀,Cortex-A55只需要簡單加強即可。
按照慣例,在每次新架構(gòu)發(fā)布后,ARM都會給出一些性能預(yù)覽,在Cortex-A75和Cortex-A55發(fā)布后也不例外,下面我們一起來看看吧。
首先來看Cortex-A75和Cortex-A73。由于微架構(gòu)存在顯著差異,比如三發(fā)射和雙發(fā)射差異,因此Cortex-A75在大量指標(biāo)上遠勝Cortex-A73是理所應(yīng)當(dāng)?shù)摹8鶕?jù)ARM的數(shù)據(jù),Cortex-A75相比Cortex-A73,大約帶來了22%的整數(shù)性能提升,33%浮點性能提升、16%的內(nèi)存性能提升、48%的渲染性能提升、34%的GeekBench綜合性能提升等,基本上可以看做全面勝出。
▲Cortex-A75對比不同核心的性能情況。
除了單純的性能外,ARM也給出了在不同功耗配比下Cortex-A73和Cortex-A75的性能情況。在750mW的情況下,Cortex-A75比Cortex-A73性能高大約20%;1W的時候大概高出25%;2W時高出30%。這些數(shù)據(jù)表明,Cortex-A75的性能和功耗相關(guān)性很高,在更高功耗和頻率下能夠獲得更為突出的性能增長。此外,橫向?qū)Ρ炔煌瞥痰漠a(chǎn)品來看,ARM認為10nm工藝下Cortex-A75可以運行在3GHz上,此時的性能大概是20nm、2.1GH的A57處理器的2.5倍。
▲ARM給出的Cortex-A75對比Cortex-A73性能情況。
▲Cortex-A75對比Cortex-A73在相同功耗情況下的性能。
再看看Cortex-A55的性能表現(xiàn)。Cortex-A55由于大幅度改善的內(nèi)存性能,因此雖然執(zhí)行部分變動不大,但是性能也得到了顯著提升,這也恰好說明ARM所說的Cortex-A53的瓶頸在內(nèi)存部分的判定是正確的。ARM宣稱Cortex-A55的內(nèi)存性能相比Cortex-A53提高了1倍,因此帶來了整數(shù)18%、浮點38%、渲染14%、綜合21%的性能增加。當(dāng)然,帶來如此高幅度的性能增加,功耗一點不增加是不可能的,相比之下Cortex-A55的功耗比Cortex-A53提高了3%,考慮其性能增加,整體能耗比反而再度提升了15%。要知道之前Cortex-A53以及基本做到了性能功耗比的極致,這次再次提升15%殊為不易。
▲Cortex-A55對比Cortex-A53的性能情況
▲Cortex-A55的功耗略有上升,但性能功耗比同樣大幅度提升15%。
通過本文對這兩個新核心的介紹,相信大家已經(jīng)對其基本架構(gòu)和性能有了一定的了解。從產(chǎn)品角度來看,Cortex-A75和Cortex-A55是ARM在10nm時代的最重要布局,其高性能、高性能功耗比和齊全的特性支持,能夠讓ARM在移動計算的各個市場都有所斬獲。
▲ARM將通過不斷推出全新架構(gòu)和技術(shù),在即將到來的AI時代搶占先機。
從ARM規(guī)劃產(chǎn)品的角度來看,索菲亞家族在10nm時代將成為移動計算的核心產(chǎn)品,Cortex-A75將取代目前奧斯丁家族的Cortex-A72。由于考慮到移動性能功耗比等原因,ARM在Cortex-A75和Cortex-A55上刪除了部分特性,而這些特性應(yīng)該都會在未來奧斯丁家族的處理器上加入,并競爭諸如車載、關(guān)鍵安全設(shè)備等市場。當(dāng)然,在7nm時代,奧斯丁家族產(chǎn)品的回歸,也會進一步提高移動計算設(shè)備的性能,這一點毋庸置疑。
至于具體的產(chǎn)品,估計在架構(gòu)研發(fā)時,諸如華為、三星、高通等廠商就已經(jīng)開始深入介入并提出自己的需求,發(fā)布會后最快在2018年第一季度甚至本年度第四季度,就將有廠商推出使用Cortex-A75和Cortex-A55架構(gòu)以及DynamIQ的產(chǎn)品,實際應(yīng)用到手機上應(yīng)該不會晚于明年第二季度。屆時,大家就可以看到全新GPU和全新CPU架構(gòu)的新一代SoC將會爆發(fā)出怎樣的能量。