望本文可以帶給大家一個(gè)相對(duì)全局的視角看待卡頓問題,認(rèn)識(shí)到卡頓是什么、卡頓的成因、卡頓的分類、卡頓的優(yōu)化和一些經(jīng)驗(yàn)積累,有的放矢地解決 App 流暢性問題。接下來會(huì)從以下五個(gè)方面進(jìn)行講述:
?什么是卡頓
?為什么會(huì)發(fā)生卡頓
?如何評(píng)價(jià)卡頓
?如何優(yōu)化卡頓
?加入我們
卡頓,顧名思義就是用戶體感界面不流暢。我們知道手機(jī)的屏幕畫面是按照一定頻率來刷新的,理論上講,24 幀的畫面更新就能讓人眼感覺是連貫的。但是實(shí)際上,這個(gè)只是針對(duì)普通的視頻而言。對(duì)于一些強(qiáng)交互或者較為敏感的場(chǎng)景來說,比如游戲,起碼需要 60 幀,30 幀的游戲會(huì)讓人感覺不適;位移或者大幅度動(dòng)畫 30 幀會(huì)有明顯頓挫感;跟手動(dòng)畫如果能到 90 幀甚至 120 幀,會(huì)讓人感覺十分細(xì)膩,這也是近來廠商主打高刷牌的原因。
對(duì)于用戶來說,從體感角度大致可以將卡頓分為以下幾類:
這些體驗(yàn)對(duì)于用戶可以說是非常糟糕的,甚至?xí)鸶泄俚臒┰辏M(jìn)而導(dǎo)致用戶不愿意繼續(xù)停留在我們的 App。可以說,流暢的體驗(yàn)對(duì)于用戶來說至關(guān)重要。
用戶體感的卡頓問題原因很多,且常常是一個(gè)復(fù)合型的問題,為了聚焦,這里暫只考慮真正意義上的掉幀卡頓。
我們通常會(huì)說,屏幕的刷新率是 60 幀,需要在 16ms 內(nèi)做完所有的操作才不會(huì)造成卡頓。但是這里需要明確幾個(gè)基本問題:
這里先回答第一個(gè)問題:為什么是 16ms。早期的 Android 是沒有 vsync 機(jī)制的,CPU 和 GPU 的配合也比較混亂,這也造成著名的 tearing 問題,即 CPU/GPU 直接更新正在顯示的屏幕 buffer 造成畫面撕裂。后續(xù) Android 引入了雙緩沖機(jī)制,但是 buffer 的切換也需要一個(gè)比較合適的時(shí)機(jī),也就是屏幕掃描完上一幀后的時(shí)機(jī),這也就是引入 vsync 的原因。
早先一般的屏幕刷新率是 60fps,所以每個(gè) vsync 信號(hào)的間隔也是 16ms,不過隨著技術(shù)的更迭以及廠商對(duì)于流暢性的追求,越來越多 90fps 和 120fps 的手機(jī)面世,相對(duì)應(yīng)的間隔也就變成了 11ms 和 8ms。
那既然有了 VSYNC,誰(shuí)在消費(fèi) VSYNC?其實(shí) Android 的 VSYNC 消費(fèi)者有兩個(gè),也就對(duì)應(yīng)兩類 VSYNC 信號(hào),分別是 VSYNC-app 和 VSYNC-sf,所對(duì)應(yīng)的也是上層 view 繪制和 surfaceFlinger 的合成,具體的我們接下來詳細(xì)說。
這里還有一些比較有意思的點(diǎn),有些廠商會(huì)有 vsync offset 的設(shè)計(jì),App 和 sf 的 vsync 信號(hào)之間是有偏移量的,這也在一定程度上使得 App 和 sf 的協(xié)同效應(yīng)更好。
在講下一 part 之前先引入一個(gè)話題:
一個(gè) view 究竟是如何顯示在屏幕上的?
我們一般都比較了解 view 渲染的三大流程,但是 view 的渲染遠(yuǎn)不止于此:
此處以一個(gè)通用的硬件加速流程來表征
Google 將這個(gè)過程劃分為:其他時(shí)間/VSync 延遲、輸入處理、動(dòng)畫、測(cè)量/布局、繪制、同步和上傳、命令問題、交換緩沖區(qū)。也就是我們常用的 GPU 嚴(yán)格模式,其實(shí)道理是一樣的。到這里,我們也就回答出來了第二個(gè)問題:16ms 內(nèi)都需要完成什么?
準(zhǔn)確地說,這里仍可以進(jìn)一步細(xì)化:16ms 內(nèi)完成 APP 側(cè)數(shù)據(jù)的生產(chǎn);16ms 內(nèi)完成 sf layer 的合成
View 的視覺效果正是通過這一整條復(fù)雜的鏈路一步步展示出來的,有了這個(gè)前提,那就可以得出一個(gè)結(jié)論:上述任意鏈路發(fā)生卡頓,均會(huì)造成卡頓。
我們?cè)倩氐?Vsync 的話題,消費(fèi) Vsync 的雙方分別是 App 和 sf,其中 App 代表的是生產(chǎn)者,sf 代表的是消費(fèi)者,兩者交付的中間產(chǎn)物則是 surface buffer。
再具體一點(diǎn),生產(chǎn)者大致可以分為兩類,一類是以 window 為代表的頁(yè)面,也就是我們平時(shí)所看到的 view 樹這一套;另一類是以視頻流為代表的可以直接和 surface 完成數(shù)據(jù)交換的來源,比如相機(jī)預(yù)覽等。
對(duì)于一般的生產(chǎn)者和消費(fèi)者模式,我們知道會(huì)存在相互阻塞的問題。比如生產(chǎn)者速度快但是消費(fèi)者速度慢,亦或是生產(chǎn)者速度慢消費(fèi)者速度快,都會(huì)導(dǎo)致整體速度慢且造成資源浪費(fèi)。所以 Vsync 的協(xié)同以及雙緩沖甚至三緩沖的作用就體現(xiàn)出來了。
思考一個(gè)問題:是否緩沖的個(gè)數(shù)越多越好?過多的緩沖會(huì)造成什么問題?
答案是會(huì)造成另一個(gè)嚴(yán)重的問題:lag,響應(yīng)延遲
這里結(jié)合 view 的一生,我們可以把兩個(gè)流程合在一起,讓我們的視角再高一層:
這里我們來回答第三個(gè)問題,從系統(tǒng)的渲染架構(gòu)上來說,機(jī)制上的保護(hù)主要有幾方面:
這些機(jī)制上的保護(hù)在系統(tǒng)層面最大程度地保障了 App 體驗(yàn)的流暢性,但是并不能幫我們徹底解決卡頓。為了提供更加流暢的體驗(yàn),一方面,我們可以加強(qiáng)系統(tǒng)的機(jī)制保護(hù),比如 FWatchDog;另一方面,需要我們從 App 的角度入手,治理應(yīng)用內(nèi)的卡頓問題。
經(jīng)過上面的討論,我們得出一個(gè)卡頓分析的核心理論支撐:渲染機(jī)制中的任何流轉(zhuǎn)過程發(fā)生異常,均會(huì)造成卡頓。
那么接下來,我們逐個(gè)分析,看看都會(huì)有哪些原因可能造成卡頓。
除了上述的渲染流程引起的卡頓,還有一些其他的因素,典型的就是視頻流。
2.5.3 系統(tǒng)負(fù)載
我們此處再整體整理并歸類,為了更完備一些,這里將推流也放了上來。在一定程度上,我們遇到的所有卡頓問題,均能在這里找到理論依據(jù),這也是指導(dǎo)我們優(yōu)化卡頓問題的理論支撐。
指標(biāo) | 釋義 | 計(jì)算方式 | 數(shù)據(jù)來源 |
FPS | 幀率 | 取 vsync 到來的時(shí)間為起點(diǎn),doFrame 執(zhí)行完成的事件為終點(diǎn),作為每幀的渲染耗時(shí),同時(shí)利用渲染耗時(shí)/刷新率可以得出每次渲染的丟幀數(shù)。平均 FPS=一段時(shí)間內(nèi)渲染幀的個(gè)數(shù) * 60 / (渲染幀個(gè)數(shù) + 丟幀個(gè)數(shù)) | vsync |
stall_video_ui_rate | 總卡頓率 | (UI 卡頓時(shí)長(zhǎng) + 流卡頓時(shí)長(zhǎng)) / 采集時(shí)長(zhǎng) | vsync |
stall_ui_rate | UI 卡頓率 | 【> 3 幀】UI 卡頓時(shí)長(zhǎng) / 采集時(shí)長(zhǎng) | vsync |
stall_video_rate | 流卡頓率 | 流卡頓時(shí)長(zhǎng) / 采集時(shí)長(zhǎng) | vsync |
stall_ui_slight_rate | 輕微卡頓率 | 【3 - 6】幀丟幀時(shí)長(zhǎng) / 采集時(shí)長(zhǎng) | vsync |
stall_ui_moderate_rate | 中等卡頓率 | 【7 - 13】幀丟幀時(shí)長(zhǎng) / 采集時(shí)長(zhǎng) | vsync |
stall_ui_serious_rate | 嚴(yán)重卡頓率 | 【> 14】幀丟幀時(shí)長(zhǎng) / 采集時(shí)長(zhǎng) | vsync |
Diggo 是字節(jié)自研的一個(gè)開放的開發(fā)調(diào)試工具平臺(tái),是一個(gè)集「評(píng)價(jià)、分析、調(diào)試」為一體的,一站式工具平臺(tái)。內(nèi)置性能測(cè)評(píng)、界面分析、卡頓分析、內(nèi)存分析、崩潰分析、即時(shí)調(diào)試等基礎(chǔ)分析能力,可為產(chǎn)品開發(fā)階段提供強(qiáng)大助力。
指標(biāo) | 釋義 | 計(jì)算方式 | 數(shù)據(jù)來源 |
FPS | 時(shí)機(jī)渲染幀率 | 數(shù)據(jù)獲取時(shí)間周期內(nèi),實(shí)際渲染幀數(shù)/ 數(shù)據(jù)獲取間隔時(shí)間 | SF & GFXInfo |
RFPS | 相對(duì)幀率 | 數(shù)據(jù)獲取時(shí)間周期內(nèi),(理論滿幀-實(shí)際掉幀數(shù))/ 數(shù)據(jù)獲取間隔時(shí)間 | GFXInfo |
Stutter | 卡頓率 | 卡頓比。當(dāng)發(fā)生 jank 的幀的累計(jì)時(shí)長(zhǎng)與區(qū)間時(shí)長(zhǎng)的比值。 | SF |
Janky Count | 普通卡頓次數(shù) | 單幀繪制耗時(shí)大于 MOVIE_FRAME_TIME 時(shí),計(jì)一次 janky。 | SF |
Big Janky Count | 嚴(yán)重卡頓次數(shù) | 單幀繪制耗時(shí)大于 3*MOVIE_FRAME_TIME 時(shí),計(jì)一次 big janky。 | SF |
名稱 | 釋義 |
正式包慢函數(shù) | 相對(duì)于灰度包,過濾了比較多監(jiān)控,對(duì)性能損耗比較小,但是需要手動(dòng)打開,單點(diǎn)反饋中不能保留反饋現(xiàn)場(chǎng) |
灰度包慢函數(shù) | 灰度上全量打開,針對(duì)版本間的數(shù)據(jù)對(duì)比和新增卡頓問題解決比較有效 |
ANR | ANR 的及時(shí)響應(yīng)和處理 |
工具名 | 備注 |
Systrace | 暫不贅述 |
perfetto | 加強(qiáng)版 systrace,可定制,可以參考官方文檔 |
Rhea | 最常用也是最好用的工具,方便發(fā)現(xiàn)下下問題和歸因,和 perfetto 一起使用絕配,感興趣的同學(xué)可以移步 github 搜索 btrace |
profiler | Androidstudio 自帶工具,比較方便,但是數(shù)據(jù)準(zhǔn)確度不高 |
sf / gfxinfo | 主要用于腳本和工具 |
這里主要針對(duì) UI 卡頓和 UI/流相互影響打來的卡頓。
對(duì)于 UI 卡頓來說,我們手握卡頓優(yōu)化的 8 板大斧子,所向披靡:
總體思路就是「能不干就不干、能少干就少干、能早點(diǎn)干就早點(diǎn)兒干、能晚點(diǎn)兒干就晚點(diǎn)兒干、能讓別人干就讓別人干、能干完一次當(dāng) 10 次就只干一次,實(shí)在不行,再考慮自己大干一場(chǎng)」。
這里例舉出一些常見的優(yōu)化思路,注意這一定也不可能是全部,如果有其他好的優(yōu)化思路,我們可以一起交流。
直播對(duì)于 SurfaceView 的切換是一個(gè)長(zhǎng)期的專項(xiàng),分為多期逐步將 SurfaceView 在直播全量落地,場(chǎng)景覆蓋秀場(chǎng)直播、聊天室、游戲直播、電商直播、媒體直播等,業(yè)務(wù)上對(duì)于滲透率和停留時(shí)長(zhǎng)有比較顯著的收益,同時(shí)功耗的收益也很可觀。
這里是一個(gè)權(quán)衡的問題,SurfaceView 的兼容性問題 pk 帶來的收益是否能打平,一般來說,越是復(fù)雜的業(yè)務(wù)場(chǎng)景,收益約大。
FWatchDog 是基于對(duì) MessageQueue 的調(diào)度策略和同步屏障原理,以均幀耗時(shí)為閾值判定丟幀后主動(dòng)在 MessageQueue 中插入同步屏障,保證渲染異步 message 和 doframe 的優(yōu)先執(zhí)行,達(dá)到一種渲染插幀的效果,同時(shí)具備 ANR 自動(dòng)恢復(fù)同步屏障的能力,保障打散的有效。
所以 FWatchDog 和打散是好的搭檔,能產(chǎn)生 1+1 大于 2 的效果。
一個(gè)典型的應(yīng)用場(chǎng)景就是滑動(dòng)場(chǎng)景的 GC 抑制,能夠顯著提高用戶上下滑的使用體驗(yàn)。這個(gè)場(chǎng)景相信每個(gè)業(yè)務(wù)都會(huì)存在,特別是存在大量遍歷的邏輯,優(yōu)化效果明顯。
一些老的框架、無(wú)用的邏輯以及存在性不高的代碼都可以下線,這里基本業(yè)務(wù)強(qiáng)相關(guān),就不舉具體的例子了。
首先是打散,直播做了很多 task 的拆分以及打散,第一可以減輕當(dāng)前渲染幀的耗時(shí)壓力,第二可以和 FWatchDog 結(jié)合達(dá)到插幀的效果。這里其實(shí)還可以控制 task 的執(zhí)行優(yōu)先級(jí),包括隊(duì)列的插隊(duì)等,總之 MessageQueue 的合理調(diào)度是很有必要的。
異步的使用也相對(duì)比較多,一個(gè)埋點(diǎn)日志的框架,以及一些 inflate 的加載等,都可以使用異步來解決卡頓問題。
直播提供了一個(gè)預(yù)熱框架,可以讓直播內(nèi)部的一次性成本邏輯得到在宿主側(cè)執(zhí)行的機(jī)會(huì),同時(shí)提供完備的隊(duì)列優(yōu)先級(jí)管理、同步異步管理和 task 生命周期管理,降低直播內(nèi)部首次加載的卡頓問題。
拉高硬件的運(yùn)行性能,比如 CPU 頻率、GPU 頻率、線程綁大核以及網(wǎng)絡(luò)相關(guān)的調(diào)優(yōu),從底層提高 App 的運(yùn)行體驗(yàn)。
直播客戶端技術(shù)團(tuán)隊(duì)是一個(gè)集體驗(yàn)優(yōu)化、平臺(tái)建設(shè)、跨端、端智能、穩(wěn)定性為一體的綜合性團(tuán)隊(duì),團(tuán)隊(duì)氛圍 nice,技術(shù)成長(zhǎng)快,有充足的自由度發(fā)揮自己的特長(zhǎng),為億級(jí) DAU 產(chǎn)品保駕護(hù)航,也面臨更加豐富多樣的挑戰(zhàn),每一行代碼都會(huì)讓數(shù)億的用戶體驗(yàn)變得更好!現(xiàn)誠(chéng)邀各位英才加入,對(duì)這些方向感興趣的同學(xué)都可以來聊一聊,內(nèi)推鏈接:「鏈接」
什么會(huì)卡?
之前發(fā)過這個(gè)視頻,總有人在評(píng)論區(qū)或者發(fā)私信問我為什么卡?為什么卡?我不知道你套用了什么軟件,不知道你里面怎么設(shè)置的,甚至有的朋友是邊玩游戲邊直播的,又不知道你玩的什么游戲。本身有的游戲?qū)﹄娔X的配置要求就很高,只能怎么樣來分析?
·首先打開任務(wù)管理器,直播的時(shí)候來看CPU跑到了多少。如果CPU到了八十幾、九十幾甚至有的到了100,肯定100%就卡了,到了100CPU都跑到100了能不卡嗎?
·點(diǎn)開任務(wù)管理器去看一下自己的CPU,檢查一下自己的網(wǎng)絡(luò),這個(gè)地方檢查下網(wǎng)絡(luò)上行是多少,一般90%就是電腦跟網(wǎng)絡(luò)的問題。
·如果CPU跑得很高了怎么來處理?首先來看一下套用了一些什么軟件,比如現(xiàn)在套用了YY,把YY點(diǎn)出來,然后把這個(gè)放一邊,看CPU的變化,CPU現(xiàn)在是七十幾,就檢查設(shè)置的這些軟件設(shè)置的幀率是多少,把它變成30。
·再來看一下,這個(gè)先不管,現(xiàn)在是不是就降下來了一點(diǎn)了?比如現(xiàn)在又套用了OBS,OBS現(xiàn)在停止,然后來設(shè)置一下輸出設(shè)置的碼率是多少,分辨率是多少。比如現(xiàn)在把它改成正常的抖音1080,再來看一下,確認(rèn),這里啟動(dòng)是不是又下來了一點(diǎn)?
·直播伴侶再來看一下,現(xiàn)在看一下攝像頭,誰(shuí)知道是多少?60幀,給它改成30幀。
做實(shí)驗(yàn)的目的是什么?就是要告訴你們,首先去看電腦配置,電腦配置套用了什么軟件,CPU跑到多少了,然后去看一下自己設(shè)置的東西。比如現(xiàn)在是不是下來了40多了、50多了,開始都是多少,還不行,把這些都設(shè)低一點(diǎn),這個(gè)變成30,高級(jí)這里選個(gè)低檔位,中檔位,現(xiàn)在是不是又下來了一些?
所以這些東西不看電腦配置,不看是怎么設(shè)置的,不看套用了什么軟件,問我為什么卡?為什么卡?我不是神仙,不知道,以后不要來問我,評(píng)論區(qū)也好,私信也好,尤其是那些玩游戲的就不要來問我為什么卡,不知道玩的什么游戲,不知道電腦配置,不要來問我。
播間設(shè)置設(shè)置,直播卡頓是什么原因?
在直播的時(shí)候,如果直播畫面出現(xiàn)延遲怎么辦?首先要去檢查電腦的配置,如果電腦配置太低的話,就會(huì)出現(xiàn)掉幀、卡頓以及音畫不同步的情況。那如何知道是不是電腦的問題?很簡(jiǎn)單,去直播伴侶下方找到實(shí)時(shí)幀率顯示,如果說低于正常選擇的一個(gè)幀率,就是你的電腦配置不行。
其次就是網(wǎng)絡(luò)寬帶速度不夠,那在直播伴侶中點(diǎn)擊網(wǎng)絡(luò)測(cè)速,看一下它的上行速度是不是大于50。如果說上行速度大于50,那直播網(wǎng)絡(luò)是完全沒有問題的。為什么是上行寬帶?是因?yàn)橹挥猩闲袑拵В前褦?shù)據(jù)從本地推到一個(gè)服務(wù)器上云服務(wù)器,如果說上行寬帶不行,那么就會(huì)造成直播卡頓、掉幀以及說延遲。
這個(gè)時(shí)候就要去聯(lián)系寬帶運(yùn)營(yíng)商,去升級(jí)上行寬帶。大家這個(gè)時(shí)候要注意,不是下載速度,是上行寬帶。大家記住了嗎?