“微信產品經理進階之路---推薦算法”
“ 睡覺之前放松會吧,刷會抖音”
不知不覺,就到了深夜一點
抖音的精準推薦算法,令我們忍不住不停的刷
那抖音如何了解你的興趣并做到精準推送?
“物以類聚、人以群分”,其實就是最簡單的答案
本文基于《推薦系統實踐》這本書,主要從用戶行為數據角度出發,用最通俗語言講解背后的推薦邏輯
01
—
基于用戶的協同推薦
“ 你有沒有什么好看的電影推薦呀?”
“《寄生蟲》口碑很好,我強烈推薦!”
這其實就是「基于用戶的協同推薦」,我認為我倆喜好相似,所以你推薦我的電影我也會喜歡。
那引申到抖音中,就是通過用戶對不同視頻的行為,來計算用戶之間的相似性,然后基于用戶之間的相似性做出推薦。
一句話概括就是:給用戶推薦,和他相似用戶喜歡的內容
所以這就包括兩個核心問題:
(1)如何確定一個用戶是否與你有相似的品味?
(2)如何將相似人群的喜好組織成一個集合?
在這里我們暫且繞開數學公式解釋,用一個通俗的方式
你在抖音里的顯著性行為,都會被日志記錄下來,比如觀看視頻的ID、打開抖音頻次、停留時長等等。
這一系列數據,會演變成你在抖音平臺的專屬畫像。那么只需計算你的畫像數據,便可以了解你這個人,對你推薦內容。
舉個簡單例子,如下圖
將每個用戶的偏好內容作為一個向量,也就是我們的表格「行數據」。行數據的重合度越高,用戶之間的偏好相似性程度也越大。
可以看出用戶“甲”和“丁”的行數據重合度最高,那么他倆也就最相似度。丁沒看過甲喜歡的“視頻D”,那么就可以將“視頻D”推薦給丁!
這也就解釋了為什么 “你在抖音上刷的越多,推薦的就越精準”
因為這樣你在抖音里的畫像標簽,就會被描述的更豐富抖音推薦算法邏輯,可以更精準得匹配到和你相似的人群。
02
—
基于物的協同推薦
我很喜歡《當幸福來敲門》,看完之后還想再看和它相似的電影,豆瓣底部就推薦了「喜歡這部電影的人也喜歡·····」的系列電影。
這也就是我們所說的「基于物的協同推薦」
基于物的推薦,從字面意思理解就是利用物品的內容屬性計算物品之間的相似度。
但其實并不是,主要通過分析用戶的行為數據而計算視頻之間的相似度。如果喜歡物品A的用戶大都也喜歡視頻B,則視頻A和視頻B具有很大的相似度。
依然用前文的例子,前文從表格行維度分析,這次要從列維度展開,如下圖
將每個物品的所有偏好用戶作為一個向量,也就是我們的表格「列數據」。同樣,表格列數據的重合度越高,物品之間的就越相似。
可以看出偏愛“視頻A”和“視頻D”的用戶重合度最高,那么視頻A和D也就最相似。因為用戶丁喜歡視頻A,那么就可以將“視頻D”推薦給丁!
大家在這也就理解了,為什么我們在買完手機之后抖音推薦算法邏輯,京東就可以立即推送手機殼的購買鏈接。
大家若是有興趣,可以去了解下從數學角度怎么計算人與人,物與物之間的相似性大小,并不是很難也很好理解。