欧美vvv,亚洲第一成人在线,亚洲成人欧美日韩在线观看,日本猛少妇猛色XXXXX猛叫

新聞資訊

    作者:**習(xí)作品編號(hào):02基于算法的電影推薦系摘要:商業(yè)網(wǎng)站迅猛發(fā)展的時(shí)代已經(jīng)到來(lái),網(wǎng)上服務(wù)的交易方式正在改變著傳統(tǒng)的商業(yè)模式。如果說(shuō)過(guò)去的十年是搜索技術(shù)高速發(fā)展的十年,那么個(gè)性化推薦技術(shù)將作為下一個(gè)十年中最為重要的革新之一。目前幾乎所有大型的商業(yè)網(wǎng)站,如亞馬遜、淘寶網(wǎng)等,都不同程度地使用了各種形式的推薦系統(tǒng)。本文就推薦系統(tǒng)這一話題展開(kāi)討論,首先介紹了推薦系統(tǒng)的提出和發(fā)展過(guò)程,然后列舉出了幾種推薦系統(tǒng)的研究方法,其中,詳細(xì)的描述了算法推薦系統(tǒng)的實(shí)現(xiàn)過(guò)程以及用算法編寫(xiě)程序完成了電影推薦系統(tǒng)。最后列舉了幾個(gè)推薦系統(tǒng)的實(shí)例。關(guān)鍵字:算法推薦系統(tǒng)數(shù)據(jù)挖掘個(gè)性化推薦發(fā)展背景:隨著的日益普及,商業(yè)網(wǎng)站的蓬勃發(fā)展,如何提高商業(yè)網(wǎng)站的有效性,尤其是如何運(yùn)用個(gè)性化推薦技術(shù)提供個(gè)性化服務(wù)來(lái)實(shí)現(xiàn)已逐漸成為一個(gè)能引起廣泛興趣的熱點(diǎn)課題。雖然商業(yè)網(wǎng)站從“以站點(diǎn)為中心”向“以用戶為中心”發(fā)展成為必然趨勢(shì)。但目前國(guó)內(nèi)大多數(shù)商業(yè)網(wǎng)站的商品推薦通常是:推薦熱銷(xiāo)產(chǎn)品;推薦相關(guān)產(chǎn)品;依據(jù)用戶瀏覽歷史的信息進(jìn)行推薦。

    推薦系統(tǒng)是否屬于數(shù)據(jù)挖掘_大數(shù)據(jù)圖書(shū)推薦系統(tǒng)_大數(shù)據(jù)與數(shù)據(jù)挖掘

    由教授在2005年提出的一個(gè)Item-Based(基于條目)推薦算法,可應(yīng)用于各類(lèi)以網(wǎng)上商品銷(xiāo)售為主業(yè)務(wù)的網(wǎng)上商店,以及提供文章、新聞、音樂(lè)、電影等“無(wú)形”的產(chǎn)品的網(wǎng)絡(luò)站點(diǎn)。用于幫助商店經(jīng)營(yíng)者,網(wǎng)絡(luò)站點(diǎn)從事產(chǎn)品的個(gè)性化推薦,提高營(yíng)銷(xiāo)及服務(wù)質(zhì)量,更好地挖掘潛在客戶及客戶的使用、購(gòu)買(mǎi)潛能。同時(shí)也根據(jù)用戶的喜好,網(wǎng)站會(huì)留下記錄,當(dāng)用戶再次訪問(wèn)時(shí),網(wǎng)站會(huì)推薦用戶可能喜歡的東西,這樣也方便了用戶,用戶無(wú)需浪費(fèi)時(shí)間去搜索大量的信息。基于內(nèi)容的推薦:基于內(nèi)容的推薦(-)是指根據(jù)用戶選擇的對(duì)象,推薦其他類(lèi)似屬性的對(duì)象作為推薦,屬于劃分中的Item-方法.這類(lèi)算法源于一般的信息檢索方法.不需要依據(jù)用戶對(duì)對(duì)象的評(píng)價(jià)意見(jiàn).對(duì)象使用通過(guò)特征提取方法得到的對(duì)象內(nèi)容特征來(lái)表示,系統(tǒng)基于用戶所評(píng)價(jià)對(duì)象的特征,學(xué)習(xí)用戶的興趣,從而考察用戶資料與待預(yù)測(cè)項(xiàng)目相匹配的程度.對(duì)象內(nèi)容特征((s))的選取在目前的研究中以對(duì)象的文字描述為主,比如信息檢索中最經(jīng)典的文本特征是詞頻-倒排文檔頻率(-ency,簡(jiǎn)稱TF-IDF).另一方面,用戶的資料模型(c)取決于所用機(jī)器學(xué)習(xí)方法,常用的有決策樹(shù)、貝葉斯分類(lèi)算法、神經(jīng)網(wǎng)絡(luò)、基于向量的表示方法等,數(shù)據(jù)挖掘領(lǐng)域的眾多算法都可以應(yīng)用.協(xié)同過(guò)濾推薦協(xié)同過(guò)濾推薦()技術(shù)是推薦系統(tǒng)中最為成功的技術(shù)之一,它于20世紀(jì)90年代開(kāi)始研究并促進(jìn)了整個(gè)推薦系統(tǒng)研究的繁榮.大量論文和研究都屬于這個(gè)類(lèi)別.協(xié)同過(guò)濾的基本思想是:找到與當(dāng)前用戶ccur相似(比如興趣和口味相似的其他用戶cj,計(jì)算對(duì)象s對(duì)于用戶的效用值u(cj,s),利用效用值對(duì)所有行排序或者加權(quán)等操作,找到最適合ccur的對(duì)象s*.其基本思想非常易于理解,在日常生活中,我們往往會(huì)利用好朋友的推薦來(lái)進(jìn)行一些選擇.協(xié)同過(guò)濾正是把這一思想運(yùn)用到推薦系統(tǒng)中來(lái),即基于其他用戶對(duì)某一內(nèi)容的評(píng)價(jià)向目標(biāo)用戶進(jìn)行推薦.基于協(xié)同過(guò)濾的推薦系統(tǒng)可以說(shuō)是從用戶的角度進(jìn)行推薦的,并且是自動(dòng)的,也就是說(shuō),用戶所獲得的推薦是系統(tǒng)從用戶購(gòu)買(mǎi)或?yàn)g覽等行為中隱式獲得的,不需要用戶主動(dòng)去查找適合自己興趣的推薦信息,如填寫(xiě)一些調(diào)查表格等.其另外一個(gè)優(yōu)點(diǎn)是對(duì)推薦對(duì)象沒(méi)有特殊的要求(而基于內(nèi)容的推薦需要對(duì)推薦對(duì)象進(jìn)行特征分析),能夠處理非結(jié)構(gòu)化的復(fù)雜對(duì)象,如音樂(lè)、電影等.同時(shí),研究用戶之間的關(guān)系需要大量的用戶訪問(wèn)行為的歷史數(shù)據(jù),與社會(huì)網(wǎng)絡(luò)研究有交叉點(diǎn),有豐富的研究基礎(chǔ)和廣闊的前景.對(duì)協(xié)同過(guò)濾最早的研究有,后來(lái)的研究成果包括,,Ringo,,]等.總體而言,此類(lèi)推薦算法可以分為兩類(lèi):啟發(fā)式(--based)方法和基于模型(model-based)的方法。

    大數(shù)據(jù)與數(shù)據(jù)挖掘_推薦系統(tǒng)是否屬于數(shù)據(jù)挖掘_大數(shù)據(jù)圖書(shū)推薦系統(tǒng)

    基于知識(shí)的推薦:基于知識(shí)的推薦(-)在某種程度上可以看成是一種推理()技術(shù).它不是建立在用戶需要和偏好基礎(chǔ)上推薦的,而是利用針對(duì)特定領(lǐng)域制定規(guī)則(rule)來(lái)進(jìn)行基于規(guī)則和實(shí)例的推理(case-).例如,文獻(xiàn)[34]中利用飯店的菜式方面的效用知識(shí),推薦飯店給顧客.效用知識(shí)()是一種關(guān)于一個(gè)對(duì)象如何滿足某一特定用戶的知識(shí),因而能夠解釋需求和推薦的關(guān)系,用于推薦系統(tǒng).效用知識(shí)在推薦系統(tǒng)中必須以機(jī)器可讀的方式存在(本體知識(shí)庫(kù)),例如ems使用關(guān)于學(xué)術(shù)論文主題的本體知識(shí)庫(kù)向讀者作推薦.算法推薦:是一系列應(yīng)用于協(xié)同過(guò)濾的算法的統(tǒng)稱。由年發(fā)表的論文中提出。有爭(zhēng)議的是,該算法堪稱基于項(xiàng)目評(píng)價(jià)的non-協(xié)同過(guò)濾算法最簡(jiǎn)潔的形式。該系列算法的簡(jiǎn)潔特性使它們的實(shí)現(xiàn)簡(jiǎn)單而高效,而且其精確度與其它復(fù)雜費(fèi)時(shí)的算法相比也不相上下。

    大數(shù)據(jù)與數(shù)據(jù)挖掘_大數(shù)據(jù)圖書(shū)推薦系統(tǒng)_推薦系統(tǒng)是否屬于數(shù)據(jù)挖掘

    該系列算法也被用來(lái)改進(jìn)其它算法。當(dāng)可以對(duì)一些項(xiàng)目評(píng)分的時(shí)候,比如人們可以對(duì)一些東西給出1價(jià)的時(shí)候,協(xié)同過(guò)濾意圖基于一個(gè)個(gè)體過(guò)去對(duì)某些項(xiàng)目的評(píng)分和(龐大的)由其他用戶的評(píng)價(jià)構(gòu)成的數(shù)據(jù)庫(kù),來(lái)預(yù)測(cè)該用戶對(duì)未評(píng)價(jià)項(xiàng)目的評(píng)如果一個(gè)人給披頭士的評(píng)分為5(總分5)的話,我們能否預(yù)測(cè)他對(duì)席琳狄翁新專輯的評(píng)分呢?這種情形下,item-based協(xié)同過(guò)濾系統(tǒng)根據(jù)其它項(xiàng)目的評(píng)分來(lái)預(yù)測(cè)項(xiàng)目的分值,一般方法為線性回歸().于是,需要列出個(gè)線性回歸方程和回歸量推薦系統(tǒng)是否屬于數(shù)據(jù)挖掘,例如:當(dāng)有1000個(gè)項(xiàng)目時(shí),需要列多達(dá)1,000,000個(gè)線性回歸方程,以及多達(dá)2,000,000個(gè)回歸量。除非我們只選擇某些用戶共同評(píng)價(jià)過(guò)的項(xiàng)目對(duì),否則協(xié)同過(guò)濾會(huì)遇到過(guò)適(過(guò)擬合)問(wèn)題。算法描述及實(shí)現(xiàn)過(guò)程:算法原型:圖例一(如圖3-1所示):3-1算法演示圖一如上圖所示,的評(píng)分是ItemB的評(píng)分是ItemA的評(píng)分是2,那么,預(yù)測(cè)的評(píng)分是多少根據(jù)算法,2+(3-4)=1。圖例二(如圖3-2所示):3-2算法演示圖二 如上圖所示,UserB ItemB的評(píng)分會(huì)是多少呢?股票上有個(gè)說(shuō)法 是平均值可以掩蓋一切的異常波動(dòng),所以股票上的各個(gè)技術(shù)指標(biāo)是收集不 同時(shí)間段的平均值的曲線圖或是柱狀圖等。

    大數(shù)據(jù)圖書(shū)推薦系統(tǒng)_大數(shù)據(jù)與數(shù)據(jù)挖掘_推薦系統(tǒng)是否屬于數(shù)據(jù)挖掘

    同樣的,Slope One 算法也認(rèn) 為:平均值也可以代替某兩個(gè)未知個(gè)體之間的打分差異,條目 的平均差值是:4-3+(3-3)2=0.5 也就是說(shuō)人們對(duì)事物 的打分要高0.5,于是 Slope one 算法就猜測(cè) UserB 對(duì)事物 作者:相近習(xí)作品編號(hào):02 加權(quán)算法:由上的兩個(gè)示例對(duì) Slope One 算法有了認(rèn)識(shí)。如果有 100 個(gè)用戶對(duì) ItemA ItemB都打過(guò)分,有 1000 個(gè)用戶對(duì) ItemC ItemB也打過(guò) 分。顯然這兩個(gè) 差的權(quán)重是不一樣的。因此我們可以推測(cè),計(jì)算 方法是: 2+1000( 3)(100+1000)Slope One 算法的加權(quán)算法數(shù)學(xué)描述如下:有 打分的平均差(A-B),有 打分的平均差(C-B),注意都是平均差而不是平方差推薦系統(tǒng)是否屬于數(shù)據(jù)挖掘,現(xiàn)在某個(gè)用戶對(duì) 的打分是ra,對(duì) 的打分是rc,那么 的打分可能是:rb=Nra-RA->B+M(rc-R(C->B))M+N 上面討論的是用戶只對(duì)條目的喜好程度打分。還有一種情況下用戶也 可以對(duì)條目的厭惡程度打分。

    大數(shù)據(jù)與數(shù)據(jù)挖掘_大數(shù)據(jù)圖書(shū)推薦系統(tǒng)_推薦系統(tǒng)是否屬于數(shù)據(jù)挖掘

    這時(shí)可以使用雙極 Slope One 算法(BI-Polar Slope One)。 實(shí)驗(yàn)結(jié)果:測(cè)試數(shù)據(jù) 均方根誤差RMSE=0.9474 45分以上推薦正確率: 0.746 盧一強(qiáng):北京遇上西雅圖 龔志鑫:少年派燕睿濤:泰坦尼克號(hào) 盧一強(qiáng):速度與激情5 湯瑤:泰坦尼克號(hào) 劉璐:速度與激情5 劉思遙:泰坦尼克號(hào) 劉璐:猩球崛起 注釋:此數(shù)據(jù)代表按照自己和別人的評(píng)分推薦的電影 作者:相近習(xí) 作品編 15002 作者:相近習(xí) 作品編 15002 代表已經(jīng)看過(guò)的電影,其他的數(shù)數(shù)代表預(yù)測(cè)你給相應(yīng)電影的評(píng)分。 推薦系統(tǒng)在幾個(gè)網(wǎng)站中實(shí)例:1、下面幾幅圖是在卓越亞馬遜上根據(jù)瀏覽記錄推薦的商品: 2、下面的這幅圖示在網(wǎng)上看過(guò)電影后推薦的 3、人人網(wǎng)上按照共同好友的數(shù)量推薦的好友: 參考文獻(xiàn):[1]《推薦系統(tǒng)實(shí)踐》 人民郵電出版社[2]《.x 基礎(chǔ)教程》 張笑天等 西安電子科技大學(xué)出版社, 2008 附錄附錄一:成員介紹及分工: 代碼編寫(xiě):湯瑤、劉少博 資料查閱:姚偉娜、劉璐 報(bào)告撰寫(xiě):阿鵬仁附錄二: 代碼 clear [ua1,ua2,ua3,ua4,ua5]=(′ .txt′,′%d [uat1,uat2,uat3,uat4,uat5]=(′.txt′,′ Train=[ua1,ua2,ua3];Test=[uat1,uat2,uat3]; user=(ua1); movie=(ua2); m=max(user); n=max(movie); Score=zeros(m,n); i=1:(ua1)Score(ua1(i),ua2(i))=ua3(i); end =(Score,Test); (find(>=5))=5; J=(sum((- uat3).^2)/(uat3))^0.5; J=sum((round()-uat3).^2); ratio=sum(round()==uat3)/(uat3); idxp4=find(round()==4); idxp5=find(round()==5); idxp=[idxp4;idxp5]; =sum(uat3(idxp)>=4)/(idxp); M=(A,Test) tic; [m,n]=size(A); gB=ones(n); B=tril(gB);%上三角存平均評(píng)分差,下三角存評(píng)分的權(quán)重 %即共同的評(píng)分人數(shù) %計(jì)算每?jī)闪虚g的平均評(píng)分差 end M=zeros((Test(:,1)),1); z=1:(Test(:,1))i=Test(z,1); j=Test(z,2); X=find(C~=0);temp=0;%各權(quán)重之和 temp=temp+B(j,X(k));else temp=temp+B(X(k),j);end end toc; end 附錄三:原始數(shù)據(jù) 附錄四:PPT單位(學(xué)校): 下山鎮(zhèn)花崗 岵學(xué)校 作者(教師或?qū)W生): 電話:QQ: 郵箱: 微信: 作者:相近習(xí) 作品編號(hào):02

網(wǎng)站首頁(yè)   |    關(guān)于我們   |    公司新聞   |    產(chǎn)品方案   |    用戶案例   |    售后服務(wù)   |    合作伙伴   |    人才招聘   |   

友情鏈接: 餐飲加盟

地址:北京市海淀區(qū)    電話:010-     郵箱:@126.com

備案號(hào):冀ICP備2024067069號(hào)-3 北京科技有限公司版權(quán)所有