一,視頻推薦簡介 根據(jù)艾瑞咨詢數(shù)據(jù) [1],2013第二季度中國在線視頻行業(yè)市場規(guī)模達28.5億元,同比增長43.0%,環(huán)比增長30.6%。隨著網(wǎng)絡(luò)帶寬的增大、智能電視及智能終端的普及,在線視頻行業(yè)增速將繼續(xù)保持。在視頻網(wǎng)站發(fā)展伊始,視頻推薦就應(yīng)運而生。視頻推薦根據(jù)當(dāng)前熱門視頻及用戶的個性化數(shù)據(jù),為用戶提供個性化的視頻推薦,從而增加用戶黏度,提高網(wǎng)站流量,是各大視頻網(wǎng)站極為重視的功能之一。 2006年的Netflix大賽是視頻推薦領(lǐng)域的標(biāo)志性事件,該比賽懸賞100萬美元,希望研究人員能夠?qū)?/font>Netflix的推薦算法的預(yù)測準(zhǔn)確度提高到10%,比賽舉辦三年后,由AT&T的研究人員將大獎捧走。這場比賽吸引了眾多隊伍參加,并將協(xié)同過濾(collaborative filtering),關(guān)聯(lián)規(guī)則(association rules),奇異值分解(SVD)等眾多推薦方法應(yīng)用于視頻推薦領(lǐng)域,獲得非常好的推薦效果。這一事件反映出視頻網(wǎng)站對推薦系統(tǒng)的重視程度,同時YouTube等公司也在視頻推薦領(lǐng)域進行專門研究[2][5],可見推薦系統(tǒng)在視頻網(wǎng)站中的重要地位。 1.1重要視頻網(wǎng)站推薦系統(tǒng)簡介 目前幾乎所有的重要在線視頻網(wǎng)站均有視頻推薦功能,本小節(jié)對主要視頻網(wǎng)站推薦模塊進行簡要介紹。 1) YouTube YouTube是在線視頻行業(yè)的領(lǐng)袖企業(yè),在其網(wǎng)站上線不久就推出簡單的視頻推薦功能,經(jīng)過不斷發(fā)展,已經(jīng)發(fā)展為相對成熟的視頻推薦系統(tǒng)。 根據(jù)YouTube發(fā)布的論文[2]顯示,到2010年,YouTube主要使用基于關(guān)聯(lián)規(guī)則(association rules)的推薦方式進行Top-N的視頻推薦。通過21天的實驗結(jié)果顯示,[2]中的系統(tǒng)比之前按照點擊率進行的推薦,效果好上1倍。 2) Netflix Netflix從其舉辦的Netflix Prize[3][4]中獲利頗豐,這項比賽使得其推薦準(zhǔn)確率提高了10%以上,為其帶來巨大收益。 在Netflix Prize比賽開始之初,協(xié)同過濾(collaborative filtering,CF)表現(xiàn)優(yōu)異,但是隨著比賽的進行,對CF的各種改進版本及其他算法不斷應(yīng)用進來,推薦效果逐漸提升。 3) Youku 目前查詢不到有關(guān)Youku視頻推薦系統(tǒng)的資料與文獻,但是可以通過Youku推薦質(zhì)量對其進行分析。 用戶賬號為筆者去年注冊的賬號,已觀看視頻與推薦視頻如圖1、圖2所示。
095155cixkiv8abvfx8pdf.png (404.04 KB, 下載次數(shù): 5)
下載附件
保存到相冊
2014-4-12 22:36 上傳
圖1:Youku觀看記錄
0952511clqlkwtkkawcxq3.png (324.72 KB, 下載次數(shù): 9)
下載附件
保存到相冊
2014-4-12 22:36 上傳
圖2:Youku推薦效果
對于推薦結(jié)果中,大部分推薦結(jié)果和我收看記錄中的視頻具有較高相似度(收看記錄只列出最近收看記錄),這種推薦效果可以通過Content-based方法實現(xiàn)。 但是與已看記錄有一定重合度,視頻推薦泛化性能相對較差。
二,對樂視網(wǎng)視頻推薦的建議
2.1樂視網(wǎng)目前推薦現(xiàn)狀 樂視網(wǎng)目前已經(jīng)具有視頻推薦功能,但該功能只在用戶個人中心中可見,首頁位置沒有相關(guān)推薦板塊,對推薦功能重視程度不足。 下圖是基于賬號lycan785(已經(jīng)綁定新浪微博hzau_unlearning)的收看記錄與“猜你喜歡”的結(jié)果。
0954326et6blkis1tklja3.png (42.82 KB, 下載次數(shù): 6)
下載附件
保存到相冊
2014-4-12 22:36 上傳
圖3:賬號lycan785的播放記錄
095522sosluu11vi1su1b9.png (459.09 KB, 下載次數(shù): 8)
下載附件
保存到相冊
2014-4-12 22:36 上傳
圖4:對lycan785賬號的推薦視頻
該賬號于2013年10月20日晚注冊,推薦視頻列表是10月21日上午的結(jié)果。其中播放記錄主要選擇“美劇”、“體育”兩個頻道,并加上了一些噪音數(shù)據(jù)(最先觀看的兩個視頻),而推薦結(jié)果基本是當(dāng)前熱門視頻,既和觀看記錄無關(guān),又和該賬戶綁定的微博賬戶興趣無關(guān),無法抓住用戶興趣,可見推薦系統(tǒng)有待提高。
2.2對樂視網(wǎng)的建議
基于以上分析,特為樂視網(wǎng)提出以下建議:
1)重視數(shù)據(jù)采集推薦系統(tǒng)對數(shù)據(jù)的依賴性較大,一般來說,越完整的數(shù)據(jù)可以產(chǎn)生更加有效的推薦,因此建議樂視網(wǎng)加大對數(shù)據(jù)的整合力度。需要重視的數(shù)據(jù)主要有:賬戶活躍時間,賬戶觀看記錄,不同時長影片觀看時間比(觀看時間占整個影片時間的比例),付費記錄,賬戶點評記錄,賬戶個人信息、視頻元數(shù)據(jù)等。
2)賬戶興趣挖掘了解賬戶興趣是進行推薦的基礎(chǔ),賬戶興趣可以利用協(xié)同過濾(CF)等方法從觀看記錄中獲取,同時可以利用用戶綁定分享賬戶獲得用戶興趣。通過用戶觀看記錄,可以在??匆曨l頻道、類型、劇集方面挖掘用戶興趣,這部分工作相對簡單,已經(jīng)有CF、關(guān)聯(lián)規(guī)則等成熟技術(shù)。對于新注冊用戶的冷啟動現(xiàn)象,可以利用其綁定的微博、豆瓣(目前無此功能)來收集用戶興趣,例如微博文本話題挖掘,豆瓣關(guān)于電影的討論等。
3) 基于情景的推薦任何推薦都需要放在具體的情景之下,不同視頻具有不同特點,更需要基于情境的推薦。對于音樂、電視劇推薦,可以依照目前的播放器下方、側(cè)欄推薦方式進行,即推薦目前觀看劇集的下一集或者同一歌手的歌曲。對于電影推薦適合采用“協(xié)同過濾”、“用戶個性化”、“當(dāng)前電影相關(guān)”的推薦方式進行個性化推薦,對于 新聞、體育的推薦適合采用類似新聞或者相關(guān)新聞的推薦??傊瑢τ诓煌l道、類型的推薦需要采用不同的推薦策略。
|