chinesefreesexvideos高潮,欧美极品少妇性运交,久久久国产一区二区三区,99久久婷婷国产综合精品,成人国产一区二区三区

APP推廣合作
聯(lián)系“鳥哥筆記小喬”
【漲姿勢】網(wǎng)易云音樂的精準(zhǔn)個性化推薦是怎么做到的?
2016-02-04 11:23:22
用過蝦米、酷狗、QQ音樂、網(wǎng)易云音樂,個人感受網(wǎng)易云音樂在音樂推薦這塊做的真心不錯,特別是以“人”為角度的推薦,沒有像蝦米、酷狗推的那么亂。蝦米還可以,但更多的是以歌搜歌的形式。剛注冊了一個新的賬號,避免有歷史數(shù)據(jù)的干擾,聽了一首周杰倫的《一路向北》和陳奕迅的《淘汰》,然后去個性化推薦里看到了蔡健雅的《紅色高跟鞋》和曲婉婷的《承認(rèn)》,給我的感覺還是比較驚喜,像蔡健雅一般聽的人比較少,還能推薦到體驗不錯。當(dāng)然也有很多不一定特別準(zhǔn),當(dāng)然聽歌這東西就不需要完全準(zhǔn)確。

網(wǎng)易云音樂關(guān)于個性化推薦這塊在公司外部介紹的比較少,但應(yīng)該推薦的算法和機制和大部分的音樂素材的公司做的類似。以item為核心的協(xié)同過濾(CF),通過打分機制來推薦最適合的歌曲。

印象中早期網(wǎng)易云音樂還可以將自己聽的歌曲分享到微信朋友圈等,通過跳轉(zhuǎn)關(guān)聯(lián)到的賬戶ID識別出朋友關(guān)系。這個想法的確很贊,包括我第一次聽《一路向北》的時候也是一個朋友推薦給我的,這首歌不僅是個人喜歡的風(fēng)格,再加上有朋友推薦所以留下很好的印象。但是很可惜,現(xiàn)在朋友圈不能分享了。微博還可以分享,只是現(xiàn)在微博的數(shù)據(jù)很多水分。

現(xiàn)在主流的方式都是人工+智能推薦,人工的方式就不過多介紹,費時費力。出不了幾張有限的專輯。現(xiàn)在主流都是通過機器學(xué)習(xí)的方式,通過同類人類的偏好給相似的人群推薦他們都喜歡的歌曲。也有根據(jù)以歌的item推薦相似的歌曲,但體驗就是聽來聽去就是那個風(fēng)格,很快就乏味了。

算法部分:

1.相似人群的推薦

引用:著作權(quán)歸作者所有。
作者:邰原朗
鏈接:網(wǎng)易云音樂的歌單推薦算法是怎樣的? - 邰原朗的回答
來源:知乎

有3首歌放在那里,《最炫民族風(fēng)》,《晴天》,《Hero》。
A君,收藏了《最炫民族風(fēng)》,而遇到《晴天》,《Hero》則總是跳過;
B君,經(jīng)常單曲循環(huán)《最炫民族風(fēng)》,《晴天》會播放完,《Hero》則拉黑了
C君,拉黑了《最炫民族風(fēng)》,而《晴天》《Hero》都收藏了。

我們都看出來了,A,B二位品味接近,C和他們很不一樣。
那么問題來了,說A,B相似,到底有多相似,如何量化?

我們把三首歌想象成三維空間的三個維度,《最炫民族風(fēng)》是x軸,《晴天》是y軸,《Hero》是z軸,對每首歌的喜歡程度即該維度上的坐標(biāo),
并且對喜歡程度做量化(比如: 單曲循環(huán)=5, 分享=4, 收藏=3, 主動播放=2 , 聽完=1, 跳過=-1 , 拉黑=-5 )。
那么每個人的總體口味就是一個向量,A君是 (3,-1,-1),B君是(5,1,-5),C君是(-5,3,3)。 (抱歉我不會畫立體圖)
我們可以用向量夾角的余弦值來表示兩個向量的相似程度, 0度角(表示兩人完全一致)的余弦是1, 180%角(表示兩人截然相反)的余弦是-1。

根據(jù)余弦公式, 夾角余弦 = 向量點積/ (向量長度的叉積) = ( x1x2 + y1y2 + z1z2) / ( 跟號(x1平方+y1平方+z1平方 ) x 跟號(x2平方+y2平方+z2平方 ) )
可見 A君B君夾角的余弦是0.81 , A君C君夾角的余弦是 -0.97 ,公式誠不欺我也。
以上是三維(三首歌)的情況,如法炮制N維N首歌的情況都是一樣的。
假設(shè)我們選取一百首種子歌曲,算出了各君之間的相似值,那么當(dāng)我們發(fā)現(xiàn)A君還喜歡聽的《小蘋果》B君居然沒聽過,相信大家都知道該怎么和B君推薦了吧。

第一類以人為本推薦算法的好處我想已經(jīng)很清楚了,那就是精準(zhǔn)!
代價是運算量很大,而且對于新來的人(聽得少,動作少),也不太好使,
所以人們又發(fā)明了第二類算法。

假設(shè)我們對新來的D君,只知道她喜歡最炫民族風(fēng),那么問題來了,給她推薦啥好咯?

如圖,推薦《晴天》!

以及nick lee分享的一種矩陣計算得分的方式:

這里我想給大家介紹另外一種推薦系統(tǒng),這種算法叫做潛在因子(Latent Factor)算法。這種算法是在NetFlix(沒錯,就是用大數(shù)據(jù)捧火《紙牌屋》的那家公司)的推薦算法競賽中獲獎的算法,最早被應(yīng)用于電影推薦中。這種算法在實際應(yīng)用中比現(xiàn)在排名第一的 @邰原朗 所介紹的算法誤差(RMSE)會小不少,效率更高。我下面僅利用基礎(chǔ)的矩陣知識來介紹下這種算法。

這種算法的思想是這樣:每個用戶(user)都有自己的偏好,比如A喜歡帶有小清新的、吉他伴奏的、王菲等元素(latent factor),如果一首歌(item)帶有這些元素,那么就將這首歌推薦給該用戶,也就是用元素去連接用戶和音樂。每個人對不同的元素偏好不同,而每首歌包含的元素也不一樣。我們希望能找到這樣兩個矩陣:

一,用戶-潛在因子矩陣Q,表示不同的用戶對于不用元素的偏好程度,1代表很喜歡,0代表不喜歡。比如下面這樣:

二,潛在因子-音樂矩陣P,表示每種音樂含有各種元素的成分,比如下表中,音樂A是一個偏小清新的音樂,含有小清新這個Latent Factor的成分是0.9,重口味的成分是0.1,優(yōu)雅的成分是0.2……

利用這兩個矩陣,我們能得出張三對音樂A的喜歡程度是:張三對小清新的偏好*音樂A含有小清新的成分+對重口味的偏好*音樂A含有重口味的成分+對優(yōu)雅的偏好*音樂A含有優(yōu)雅的成分+……

即:0.6*0.9+0.8*0.1+0.1*0.2+0.1*0.4+0.7*0=0.69
每個用戶對每首歌都這樣計算可以得到不同用戶對不同歌曲的評分矩陣
。(注,這里的破浪線表示的是估計的評分,接下來我們還會用到不帶波浪線的R表示實際的評分):

因此我們隊張三推薦四首歌中得分最高的B,對李四推薦得分最高的C,王五推薦B。
如果用矩陣表示即為:

下面問題來了,這個潛在因子(latent factor)是怎么得到的呢?

由于面對海量的讓用戶自己給音樂分類并告訴我們自己的偏好系數(shù)顯然是不現(xiàn)實的,事實上我們能獲得的數(shù)據(jù)只有用戶行為數(shù)據(jù)。我們沿用 @邰原朗的量化標(biāo)準(zhǔn):單曲循環(huán)=5, 分享=4, 收藏=3, 主動播放=2 , 聽完=1, 跳過=-2 , 拉黑=-5,在分析時能獲得的實際評分矩陣R,也就是輸入矩陣大概是這個樣子:

事實上這是個非常非常稀疏的矩陣,因為大部分用戶只聽過全部音樂中很少一部分。如何利用這個矩陣去找潛在因子呢?這里主要應(yīng)用到的是矩陣的UV分解。也就是將上面的評分矩陣分解為兩個低維度的矩陣,用Q和P兩個矩陣的乘積去估計實際的評分矩陣,而且我們希望估計的評分矩陣事實上這是個非常非常稀疏的矩陣,因為大部分用戶只聽過全部音樂中很少一部分。如何利用這個矩陣去找潛在因子呢?這里主要應(yīng)用到的是矩陣的UV分解。也就是將上面的評分矩陣分解為兩個低維度的矩陣,用Q和P兩個矩陣的乘積去估計實際的評分矩陣,而且我們希望估計的評分矩陣

和實際的評分矩陣不要相差太多,也就是求解下面的目標(biāo)函數(shù):

這里涉及到最優(yōu)化理論,在實際應(yīng)用中,往往還要在后面加上2范數(shù)的罰項,然后利用梯度下降法就可以求得這P,Q兩個矩陣的估計值。這里我們就不展開說了。例如我們上面給出的那個例子可以分解成為這樣兩個矩陣:

這兩個矩陣相乘就可以得到估計的得分矩陣:這兩個矩陣相乘就可以得到估計的得分矩陣:

將用戶已經(jīng)聽過的音樂剔除后,選擇分?jǐn)?shù)最高音樂的推薦給用戶即可(紅體字)。將用戶已經(jīng)聽過的音樂剔除后,選擇分?jǐn)?shù)最高音樂的推薦給用戶即可(紅體字)。

在這個例子里面用戶7和用戶8有強的相似性:
從推薦的結(jié)果來看,正好推薦的是對方評分較高的音樂:

從推薦的結(jié)果來看,正好推薦的是對方評分較高的音樂:


本質(zhì)上應(yīng)該都類似,都是從Amazon那條路子下來的。但是這種方式也會遇到問題:

A)冷啟動的問題,在沒有用戶數(shù)據(jù)的情況下要推哪些歌曲,目前網(wǎng)易云音樂搞了個比較Q的調(diào)查問卷,還是挺有趣的。

B)同質(zhì)化嚴(yán)重問題,怎么加入新的元素,比如熱門+新歌來補充這塊;

C)人群變化問題,光靠推薦很明顯不代表每個個體的情況,特別是一些小眾群體,數(shù)據(jù)比較稀疏。這些就需要用戶自己主動搜索和添加、喜歡、下載的方式。

2.相似歌的推薦

蝦米、酷狗上都是這樣的歌曲漫游推薦的形式,個人不太提倡這樣的方式,簡單認(rèn)為聽過A歌的人也可能喜歡B,這個差異還是比較大的。而且還是要維護一堆歌曲的tag標(biāo)簽。

整體來說,網(wǎng)易云音樂在個性化推薦這塊算法還是花了不少真功夫,所以要給個贊??吹剿麄冊谒惴ㄕ衅?、并發(fā)計算這些實時場景的介紹比較少,還是希望能夠有機會在線下能夠有這塊的交流。

文章來源:知乎    作者:宿痕
原文鏈接:http://zhuanlan.zhihu.com/dataman/20510761
運營那些事兒
分享到朋友圈
收藏
收藏
評分

綜合評分:

我的評分
Xinstall 15天會員特權(quán)
Xinstall是專業(yè)的數(shù)據(jù)分析服務(wù)商,幫企業(yè)追蹤渠道安裝來源、裂變拉新統(tǒng)計、廣告流量指導(dǎo)等,廣泛應(yīng)用于廣告效果統(tǒng)計、APP地推與CPS/CPA歸屬統(tǒng)計等方面。
20羽毛
立即兌換
一書一課30天會員體驗卡
領(lǐng)30天VIP會員,110+門職場大課,250+本精讀好書免費學(xué)!助你提升職場力!
20羽毛
立即兌換
順豐同城急送全國通用20元優(yōu)惠券
順豐同城急送是順豐推出的平均1小時送全城的即時快送服務(wù),專業(yè)安全,準(zhǔn)時送達!
30羽毛
立即兌換
運營那些事兒
運營那些事兒
發(fā)表文章43451
確認(rèn)要消耗 羽毛購買
【漲姿勢】網(wǎng)易云音樂的精準(zhǔn)個性化推薦是怎么做到的?嗎?
考慮一下
很遺憾,羽毛不足
我知道了

我們致力于提供一個高質(zhì)量內(nèi)容的交流平臺。為落實國家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評論自律管理,為了保護用戶創(chuàng)造的內(nèi)容、維護開放、真實、專業(yè)的平臺氛圍,我們團隊將依據(jù)本公約中的條款對注冊用戶和發(fā)布在本平臺的內(nèi)容進行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質(zhì)內(nèi)容,同時也將采取必要措施管理違法、侵權(quán)或有其他不良影響的網(wǎng)絡(luò)信息。


一、根據(jù)《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
    1)反對憲法所確定的基本原則;
    2)危害國家安全,泄露國家秘密,顛覆國家政權(quán),破壞國家統(tǒng)一,損害國家榮譽和利益;
    3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
    4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
    5)煽動民族仇恨、民族歧視,破壞民族團結(jié);
    6)破壞國家宗教政策,宣揚邪教和封建迷信;
    7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
    8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
    9)煽動非法集會、結(jié)社、游行、示威、聚眾擾亂社會秩序;
    10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權(quán)益;
    11)通過網(wǎng)絡(luò)以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進行網(wǎng)絡(luò)欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法規(guī)禁止的其他內(nèi)容;


2. 不友善:不尊重用戶及其所貢獻內(nèi)容的信息或行為。主要表現(xiàn)為:
    1)輕蔑:貶低、輕視他人及其勞動成果;
    2)誹謗:捏造、散布虛假事實,損害他人名譽;
    3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進行揭露或描述,以此來激怒他人;
    4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應(yīng),蓄意制造事端;
    5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
    6)謾罵:以不文明的語言對他人進行負(fù)面評價;
    7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
    8)威脅:許諾以不良的后果來迫使他人服從自己的意志;


3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網(wǎng)站秩序的內(nèi)容,或進行相關(guān)行為。主要表現(xiàn)為:
    1)多次發(fā)布包含售賣產(chǎn)品、提供服務(wù)、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
    2)單個帳號多次發(fā)布包含垃圾廣告的內(nèi)容;
    3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
    4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉(zhuǎn)網(wǎng)站等,誘騙用戶點擊鏈接
    5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當(dāng)曝光;
    6)購買或出售帳號之間虛假地互動,發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關(guān)交易。
    7)發(fā)布包含欺騙性的惡意營銷內(nèi)容,如通過偽造經(jīng)歷、冒充他人等方式進行惡意營銷;
    8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。


4. 色情低俗信息,主要表現(xiàn)為:
    1)包含自己或他人性經(jīng)驗的細(xì)節(jié)描述或露骨的感受描述;
    2)涉及色情段子、兩性笑話的低俗內(nèi)容;
    3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
    4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
    5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
    6)炒作緋聞、丑聞、劣跡等;
    7)宣揚低俗、庸俗、媚俗內(nèi)容。


5. 不實信息,主要表現(xiàn)為:
    1)可能存在事實性錯誤或者造謠等內(nèi)容;
    2)存在事實夸大、偽造虛假經(jīng)歷等誤導(dǎo)他人的內(nèi)容;
    3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機構(gòu)或個人存在關(guān)聯(lián)。


6. 傳播封建迷信,主要表現(xiàn)為:
    1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治??;
    2)求推薦算命看相大師;
    3)針對具體風(fēng)水等問題進行求助或咨詢;
    4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;


7. 文章標(biāo)題黨,主要表現(xiàn)為:
    1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來誘導(dǎo)用戶;
    2)內(nèi)容與標(biāo)題之間存在嚴(yán)重不實或者原意扭曲;
    3)使用夸張標(biāo)題,內(nèi)容與標(biāo)題嚴(yán)重不符的。


8.「飯圈」亂象行為,主要表現(xiàn)為:
    1)誘導(dǎo)未成年人應(yīng)援集資、高額消費、投票打榜
    2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
    3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
    4)以號召粉絲、雇用網(wǎng)絡(luò)水軍、「養(yǎng)號」形式刷量控評等行為
    5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序


9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
    1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導(dǎo)未成年人不良嗜好影響未成年人身心健康的;
    2)不當(dāng)評述自然災(zāi)害、重大事故等災(zāi)難的;
    3)美化、粉飾侵略戰(zhàn)爭行為的;
    4)法律、行政法規(guī)禁止,或可能對網(wǎng)絡(luò)生態(tài)造成不良影響的其他內(nèi)容。


二、違規(guī)處罰
本網(wǎng)站通過主動發(fā)現(xiàn)和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質(zhì)量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當(dāng)一個用戶發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將依據(jù)相關(guān)用戶違規(guī)情節(jié)嚴(yán)重程度,對帳號進行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當(dāng)涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將加重處罰。


三、申訴
隨著平臺管理經(jīng)驗的不斷豐富,本網(wǎng)站出于維護本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網(wǎng)站進行反饋。
(規(guī)則的最終解釋權(quán)歸屬本網(wǎng)站所有)

我知道了
恭喜你~答對了
+5羽毛
下一次認(rèn)真讀哦
成功推薦給其他人
+ 10羽毛
評論成功且進入審核!審核通過后,您將獲得10羽毛的獎勵。分享本文章給好友閱讀最高再得15羽毛~
(羽毛可至 "羽毛精選" 兌換禮品)
好友微信掃一掃
復(fù)制鏈接