很可惜 T 。T 您現(xiàn)在還不是作者身份,不能自主發(fā)稿哦~
如有投稿需求,請(qǐng)把文章發(fā)送到郵箱tougao@appcpx.com,一經(jīng)錄用會(huì)有專(zhuān)人和您聯(lián)系
咨詢?nèi)绾纬蔀榇河鹱髡哒?qǐng)聯(lián)系:鳥(niǎo)哥筆記小羽毛(ngbjxym)
用戶畫(huà)像,大數(shù)據(jù)時(shí)代老生常談且又長(zhǎng)久不衰的話題,公司都在搞,文章滿天飛,在這個(gè)人人都喊“數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)”的時(shí)代,你不懂用戶畫(huà)像,不搞用戶畫(huà)像,你都不好意思跟別人聊(chui)業(yè)(niu)務(wù)(pi)。
但是,用戶畫(huà)像是不是一定要搞?為什么要搞?不搞可不可以?如果一定要搞,用戶畫(huà)像耗時(shí)耗力,怎么才能把它真正落地到業(yè)務(wù)?而不是開(kāi)發(fā)了N多的標(biāo)簽,放在數(shù)倉(cāng)里吃灰?搞之前多問(wèn)幾個(gè)為什么,你會(huì)發(fā)現(xiàn)落地的可能性就大了很多。
在寫(xiě)這篇文章之前,我也拜讀了不少用戶畫(huà)像相關(guān)的文章,但是很可惜,很多文章可能搞錯(cuò)了一點(diǎn),那就是用戶畫(huà)像是業(yè)務(wù),不是技術(shù)!用戶畫(huà)像一定是來(lái)源于業(yè)務(wù),并且最終落地到業(yè)務(wù)上去的。那些不管業(yè)務(wù)需求、標(biāo)簽體系,上來(lái)就是用戶畫(huà)像怎么實(shí)現(xiàn)的,這無(wú)異于吃飯點(diǎn)了一盤(pán)土豆絲,大廚埋頭給你搞了一道佛跳墻,然后跟你巴拉巴拉扯做佛跳墻牛叉的108步驟,呵呵,只能說(shuō),技術(shù)自嗨,最為致命,一切不以需求為出發(fā)點(diǎn)的應(yīng)用,都是在耍流氓。
這也是寫(xiě)這篇文章的初衷,用戶畫(huà)像是什么?一般在什么場(chǎng)景下會(huì)用?我們的業(yè)務(wù)場(chǎng)景是不是真的需要這個(gè)費(fèi)時(shí)費(fèi)力的大家伙?如果真的需要,業(yè)務(wù)需求是什么樣的?標(biāo)簽體系如何搭建和開(kāi)發(fā)?開(kāi)發(fā)后如何使用和進(jìn)一步迭代優(yōu)化?只有把這一步步想清楚做仔細(xì),才能最終落地到實(shí)際的業(yè)務(wù)中,發(fā)揮用戶畫(huà)像真正的價(jià)值。
用戶畫(huà)像是指根據(jù)用戶的基本屬性、用戶偏好、生活習(xí)慣、用戶行為等信息而抽象出來(lái)的標(biāo)簽化用戶模型。每一個(gè)標(biāo)簽及標(biāo)簽權(quán)重是表征用戶偏好的一個(gè)向量,一個(gè)用戶可以理解為多個(gè)偏好向量(標(biāo)簽)的和。
--來(lái)自某度的看不懂的解釋
說(shuō)人話?。?!用戶畫(huà)像是基于你在互聯(lián)網(wǎng)上留下的種種數(shù)據(jù),將這些數(shù)據(jù)在你知情或者不知情的時(shí)候,通過(guò)數(shù)據(jù)加工,產(chǎn)生的一個(gè)個(gè)刻畫(huà)你興趣偏好的標(biāo)簽組,這就是用戶畫(huà)像。
那么接下來(lái)的問(wèn)題就是:用戶畫(huà)像的使用場(chǎng)景有哪些?
分群運(yùn)營(yíng)是用戶畫(huà)像最常用的場(chǎng)景,通過(guò)用戶畫(huà)像的標(biāo)簽篩選,篩選出不同的用戶群,通過(guò)push或彈窗配置平臺(tái),對(duì)不同的用戶群實(shí)現(xiàn)精細(xì)化運(yùn)營(yíng)。
比如我們可以把過(guò)去30天購(gòu)買(mǎi)金額大于500、活躍天數(shù)大于10天、最近一次活躍間隔在5天以內(nèi)的用戶定義為高付費(fèi)潛力用戶群,進(jìn)而對(duì)這部分高潛用戶進(jìn)行精細(xì)化運(yùn)營(yíng)。
分層越來(lái)越精細(xì),用戶群的粒度會(huì)越來(lái)越小,最后會(huì)小到一個(gè)個(gè)體。我們針對(duì)每個(gè)個(gè)體去做push或者彈屏,運(yùn)營(yíng)效率還是太低了?;谟脩舢?huà)像的自動(dòng)化觸達(dá)就發(fā)揮了作用。比如針對(duì)上一步我們創(chuàng)建的高付費(fèi)潛力用戶群,我們通過(guò)App Push的方式發(fā)送一張滿200減40的優(yōu)惠券。
以用戶畫(huà)像為基礎(chǔ)構(gòu)建推薦系統(tǒng)、搜索引擎、廣告投放系統(tǒng),可以有效提升轉(zhuǎn)化率。我們先看一下用戶畫(huà)像的用戶偏好表存儲(chǔ)表(用戶畫(huà)像有很多這種標(biāo)簽,下面我們會(huì)詳細(xì)展開(kāi)具體講解):
當(dāng)我們購(gòu)買(mǎi)完成一個(gè)帶有標(biāo)簽1,標(biāo)簽2,標(biāo)簽3的商品后,一般在購(gòu)買(mǎi)完成頁(yè)會(huì)有交叉銷(xiāo)售場(chǎng)景,我們通過(guò)用戶偏好表的標(biāo)簽及權(quán)重,基于用戶相似或商品相似的協(xié)同過(guò)濾算法,推薦用戶可能喜歡的其他商品。
根據(jù)用戶的屬性、行為特征對(duì)用戶進(jìn)行分類(lèi)后,統(tǒng)計(jì)不同特征下的用量、分布,分析不同用戶畫(huà)像群體的分布特征和走勢(shì)等。
另外,還可以通過(guò)用戶畫(huà)像分析可以了解行業(yè)動(dòng)態(tài),比如人群消費(fèi)習(xí)慣、消費(fèi)偏好分析、不同地域品類(lèi)消費(fèi)差異分析。比如我們經(jīng)常聽(tīng)到馬爸爸拿一些標(biāo)簽,說(shuō)這個(gè)地方人喜歡買(mǎi)什么?為什么喜歡買(mǎi)?那個(gè)地方人都是買(mǎi)什么型號(hào)?
大學(xué)剛畢業(yè)時(shí),初到一家互聯(lián)網(wǎng)公司做數(shù)據(jù)運(yùn)營(yíng),某天領(lǐng)導(dǎo)突然給我一個(gè)任務(wù):做一個(gè)APP用戶畫(huà)像報(bào)告。當(dāng)時(shí)我有點(diǎn)懵,一是我以前確實(shí)沒(méi)接觸過(guò)用戶畫(huà)像,概念不太清楚;二是接到領(lǐng)導(dǎo)的任務(wù)后我只知道要做一個(gè)用戶畫(huà)像,至于這個(gè)用戶畫(huà)像到底用來(lái)做什么我并不清楚。
在這個(gè)情況下,我查閱各種資料,問(wèn)同學(xué)、問(wèn)朋友,還找了一些高大上作圖工具,最后總算是完成了任務(wù),得到了公司認(rèn)可。但用戶畫(huà)像到底給公司帶來(lái)了什么價(jià)值,給運(yùn)營(yíng)決策起到了什么作用并不清楚,這其實(shí)就是典型的隨大流,為了做而做。
這種面子工程非常常見(jiàn),大家可以看看自己公司的情況對(duì)號(hào)入座,因?yàn)榇蠹叶荚谡務(wù)撚脩舢?huà)像,于是很多領(lǐng)導(dǎo)也開(kāi)始要求做用戶畫(huà)像,別人有我們不能沒(méi)有,但用戶畫(huà)像到底為了解決什么問(wèn)題并不清楚,自然而然就沒(méi)有落地的可能性,更不可能產(chǎn)生價(jià)值。
所以為了解決這個(gè)問(wèn)題,在最開(kāi)始的時(shí)候就要想清楚,我們是否真的需要用戶畫(huà)像?只要想清楚一下三個(gè)問(wèn)題,就可以得到答案。
1、我們業(yè)務(wù)中是否有能用到用戶畫(huà)像的場(chǎng)景?比如用戶分層、智能觸達(dá)和個(gè)性化推薦。
2、如果有使用場(chǎng)景,是否一定要通過(guò)用戶畫(huà)像實(shí)現(xiàn)?用戶畫(huà)像本身是一個(gè)非常浩大的工程,十分耗時(shí)耗力,我們有沒(méi)有其他替代的方案?
3、如果必須要搞,那我們給用戶打了標(biāo)簽進(jìn)行分層后,我們有沒(méi)有對(duì)應(yīng)的產(chǎn)品服務(wù)或運(yùn)營(yíng)方案?分層后沒(méi)有對(duì)應(yīng)的action,用戶畫(huà)像還是難以落地閉環(huán)。
以上問(wèn)題如果沒(méi)有想清楚,就盲目搞用戶畫(huà)像,結(jié)果很可能就是弄出來(lái)的用戶畫(huà)像遠(yuǎn)離業(yè)務(wù),沒(méi)有實(shí)用價(jià)值、無(wú)干貨,被業(yè)務(wù)部門(mén)譏諷為“大而無(wú)用”的雞肋產(chǎn)品。
所以,在規(guī)劃用戶畫(huà)像平臺(tái)時(shí),一定要有目的性和場(chǎng)景感,不能只做表面文章,而不重視實(shí)際應(yīng)用價(jià)值。
這里需要強(qiáng)調(diào)的一點(diǎn)是:不是因?yàn)槲矣辛擞脩舢?huà)像,才能驅(qū)動(dòng)和提高業(yè)務(wù)。而是為了驅(qū)動(dòng)和提高業(yè)務(wù),才需要去建立用戶畫(huà)像。這是很容易犯的因果倒置的錯(cuò)誤!
以上問(wèn)題沒(méi)有想清楚,千萬(wàn)不要?jiǎng)邮珠_(kāi)發(fā),如果以上的問(wèn)題想清楚后,還是要搞,那我們就要認(rèn)真籌劃,用戶畫(huà)像怎么做才有價(jià)值。
已經(jīng)確定要搞用戶畫(huà)像,接下來(lái)就要思考:怎么搞才能業(yè)務(wù)落地?怎么搞才能產(chǎn)生價(jià)值?
剛開(kāi)始做用戶畫(huà)像的時(shí)候,業(yè)務(wù)部門(mén)搖頭晃腦的說(shuō):“我們要基于用戶畫(huà)像,詳細(xì)深入的了解用戶,比如用戶性別,年齡,地域,喜好,消費(fèi)習(xí)慣,……這樣我們就能精細(xì)化決策了”。然后數(shù)據(jù)部門(mén)夯吃夯吃搞了幾個(gè)月,打了30000個(gè)用戶標(biāo)簽,還得意洋洋的跟領(lǐng)導(dǎo)匯報(bào):“我們的用戶畫(huà)像大數(shù)據(jù)建設(shè)取得長(zhǎng)足進(jìn)步”。
然后項(xiàng)目第一期匯報(bào)會(huì)上,數(shù)據(jù)部門(mén)得意洋洋的講到:
我們的用戶男女比例6:4
華南地區(qū)占比30%
華東25%購(gòu)買(mǎi)A產(chǎn)品占比50%
巴拉巴拉巴拉......
業(yè)務(wù)部門(mén)一個(gè)白眼拋過(guò)來(lái),
我早知道了!
我們的用戶都是這樣的呀!
然后呢?
你做這有啥用?......
當(dāng)然還有更慘的,
就是你貼個(gè)“忠誠(chéng)用戶”的標(biāo)簽,
業(yè)務(wù)方說(shuō):哦,既然那么忠誠(chéng),就不做啥動(dòng)作了。結(jié)果丫下個(gè)月不消費(fèi)也不登錄了!
你貼了“A產(chǎn)品愛(ài)用者”的標(biāo)簽,業(yè)務(wù)方推了A產(chǎn)品,丫沒(méi)有買(mǎi)!
業(yè)務(wù)方怒氣沖沖找來(lái)算賬:“這用戶畫(huà)像一點(diǎn)都不精準(zhǔn)嘛!”
于是,項(xiàng)目徹底涼涼。問(wèn)題到底出在哪里呢?你丫的根本沒(méi)有了解業(yè)務(wù)的需求啊,業(yè)務(wù)方想吃個(gè)簡(jiǎn)單的酸辣土豆絲,你吭哧吭哧跟業(yè)務(wù)方扯佛跳的108道工藝,或者雖然你了解了業(yè)務(wù)方的需求,但是這個(gè)標(biāo)簽?zāi)愦虻牟粶?zhǔn)啊,我要的是酸辣土豆絲,不是青椒土豆絲......
所以要想用戶畫(huà)像能落地,以下幾個(gè)步驟尤為關(guān)鍵。
在規(guī)劃用戶畫(huà)像時(shí),一定要有目的性和場(chǎng)景感,不能只做表面文章,而不重視實(shí)際應(yīng)用價(jià)值。再次強(qiáng)調(diào):不是因?yàn)槲矣辛擞脩舢?huà)像,才能驅(qū)動(dòng)和提高業(yè)務(wù)。而是業(yè)務(wù)有需求,才需要去建立用戶畫(huà)像!
第一步也是最為關(guān)鍵的一步,一定要搞清楚業(yè)務(wù)方的需求是什么?要解決的問(wèn)題是什么?
舉個(gè)栗子,一個(gè)內(nèi)容型社區(qū)近期準(zhǔn)備上線一個(gè)知識(shí)付費(fèi)模塊,通過(guò)該模式進(jìn)行商業(yè)變現(xiàn),想通過(guò)用戶畫(huà)像將精準(zhǔn)的內(nèi)容推薦給精準(zhǔn)的人,進(jìn)而促進(jìn)付費(fèi)變現(xiàn)?;诖?,可以把業(yè)務(wù)目標(biāo)和要解決的問(wèn)題梳理如下:
需要選擇哪些標(biāo)簽?為什么要選擇這些標(biāo)簽?其他的標(biāo)簽為什么不可以?選擇標(biāo)簽有哪些誤區(qū)?
我們都知道有用戶基礎(chǔ)屬性的標(biāo)簽,也有用戶的各種行為標(biāo)簽,我們需要在這個(gè)大的框架下不斷細(xì)分完善標(biāo)簽體系。但是為什么要選擇這些標(biāo)簽,比如用戶的購(gòu)買(mǎi)行為標(biāo)簽中,為什么選擇新、老用戶這個(gè)標(biāo)簽?zāi)兀恳驗(yàn)槲覀兊牡赇佱槍?duì)未消費(fèi)的新用戶會(huì)有新人紅包進(jìn)行引導(dǎo)消費(fèi),所以要區(qū)分新老。對(duì)于老用戶,我們?yōu)槭裁匆x擇最近一次購(gòu)買(mǎi)時(shí)間,購(gòu)買(mǎi)頻次和交易金額作為標(biāo)簽?zāi)??因?yàn)榭梢酝ㄟ^(guò)RFM對(duì)用戶價(jià)值進(jìn)行分層,進(jìn)而進(jìn)行精細(xì)化運(yùn)營(yíng)。
具體的標(biāo)簽體系搭建步驟我們會(huì)在第三部分中具體介紹,這里先不展開(kāi)。
不同標(biāo)簽將用戶劃分為不同的用戶群,但只有對(duì)不同的用戶群制定針對(duì)性的運(yùn)營(yíng)策略,用戶畫(huà)像才能落地有價(jià)值。
舉個(gè)栗子,在RFM模型中,有的同學(xué)不清楚用戶交易金額M如何確定閾值,進(jìn)而劃分為高和低呢?是消費(fèi)1000元算高還是10000元算高,有些同學(xué)因?yàn)檫@個(gè)糾結(jié)不已,為什么不反過(guò)來(lái)想呢?閾值設(shè)為1000或者2000我對(duì)應(yīng)策略是什么?如果沒(méi)有對(duì)應(yīng)的策略,我劃分了高低有何用處呢?這個(gè)時(shí)候不妨問(wèn)問(wèn)產(chǎn)品和運(yùn)營(yíng)的同學(xué),你會(huì)發(fā)現(xiàn)運(yùn)營(yíng)上為了促進(jìn)價(jià)格敏感的低客單價(jià)用戶有滿1000減200的滿減活動(dòng),對(duì)于購(gòu)買(mǎi)能力較強(qiáng)的金主爸爸,有滿2000送獨(dú)家定制的鉆石會(huì)員卡,可以享受超級(jí)VIP待遇,以終為始,這個(gè)時(shí)候用戶畫(huà)像是不是更容易落地了?
已經(jīng)明確了業(yè)務(wù)需求以及不同畫(huà)像用戶的對(duì)應(yīng)策略,下面就可以開(kāi)始用戶畫(huà)像
的構(gòu)建了,主要分為標(biāo)簽體系搭建和標(biāo)簽權(quán)重計(jì)算,簡(jiǎn)單來(lái)說(shuō),就是用哪些標(biāo)標(biāo)簽表征用戶,用戶在各個(gè)標(biāo)簽上的偏好程度如何。
理解用戶畫(huà)像,最直接的方式便是將畫(huà)像信息標(biāo)簽化。信息標(biāo)簽化是用戶畫(huà)像系統(tǒng)用信息化手段刻畫(huà)用戶全貌的手段,也是用戶畫(huà)像系統(tǒng)中最核心的環(huán)節(jié)之一。我們通過(guò)構(gòu)建豐富的標(biāo)簽,獲取相關(guān)的標(biāo)簽數(shù)據(jù),才能夠刻畫(huà)和洞察用戶的興趣和偏好。
1)標(biāo)簽體系的構(gòu)建方法
構(gòu)建標(biāo)簽體系的主要有兩種方法:
方法一:結(jié)構(gòu)體系化構(gòu)建(常用)。通過(guò)劃分標(biāo)簽類(lèi)別和維度,從刻畫(huà)用戶的完整維度出發(fā)構(gòu)建維度體系。這樣的劃分方式結(jié)構(gòu)清晰、邏輯性強(qiáng),能夠比較全面的梳理出所有的信息維度,但受限于實(shí)際數(shù)據(jù),落地較困難。
方法二:場(chǎng)景效果化構(gòu)建。結(jié)合人群定向的實(shí)際需求,通過(guò)用戶在不同行業(yè)領(lǐng)域或平臺(tái)上的行為記錄,對(duì)用戶的心理需求和傾向性進(jìn)行描述。這種方式目的性強(qiáng),人群定向也較為精準(zhǔn),容易跟實(shí)際應(yīng)用場(chǎng)景接軌,落地到具體的業(yè)務(wù)目標(biāo),跟實(shí)際數(shù)據(jù)結(jié)合較好,但標(biāo)簽會(huì)跟隨消費(fèi)趨勢(shì)、娛樂(lè)熱點(diǎn)等的變化波動(dòng)。
2)標(biāo)簽維度的設(shè)計(jì)思路
標(biāo)簽維度設(shè)計(jì)上不僅需要清晰直觀,還需要考慮多個(gè)場(chǎng)景化使用需求,同時(shí)兼顧多種產(chǎn)品運(yùn)營(yíng)需求及商業(yè)化投放需求。
標(biāo)簽設(shè)計(jì)上需要在了解業(yè)務(wù)方規(guī)劃前提下,對(duì)標(biāo)簽的使用上有前瞻性的設(shè)計(jì)。
畫(huà)像數(shù)據(jù)的來(lái)源一般有:用戶調(diào)研、用戶行為數(shù)據(jù)獲取、客戶端/服務(wù)端數(shù)據(jù)內(nèi)容上報(bào)、第三方數(shù)據(jù)平臺(tái)、基礎(chǔ)數(shù)據(jù)及爬取第三方數(shù)據(jù)等。
ps:此處需要特別關(guān)注以下兩個(gè)方面:
標(biāo)簽粒度:粒度過(guò)粗不利于運(yùn)營(yíng)使用推廣,很容易脫離業(yè)務(wù)本身,對(duì)行為數(shù)據(jù)進(jìn)行過(guò)度提煉造成信息丟失;而粒度過(guò)細(xì)則會(huì)導(dǎo)致標(biāo)簽覆蓋率過(guò)低、耦合運(yùn)營(yíng)業(yè)務(wù)推廣。
標(biāo)簽數(shù)據(jù):標(biāo)簽數(shù)據(jù)的獲取直接關(guān)系到實(shí)際使用價(jià)值,需要在可獲取的數(shù)據(jù)范圍內(nèi)進(jìn)行,擴(kuò)寬數(shù)據(jù)源難度較大,通常需要優(yōu)先進(jìn)行數(shù)據(jù)可行性的統(tǒng)計(jì)。
3)標(biāo)簽體系的基礎(chǔ)框架
不同業(yè)務(wù)的畫(huà)像標(biāo)簽體系并不相同,需要我們針對(duì)性的提煉出來(lái)。有一種比較簡(jiǎn)易的方式是:我們可以先找出一些通用類(lèi)畫(huà)像標(biāo)簽,然后再根據(jù)實(shí)際場(chǎng)景和需求補(bǔ)充業(yè)務(wù)類(lèi)畫(huà)像標(biāo)簽。這樣得到的標(biāo)簽體系會(huì)相對(duì)比較完整,也能夠隨業(yè)務(wù)變動(dòng)及時(shí)調(diào)整優(yōu)化。
通用類(lèi)畫(huà)像標(biāo)簽體系(參考):
業(yè)務(wù)類(lèi)畫(huà)像標(biāo)簽體系(以某電商公司為例,參考):
按照以上的框架將用戶畫(huà)像信息標(biāo)簽化,能更好的根據(jù)實(shí)際需求去獲取相關(guān)的用戶畫(huà)像數(shù)據(jù)。但是,需要注意的,產(chǎn)品用戶畫(huà)像的分析并不是要用到所有的標(biāo)簽數(shù)據(jù),并且越是完整的標(biāo)簽體系,落地是越是困難。而且,更大的難度在于如何精準(zhǔn)描述用戶特征。因?yàn)橹挥杏脩籼卣髅枋鲈骄珳?zhǔn),我們得到的用戶畫(huà)像才會(huì)越清晰,在實(shí)際應(yīng)用過(guò)程中的幫助越大。所以如何精確計(jì)算出用戶的標(biāo)簽的權(quán)重就成為重中之重。
用戶在不同標(biāo)簽上的偏好是通過(guò)權(quán)重來(lái)反映的,權(quán)重越高,說(shuō)明用戶在該標(biāo)簽上的偏好越強(qiáng),反之亦然。而且,這個(gè)權(quán)重會(huì)隨著時(shí)間變化而變化,標(biāo)簽權(quán)重的計(jì)算主要通過(guò)TF-IDF算法。
1)TF-IDF算法思想
用戶標(biāo)簽權(quán)重,是由該標(biāo)簽對(duì)用戶本身的重要性(TF-IDF權(quán)重)與該標(biāo)簽在業(yè)務(wù)上對(duì)用戶的重要性(業(yè)務(wù)權(quán)重)兩者共同決定的,
即:用戶標(biāo)簽權(quán)重 = 業(yè)務(wù)權(quán)重* TF-IDF權(quán)重。
TF-IDF權(quán)重是通過(guò)TF-IDF計(jì)算得到的,業(yè)務(wù)權(quán)重是通過(guò)用戶對(duì)標(biāo)簽的行為來(lái)決定的,
即:業(yè)務(wù)權(quán)重=行為類(lèi)型權(quán)重 * 行為次數(shù) * 時(shí)間衰減
2)簡(jiǎn)單理解
就是用戶對(duì)一個(gè)標(biāo)簽的重要程度,會(huì)用不同行為來(lái)表達(dá),不同的行為有不同的難度,比如:對(duì)于電商用戶的行為難度來(lái)說(shuō),支付>收藏加購(gòu)>分享>瀏覽>點(diǎn)擊。不同行為就會(huì)有不同的權(quán)重,行為越難代表越喜歡,權(quán)重越高,同理行為次數(shù)越多也代表越喜歡。
標(biāo)簽對(duì)這個(gè)用戶來(lái)說(shuō)越稀有代表越喜歡,喜歡程度會(huì)隨著時(shí)間的增加而逐漸降低,通過(guò)這個(gè)公式計(jì)算標(biāo)簽權(quán)重。
3)行為類(lèi)型權(quán)重
用戶瀏覽、點(diǎn)擊、搜索、收藏、分享、下單、購(gòu)買(mǎi)等不同行為對(duì)用戶而且有不同重要性,一般根據(jù)業(yè)務(wù)經(jīng)驗(yàn)或者使用層次分析法定義一個(gè)基本行為權(quán)重。
4)行為次數(shù)
這里的行為次數(shù)表示每一種行為的次數(shù)。
5)時(shí)間衰減
時(shí)間衰減是指用戶的行為會(huì)隨著時(shí)間的流逝,用戶偏好會(huì)不斷減弱。在建立與時(shí)間衰減相關(guān)的函數(shù)時(shí),我們可套用牛頓冷卻定律數(shù)學(xué)模型。
牛頓冷卻定律:較熱物體的溫度F(t)是隨著時(shí)間t的增長(zhǎng)而呈現(xiàn)指數(shù)型衰減,其溫度衰減公式為:
F(t)=T*exp(-α*t)。
T:初始溫度
α:衰減常數(shù)即冷卻系數(shù),是自己定義的數(shù)值,一般通過(guò)回歸可計(jì)算得出
t:時(shí)間間隔
冷卻系數(shù)如何計(jì)算呢?
冷卻系數(shù)是自己定義的數(shù)值,一般通過(guò)回歸可計(jì)算得出。例如:初始偏好設(shè)置為1,1天后的偏好為0.85,即 0.85=1*exp(-α*1),求得α=0.16,這個(gè)就是標(biāo)簽的冷卻系數(shù)。
在這里我們用Python語(yǔ)言來(lái)模擬一下這個(gè)冷卻曲線:
import numpy as np
import matplotlib.pyplot as plt
import math
t = np.arange(0,100)
plt.plot(t,1*np.ma.exp(-0.16*t))
plt.title('偏好度冷卻趨勢(shì)')
plt.ylabel('偏好度')
plt.xlabel('時(shí)間(天)')
plt.show()
6)舉個(gè)栗子
用戶“小美”,對(duì)于標(biāo)簽“口紅”的權(quán)重計(jì)算:假設(shè)我們之前定義冷卻系數(shù)α=0.16,基于業(yè)務(wù)經(jīng)驗(yàn)或通過(guò)層次分析法假設(shè)行為類(lèi)型權(quán)重:點(diǎn)擊(0.1)、瀏覽(0.2)、分享(0.5)、收藏加購(gòu)(0.6)、支付(0.9)。
小美的每日行為表:
2021-05-01:
2021-05-02:
2021-05-03:
用戶“小美”對(duì)標(biāo)簽“口紅”每天的權(quán)重:
2021-05-01:2*0.1+2*0.2+3*0.6+1*0.5+1*0.9=3.8
2021-05-02:3.8 *exp(-α*1)+1*0.1+1*0.2+2*0.6+1*0.5+0=5.06
2021-05-03:5.067718*exp(-α*1)= 4.32
這樣算下來(lái)是不是就很清晰了。
在初步形成了用戶畫(huà)像后,并不能直接交給運(yùn)營(yíng)、業(yè)務(wù)人員直接使用,還需要評(píng)估用戶畫(huà)像的準(zhǔn)確性,以及交付使用后不斷迭代用戶畫(huà)像,以獲得更加精準(zhǔn)的用戶畫(huà)像。
評(píng)估方式主要分為3種:邏輯驗(yàn)證、A/B test、用戶回訪。
邏輯驗(yàn)證:也叫做交叉驗(yàn)證,在完整的用戶畫(huà)像標(biāo)簽體系中,一些標(biāo)簽往往會(huì)存在一些相關(guān)性;比如用戶的累計(jì)在線時(shí)長(zhǎng)越長(zhǎng),訂單量通常會(huì)越高;比如購(gòu)買(mǎi)3C產(chǎn)品的用戶群中,男性用戶數(shù)通常大于女性用戶數(shù);另外,如果公司購(gòu)買(mǎi)了第三方機(jī)構(gòu)的數(shù)據(jù),也可用于交叉驗(yàn)證。
A/B test:也叫做灰度測(cè)試,以上述的忠誠(chéng)度為例,保證對(duì)照組、實(shí)驗(yàn)組的流量相同;對(duì)實(shí)驗(yàn)組的用戶,進(jìn)行提升忠誠(chéng)度的運(yùn)營(yíng)策略(促銷(xiāo)活動(dòng)、積分獎(jiǎng)勵(lì)等);如果實(shí)驗(yàn)組的用戶,忠誠(chéng)度相比對(duì)照組用戶,有一定提升,則可以認(rèn)為用戶畫(huà)像比較精確。
用戶回訪:最樸實(shí)的評(píng)估方法,比如用戶畫(huà)像系統(tǒng),定義了10萬(wàn)用戶為低忠誠(chéng)度用戶;此時(shí)從中隨機(jī)抽取1000人,交給客服,進(jìn)行回訪。根據(jù)回訪結(jié)果,判斷用戶畫(huà)像結(jié)果是否準(zhǔn)確;甚至可以對(duì)回訪結(jié)果進(jìn)行文本挖掘,形成詞云,查看消極詞的占比。
本文很長(zhǎng),所以最后還是要做個(gè)總結(jié),區(qū)別于其他文章單純闡述如何構(gòu)建用戶畫(huà)像,這篇文章系統(tǒng)而全面的分析了用戶畫(huà)像是什么?是否一定要搞?怎么搞?層層遞進(jìn)地說(shuō)明了:什么是用戶畫(huà)像?→ 什么場(chǎng)景會(huì)用到用戶畫(huà)像?→ 我們是不是真的需要用戶畫(huà)像?→ 用戶畫(huà)像怎么搞才能落地?→ 能落地的用戶畫(huà)像的構(gòu)建步驟 → 用戶畫(huà)像的效果評(píng)估&迭代。
希望我們?cè)谧鲇脩舢?huà)像的時(shí)候都能多問(wèn)幾個(gè)為什么?知道為什么要做遠(yuǎn)比知道怎么做更重要,只有這樣,才能做出落地且有價(jià)值的用戶畫(huà)像。
以上就是數(shù)據(jù)分析思維—用戶畫(huà)像部分的內(nèi)容,更多數(shù)據(jù)分析思維的文章持續(xù)更新中,敬請(qǐng)期待,如果覺(jué)得不錯(cuò),也歡迎分享~
-END-
本文為作者獨(dú)立觀點(diǎn),不代表鳥(niǎo)哥筆記立場(chǎng),未經(jīng)允許不得轉(zhuǎn)載。
《鳥(niǎo)哥筆記版權(quán)及免責(zé)申明》 如對(duì)文章、圖片、字體等版權(quán)有疑問(wèn),請(qǐng)點(diǎn)擊 反饋舉報(bào)
我們致力于提供一個(gè)高質(zhì)量?jī)?nèi)容的交流平臺(tái)。為落實(shí)國(guó)家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評(píng)論自律管理,為了保護(hù)用戶創(chuàng)造的內(nèi)容、維護(hù)開(kāi)放、真實(shí)、專(zhuān)業(yè)的平臺(tái)氛圍,我們團(tuán)隊(duì)將依據(jù)本公約中的條款對(duì)注冊(cè)用戶和發(fā)布在本平臺(tái)的內(nèi)容進(jìn)行管理。平臺(tái)鼓勵(lì)用戶創(chuàng)作、發(fā)布優(yōu)質(zhì)內(nèi)容,同時(shí)也將采取必要措施管理違法、侵權(quán)或有其他不良影響的網(wǎng)絡(luò)信息。
一、根據(jù)《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國(guó)未成年人保護(hù)法》等法律法規(guī),對(duì)以下違法、不良信息或存在危害的行為進(jìn)行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
1)反對(duì)憲法所確定的基本原則;
2)危害國(guó)家安全,泄露國(guó)家秘密,顛覆國(guó)家政權(quán),破壞國(guó)家統(tǒng)一,損害國(guó)家榮譽(yù)和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽(yù)、榮譽(yù);
4)宣揚(yáng)恐怖主義、極端主義或者煽動(dòng)實(shí)施恐怖活動(dòng)、極端主義活動(dòng);
5)煽動(dòng)民族仇恨、民族歧視,破壞民族團(tuán)結(jié);
6)破壞國(guó)家宗教政策,宣揚(yáng)邪教和封建迷信;
7)散布謠言,擾亂社會(huì)秩序,破壞社會(huì)穩(wěn)定;
8)宣揚(yáng)淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動(dòng)非法集會(huì)、結(jié)社、游行、示威、聚眾擾亂社會(huì)秩序;
10)侮辱或者誹謗他人,侵害他人名譽(yù)、隱私和其他合法權(quán)益;
11)通過(guò)網(wǎng)絡(luò)以文字、圖片、音視頻等形式,對(duì)未成年人實(shí)施侮辱、誹謗、威脅或者惡意損害未成年人形象進(jìn)行網(wǎng)絡(luò)欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內(nèi)容;
2. 不友善:不尊重用戶及其所貢獻(xiàn)內(nèi)容的信息或行為。主要表現(xiàn)為:
1)輕蔑:貶低、輕視他人及其勞動(dòng)成果;
2)誹謗:捏造、散布虛假事實(shí),損害他人名譽(yù);
3)嘲諷:以比喻、夸張、侮辱性的手法對(duì)他人或其行為進(jìn)行揭露或描述,以此來(lái)激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對(duì)方對(duì)自己的言論作出回應(yīng),蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對(duì)方難堪;
6)謾罵:以不文明的語(yǔ)言對(duì)他人進(jìn)行負(fù)面評(píng)價(jià);
7)歧視:煽動(dòng)人群歧視、地域歧視等,針對(duì)他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類(lèi)的攻擊;
8)威脅:許諾以不良的后果來(lái)迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗(yàn)、擾亂本網(wǎng)站秩序的內(nèi)容,或進(jìn)行相關(guān)行為。主要表現(xiàn)為:
1)多次發(fā)布包含售賣(mài)產(chǎn)品、提供服務(wù)、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
2)單個(gè)帳號(hào)多次發(fā)布包含垃圾廣告的內(nèi)容;
3)多個(gè)廣告帳號(hào)互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉(zhuǎn)網(wǎng)站等,誘騙用戶點(diǎn)擊鏈接
5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當(dāng)曝光;
6)購(gòu)買(mǎi)或出售帳號(hào)之間虛假地互動(dòng),發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關(guān)交易。
7)發(fā)布包含欺騙性的惡意營(yíng)銷(xiāo)內(nèi)容,如通過(guò)偽造經(jīng)歷、冒充他人等方式進(jìn)行惡意營(yíng)銷(xiāo);
8)使用特殊符號(hào)、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。
4. 色情低俗信息,主要表現(xiàn)為:
1)包含自己或他人性經(jīng)驗(yàn)的細(xì)節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內(nèi)容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚(yáng)低俗、庸俗、媚俗內(nèi)容。
5. 不實(shí)信息,主要表現(xiàn)為:
1)可能存在事實(shí)性錯(cuò)誤或者造謠等內(nèi)容;
2)存在事實(shí)夸大、偽造虛假經(jīng)歷等誤導(dǎo)他人的內(nèi)容;
3)偽造身份、冒充他人,通過(guò)頭像、用戶名等個(gè)人信息暗示自己具有特定身份,或與特定機(jī)構(gòu)或個(gè)人存在關(guān)聯(lián)。
6. 傳播封建迷信,主要表現(xiàn)為:
1)找人算命、測(cè)字、占卜、解夢(mèng)、化解厄運(yùn)、使用迷信方式治?。?br /> 2)求推薦算命看相大師;
3)針對(duì)具體風(fēng)水等問(wèn)題進(jìn)行求助或咨詢;
4)問(wèn)自己或他人的八字、六爻、星盤(pán)、手相、面相、五行缺失,包括通過(guò)占卜方法問(wèn)婚姻、前程、運(yùn)勢(shì),東西寵物丟了能不能找回、取名改名等;
7. 文章標(biāo)題黨,主要表現(xiàn)為:
1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來(lái)誘導(dǎo)用戶;
2)內(nèi)容與標(biāo)題之間存在嚴(yán)重不實(shí)或者原意扭曲;
3)使用夸張標(biāo)題,內(nèi)容與標(biāo)題嚴(yán)重不符的。
8.「飯圈」亂象行為,主要表現(xiàn)為:
1)誘導(dǎo)未成年人應(yīng)援集資、高額消費(fèi)、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動(dòng)「飯圈」粉絲攀比炫富、奢靡享樂(lè)等行為
4)以號(hào)召粉絲、雇用網(wǎng)絡(luò)水軍、「養(yǎng)號(hào)」形式刷量控評(píng)等行為
5)通過(guò)「蹭熱點(diǎn)」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會(huì)公德行為、誘導(dǎo)未成年人不良嗜好影響未成年人身心健康的;
2)不當(dāng)評(píng)述自然災(zāi)害、重大事故等災(zāi)難的;
3)美化、粉飾侵略戰(zhàn)爭(zhēng)行為的;
4)法律、行政法規(guī)禁止,或可能對(duì)網(wǎng)絡(luò)生態(tài)造成不良影響的其他內(nèi)容。
二、違規(guī)處罰
本網(wǎng)站通過(guò)主動(dòng)發(fā)現(xiàn)和接受用戶舉報(bào)兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質(zhì)量、傷害平臺(tái)氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當(dāng)一個(gè)用戶發(fā)布違規(guī)內(nèi)容時(shí),本網(wǎng)站將依據(jù)相關(guān)用戶違規(guī)情節(jié)嚴(yán)重程度,對(duì)帳號(hào)進(jìn)行禁言 1 天、7 天、15 天直至永久禁言或封停賬號(hào)的處罰。當(dāng)涉及欺凌未成年人、危害未成年人身心健康、通過(guò)作弊手段注冊(cè)、使用帳號(hào),或者濫用多個(gè)帳號(hào)發(fā)布違規(guī)內(nèi)容時(shí),本網(wǎng)站將加重處罰。
三、申訴
隨著平臺(tái)管理經(jīng)驗(yàn)的不斷豐富,本網(wǎng)站出于維護(hù)本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對(duì)本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過(guò)「建議反饋」功能向本網(wǎng)站進(jìn)行反饋。
(規(guī)則的最終解釋權(quán)歸屬本網(wǎng)站所有)