很可惜 T 。T 您現(xiàn)在還不是作者身份,不能自主發(fā)稿哦~
如有投稿需求,請把文章發(fā)送到郵箱tougao@appcpx.com,一經(jīng)錄用會有專人和您聯(lián)系
咨詢?nèi)绾纬蔀榇河鹱髡哒埪?lián)系:鳥哥筆記小羽毛(ngbjxym)
現(xiàn)階段,許多企業(yè)嘗試落地 CDP,但卻很難在短期內(nèi)看到應(yīng)有的 ROI 成效,初始投入與后期產(chǎn)出不對稱,這嚴(yán)重打擊了企業(yè)建設(shè) CDP 的信心。在中國數(shù)據(jù)市場,企業(yè) CDP 項(xiàng)目的重要關(guān)注點(diǎn)聚焦在數(shù)據(jù)治理上,致力于通過構(gòu)建 CDP,打破數(shù)據(jù)割裂、上下游系統(tǒng)數(shù)據(jù)口徑不一致、數(shù)據(jù)污染等困境,統(tǒng)一用戶數(shù)據(jù)標(biāo)識是企業(yè) CDP 數(shù)據(jù)體系建設(shè)的關(guān)鍵問題。
《CDP 全域用戶關(guān)聯(lián)數(shù)據(jù)體系建設(shè)與實(shí)踐》白皮書中提到,企業(yè)要想真正落地 CDP 項(xiàng)目并產(chǎn)生業(yè)務(wù)價(jià)值,其用戶數(shù)據(jù)體系建設(shè)的終極目標(biāo)是全域用戶的標(biāo)識唯一化,即把來自不同渠道、生態(tài)、業(yè)務(wù)系統(tǒng)的用戶標(biāo)識為同一個(gè)對象。本文將詳細(xì)介紹企業(yè)如何通過全域用戶關(guān)聯(lián)實(shí)現(xiàn)用戶標(biāo)識唯一化,整體可概括為以下五個(gè)步驟。
如何從零開始開展 CDP 的用戶數(shù)據(jù)基礎(chǔ)建設(shè)?企業(yè)的首要任務(wù)是理清 CDP 上下游的數(shù)據(jù)情況,以用戶為主體梳理數(shù)據(jù)應(yīng)用場景,比如業(yè)務(wù)數(shù)據(jù)如何收集、用戶數(shù)據(jù)在什么情況下輸出、用戶觸達(dá)場景有哪些等。全域用戶關(guān)聯(lián)作為 CDP 系統(tǒng)的基礎(chǔ)能力支撐,會對上游數(shù)據(jù)的收集以及下游業(yè)務(wù)系統(tǒng)造成影響,所以在方案設(shè)計(jì)之初需要盡可能對上下游相關(guān)的數(shù)據(jù)現(xiàn)狀進(jìn)行盤點(diǎn)。
典型的數(shù)據(jù)現(xiàn)狀盤點(diǎn)流程包括:
1、數(shù)據(jù)源梳理:梳理各業(yè)務(wù)線涉及到的業(yè)務(wù)系統(tǒng)。
2、用戶主體 ID 梳理:梳理各業(yè)務(wù)系統(tǒng)中用于標(biāo)記用戶主體和數(shù)據(jù)相關(guān)的 ID,比如設(shè)備 ID、企 微 ID、Union ID、Open ID、Cookie ID 等。
3、用戶屬性梳理:梳理各業(yè)務(wù)系統(tǒng)中用戶標(biāo)識 ID 對應(yīng)的數(shù)據(jù)屬性,業(yè)務(wù) ID 對應(yīng)的用戶業(yè)務(wù)屬性有卡號、身份、微信號、手機(jī)號等。
4、識別用戶標(biāo)識數(shù)據(jù)在源端存儲的質(zhì)量:例如在數(shù)據(jù)梳理的過程會發(fā)現(xiàn)一個(gè)手機(jī)號對應(yīng)多個(gè)證件號,這時(shí)候需要對數(shù)據(jù)源產(chǎn)生的原因進(jìn)行分析,找到異常數(shù)據(jù)產(chǎn)生的原因,如何在用戶關(guān)聯(lián)過程中處理。
5、ID 應(yīng)用場景梳理:梳理圍繞 CDP 應(yīng)用的整個(gè)業(yè)務(wù)流程中,涉及用戶 ID 應(yīng)用的典型場景,比如 CDP 全域數(shù)據(jù)接入場景、用戶分群數(shù)據(jù)輸出場景等。
輸出用戶 ID 關(guān)聯(lián)方案的首要步驟是明確各業(yè)務(wù)線中哪些 ID 參與用戶的關(guān)聯(lián),并確定 ID 的優(yōu)先級、數(shù)量、父節(jié)點(diǎn)等信息。
1、ID 優(yōu)先級:優(yōu)先級的設(shè)定是為了解決當(dāng)一條數(shù)據(jù)中有多個(gè) ID,又無法關(guān)聯(lián)時(shí),數(shù)據(jù)歸屬的問題。按照設(shè)定,數(shù)據(jù)會歸屬優(yōu)先級更高的 ID 所對應(yīng)的用戶。
2、業(yè)務(wù)唯一 ID:系統(tǒng)中唯一標(biāo)識一個(gè)用戶的 ID 類型,其優(yōu)先級最高。以電商業(yè)務(wù)為例,用戶的登錄 ID 由于和用戶購物等行為直接產(chǎn)生關(guān)聯(lián)且可以通過很多途徑獲取到,往往可以作為「業(yè)務(wù)唯一 ID」來定義。
3、數(shù)量:取決于實(shí)際業(yè)務(wù)中一個(gè)用戶可以擁有單個(gè)還是多個(gè)該類型的 ID,可以用來校驗(yàn)關(guān)聯(lián)關(guān)系是否符合規(guī)則。
4、父節(jié)點(diǎn):在一些業(yè)務(wù)生態(tài)中,ID 之間存在著父子關(guān)系。父節(jié)點(diǎn)的定義可以用于解綁時(shí)一并解綁子節(jié)點(diǎn),比如在微信生態(tài)中,Union ID 是 Open ID 的父節(jié)點(diǎn),如果要將 Union ID 進(jìn)行解綁,則附屬的所有 Open ID 也將隨之被解綁掉。
完整梳理 ID 之后,就可以針對性地采用埋點(diǎn)、ETL 等方式,完成用戶關(guān)聯(lián)的持續(xù)落地了。通俗來講,就是明確將哪些業(yè)務(wù)系統(tǒng)中的哪些數(shù)據(jù)提取出來再導(dǎo)入 CDP 系統(tǒng)中。業(yè)務(wù)中每一個(gè)事件對應(yīng)的屬性和涉及的 ID 都需要在埋點(diǎn)和 ETL 方案中體現(xiàn),可以大大減少技術(shù)人員的理解成本。
完成全域用戶關(guān)聯(lián)后,會在用戶數(shù)據(jù)中發(fā)現(xiàn)歷史關(guān)聯(lián)錯(cuò)誤的數(shù)據(jù)。根據(jù)新的關(guān)聯(lián)結(jié)果,需要對這些錯(cuò)誤數(shù)據(jù)進(jìn)行解綁并綁定至正確的歸屬用戶,重新完善用戶全生命周期畫像,從而提升 CDP 的用戶數(shù)據(jù)質(zhì)量。
舉例來說,在用戶關(guān)聯(lián)過程中,基于同一個(gè)用戶的唯一昵稱「A」同時(shí)對應(yīng)兩個(gè)用戶「張三 2020 年注冊」「李四 2021 年注冊」,由此識別為同一個(gè)用戶,需要對重復(fù)關(guān)聯(lián)數(shù)據(jù)進(jìn)行合并。在這種情況下,可以參考最早觸達(dá)用戶的時(shí)間來完成用戶屬性的修復(fù):「張三」2020 年注冊早于「李四」2021 年注冊,因此選擇將數(shù)據(jù)關(guān)聯(lián)至「張三」下。
同理,當(dāng)歷史數(shù)據(jù)中存在其他類似的「唯一用戶 ID」并與當(dāng)前產(chǎn)生沖突時(shí),需要根據(jù)時(shí)間先后順序,將兩個(gè)「唯一用戶 ID」進(jìn)行合并,完成數(shù)據(jù)關(guān)聯(lián)的回溯。
企業(yè)在進(jìn)行用戶 ID 關(guān)聯(lián)的過程中,會遇到用戶關(guān)聯(lián)同類屬性沖突的情況,在進(jìn)行屬性合并的過程中,可以遵循以下四個(gè)規(guī)則:
第一,預(yù)置規(guī)則:特殊類型屬性使用固定的預(yù)置規(guī)則來處理,比如按照訪問時(shí)間先后順序進(jìn)行屬性合并。
第二,缺省規(guī)則:默認(rèn)以數(shù)據(jù)生成最早的時(shí)間為準(zhǔn),如果沒有數(shù)據(jù)生成時(shí)間的相關(guān)字段就按照 ID 的優(yōu)先級進(jìn)行合并。
第三,設(shè)置基準(zhǔn)規(guī)則:設(shè)置某個(gè)來源的數(shù)據(jù)為基準(zhǔn),例如相比 CRM 銷售人員手動錄入的信息數(shù)據(jù)和業(yè)務(wù)系統(tǒng)自動獲取的訂單數(shù)據(jù),訂單數(shù)據(jù)的準(zhǔn)確性和穩(wěn)定性顯然更高,則選擇以業(yè)務(wù)系統(tǒng)訂單數(shù)據(jù)為基準(zhǔn)。
第四,設(shè)置首末次規(guī)則:以最先接入數(shù)據(jù)的屬性為準(zhǔn)或者保持最末次的屬性。
日常業(yè)務(wù)中會出現(xiàn)當(dāng)前用戶關(guān)聯(lián)信息錯(cuò)誤的情況,比如,用戶更換手機(jī)導(dǎo)致設(shè)備 ID 變更等,這種情況就需要將現(xiàn)有的綁定關(guān)系解綁;另一方面,我們也發(fā)現(xiàn),曾經(jīng)認(rèn)為某個(gè) ID 和用戶不相關(guān),但后來經(jīng)過人工等方式確認(rèn)兩者是相關(guān)的,這種情況就需要能夠在自動關(guān)聯(lián)未成功的情況下,以手動的方式將一個(gè)獨(dú)立 ID 關(guān)聯(lián)到現(xiàn)有用戶上去。
以神策數(shù)據(jù)的 ID-Mapping 全域用戶關(guān)聯(lián)為例,數(shù)據(jù)校驗(yàn)及測試驗(yàn)收整體可以分為五個(gè)部分:
1、用戶關(guān)聯(lián)是否成功
完成全域用戶關(guān)聯(lián)的部署之后,首先應(yīng)檢查對應(yīng)埋點(diǎn)方案的上報(bào)邏輯是否生效,比如,搜索埋點(diǎn)方案中設(shè)計(jì)的對應(yīng)事件是否正常存在。
2、用戶關(guān)聯(lián)全端執(zhí)行情況
確認(rèn)事件上報(bào)后,可以基于埋點(diǎn)事件確認(rèn)不同 SDK 類型上報(bào)的關(guān)聯(lián) ID/綁定 ID 的總次數(shù)。在前后端都調(diào)用的情況下,如果不同 SDK 間上報(bào)次數(shù)相差很多,則需要排查調(diào)用時(shí)機(jī)是否出了問題。
3、用戶關(guān)聯(lián)報(bào)錯(cuò)校驗(yàn)
這一步驟旨在確認(rèn)事件上報(bào)的準(zhǔn)確性,使用 ID-Mapping 可以在「神策數(shù)據(jù)治理」→「數(shù)據(jù)質(zhì)量」→「埋點(diǎn)數(shù)據(jù)查詢」過程中,查看是否有大量用戶關(guān)聯(lián)的報(bào)錯(cuò),并確認(rèn)錯(cuò)誤數(shù)據(jù)量、錯(cuò)誤分類、錯(cuò)誤原因等細(xì)節(jié)信息。
4、ID 格式校驗(yàn)
檢查業(yè)務(wù) ID 的格式、長度等是否符合預(yù)期。一般來說,業(yè)務(wù) ID 都會有相對固定的格式或長度,例如手機(jī)號一般都是 11 位,微信生態(tài)的 Union ID 和 Open ID 也都有固定的長度,驗(yàn)收人員可以使用 SQL 檢查是否有不符合預(yù)期的數(shù)據(jù)。
5、ID 關(guān)聯(lián)情況排查
一般可以分為三種情況:
第一,只有登錄 ID 的用戶:此類用戶的特征是業(yè)務(wù)意義上的登錄 ID 有值,其他 ID 均為空。查詢只有登錄 ID 用戶的數(shù)量占比,如果發(fā)現(xiàn)此類用戶占比過高,則可以推斷出用戶關(guān)聯(lián)可能出現(xiàn)問題,登錄用戶沒有與其他觸點(diǎn)的 ID 成功關(guān)聯(lián)上。
第二,只有某個(gè)特定觸點(diǎn)相關(guān) ID 的用戶:例如只有微信生態(tài) Union ID 或 Open ID 的用戶,其他業(yè)務(wù) ID 均為空。如果此類用戶占比過高,則表示該觸點(diǎn)可能沒有與其他觸點(diǎn)打通。
第三,只有設(shè)備 ID 的用戶:例如發(fā)現(xiàn)用戶表中存在大量只用 Android_id 的用戶,則標(biāo)明對應(yīng) Android 的用戶關(guān)聯(lián)可能沒有做。
從業(yè)務(wù)邏輯上來說,一個(gè)用戶肯定是先有 xxx ID 再有 yyy ID,對此類用戶關(guān)聯(lián)情況進(jìn)行排查時(shí),可以進(jìn)行 SQL 查詢,如果查詢結(jié)果不符合業(yè)務(wù)邏輯,則需要進(jìn)一步排查是否確實(shí)沒有實(shí)現(xiàn)關(guān)聯(lián)的用戶,還是用戶關(guān)聯(lián)出現(xiàn)了問題,或者 ID 數(shù)據(jù)本身存在錯(cuò)誤。
本文為作者獨(dú)立觀點(diǎn),不代表鳥哥筆記立場,未經(jīng)允許不得轉(zhuǎn)載。
《鳥哥筆記版權(quán)及免責(zé)申明》 如對文章、圖片、字體等版權(quán)有疑問,請點(diǎn)擊 反饋舉報(bào)
我們致力于提供一個(gè)高質(zhì)量內(nèi)容的交流平臺。為落實(shí)國家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評論自律管理,為了保護(hù)用戶創(chuàng)造的內(nèi)容、維護(hù)開放、真實(shí)、專業(yè)的平臺氛圍,我們團(tuán)隊(duì)將依據(jù)本公約中的條款對注冊用戶和發(fā)布在本平臺的內(nèi)容進(jìn)行管理。平臺鼓勵(lì)用戶創(chuàng)作、發(fā)布優(yōu)質(zhì)內(nèi)容,同時(shí)也將采取必要措施管理違法、侵權(quán)或有其他不良影響的網(wǎng)絡(luò)信息。
一、根據(jù)《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護(hù)法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進(jìn)行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
1)反對憲法所確定的基本原則;
2)危害國家安全,泄露國家秘密,顛覆國家政權(quán),破壞國家統(tǒng)一,損害國家榮譽(yù)和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽(yù)、榮譽(yù);
4)宣揚(yáng)恐怖主義、極端主義或者煽動實(shí)施恐怖活動、極端主義活動;
5)煽動民族仇恨、民族歧視,破壞民族團(tuán)結(jié);
6)破壞國家宗教政策,宣揚(yáng)邪教和封建迷信;
7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
8)宣揚(yáng)淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動非法集會、結(jié)社、游行、示威、聚眾擾亂社會秩序;
10)侮辱或者誹謗他人,侵害他人名譽(yù)、隱私和其他合法權(quán)益;
11)通過網(wǎng)絡(luò)以文字、圖片、音視頻等形式,對未成年人實(shí)施侮辱、誹謗、威脅或者惡意損害未成年人形象進(jìn)行網(wǎng)絡(luò)欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內(nèi)容;
2. 不友善:不尊重用戶及其所貢獻(xiàn)內(nèi)容的信息或行為。主要表現(xiàn)為:
1)輕蔑:貶低、輕視他人及其勞動成果;
2)誹謗:捏造、散布虛假事實(shí),損害他人名譽(yù);
3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進(jìn)行揭露或描述,以此來激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應(yīng),蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
6)謾罵:以不文明的語言對他人進(jìn)行負(fù)面評價(jià);
7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗(yàn)、擾亂本網(wǎng)站秩序的內(nèi)容,或進(jìn)行相關(guān)行為。主要表現(xiàn)為:
1)多次發(fā)布包含售賣產(chǎn)品、提供服務(wù)、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
2)單個(gè)帳號多次發(fā)布包含垃圾廣告的內(nèi)容;
3)多個(gè)廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉(zhuǎn)網(wǎng)站等,誘騙用戶點(diǎn)擊鏈接
5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當(dāng)曝光;
6)購買或出售帳號之間虛假地互動,發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關(guān)交易。
7)發(fā)布包含欺騙性的惡意營銷內(nèi)容,如通過偽造經(jīng)歷、冒充他人等方式進(jìn)行惡意營銷;
8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。
4. 色情低俗信息,主要表現(xiàn)為:
1)包含自己或他人性經(jīng)驗(yàn)的細(xì)節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內(nèi)容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚(yáng)低俗、庸俗、媚俗內(nèi)容。
5. 不實(shí)信息,主要表現(xiàn)為:
1)可能存在事實(shí)性錯(cuò)誤或者造謠等內(nèi)容;
2)存在事實(shí)夸大、偽造虛假經(jīng)歷等誤導(dǎo)他人的內(nèi)容;
3)偽造身份、冒充他人,通過頭像、用戶名等個(gè)人信息暗示自己具有特定身份,或與特定機(jī)構(gòu)或個(gè)人存在關(guān)聯(lián)。
6. 傳播封建迷信,主要表現(xiàn)為:
1)找人算命、測字、占卜、解夢、化解厄運(yùn)、使用迷信方式治病;
2)求推薦算命看相大師;
3)針對具體風(fēng)水等問題進(jìn)行求助或咨詢;
4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運(yùn)勢,東西寵物丟了能不能找回、取名改名等;
7. 文章標(biāo)題黨,主要表現(xiàn)為:
1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來誘導(dǎo)用戶;
2)內(nèi)容與標(biāo)題之間存在嚴(yán)重不實(shí)或者原意扭曲;
3)使用夸張標(biāo)題,內(nèi)容與標(biāo)題嚴(yán)重不符的。
8.「飯圈」亂象行為,主要表現(xiàn)為:
1)誘導(dǎo)未成年人應(yīng)援集資、高額消費(fèi)、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
4)以號召粉絲、雇用網(wǎng)絡(luò)水軍、「養(yǎng)號」形式刷量控評等行為
5)通過「蹭熱點(diǎn)」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導(dǎo)未成年人不良嗜好影響未成年人身心健康的;
2)不當(dāng)評述自然災(zāi)害、重大事故等災(zāi)難的;
3)美化、粉飾侵略戰(zhàn)爭行為的;
4)法律、行政法規(guī)禁止,或可能對網(wǎng)絡(luò)生態(tài)造成不良影響的其他內(nèi)容。
二、違規(guī)處罰
本網(wǎng)站通過主動發(fā)現(xiàn)和接受用戶舉報(bào)兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質(zhì)量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當(dāng)一個(gè)用戶發(fā)布違規(guī)內(nèi)容時(shí),本網(wǎng)站將依據(jù)相關(guān)用戶違規(guī)情節(jié)嚴(yán)重程度,對帳號進(jìn)行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當(dāng)涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個(gè)帳號發(fā)布違規(guī)內(nèi)容時(shí),本網(wǎng)站將加重處罰。
三、申訴
隨著平臺管理經(jīng)驗(yàn)的不斷豐富,本網(wǎng)站出于維護(hù)本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網(wǎng)站進(jìn)行反饋。
(規(guī)則的最終解釋權(quán)歸屬本網(wǎng)站所有)