很可惜 T 。T 您現(xiàn)在還不是作者身份,不能自主發(fā)稿哦~
如有投稿需求,請把文章發(fā)送到郵箱tougao@appcpx.com,一經(jīng)錄用會有專人和您聯(lián)系
咨詢?nèi)绾纬蔀榇河鹱髡哒埪?lián)系:鳥哥筆記小羽毛(ngbjxym)
作者介紹:前網(wǎng)易出口大數(shù)據(jù)產(chǎn)品經(jīng)理一枚,負責過數(shù)據(jù)采集、bi系統(tǒng)、ab測試、畫像平臺等應用層平臺搭建。
如今互聯(lián)網(wǎng)人對于數(shù)據(jù)的使用可畏常態(tài)化,雖然有的是日常工作,有的只是幾次需求,但無論對與數(shù)據(jù)有多少依賴,在數(shù)據(jù)的使用或解讀上,以下情況大家應該都會遇到一二。
1)團隊來了一位新同學,想分析某個功能的數(shù)據(jù)情況,但感覺無從下手。便問老員工這個功能對應的埋點,那個頁面對應的參數(shù),得到的不是口口相傳就是看著聊天記錄中的文檔地址,面對著黑壓壓一片的埋點信息,內(nèi)心估計已經(jīng)開始神獸奔騰了;
2)新版本上線后進行效果分析,發(fā)現(xiàn)埋點出現(xiàn)紕漏,此時若是重要數(shù)據(jù),需要緊急找人發(fā)版,時間緊張又擔驚受怕;若此時是一般數(shù)據(jù),開發(fā)同學的回復大概率是:“和下個版一起迭代”,時隔半年一年再進行分析,這段數(shù)據(jù)波動的原因估計也沒人能說清了;
3)測試同學拿著協(xié)作的埋點文檔,測試過程中發(fā)現(xiàn)不是字段對應錯誤就是信息維護不全,解讀起來麻煩不說,如果碰到大版本還需要進行埋點回歸,不僅測試過程中工作量大,還有漏測的風險。
埋點數(shù)據(jù)作為日常數(shù)據(jù)最重要的三大來源之一(包括業(yè)務數(shù)據(jù)和對外合作數(shù)據(jù)),其重要性不言而喻。上能影響推薦、ab實驗、數(shù)據(jù)分析的準確;下能影響倉庫的結(jié)構(gòu)設(shè)計和日常維護成本。當前數(shù)據(jù)更是作為資產(chǎn)被各家公司所重視。想象一下到年終盤點時,面對一團“剪不斷,理還亂”的數(shù)據(jù),會是一種什么心情。
筆者通過對最近接手的埋點質(zhì)量項目的一些經(jīng)驗總結(jié),希望通過這篇文章給大家分享一下心得體會。
埋點過程整體鏈路環(huán)節(jié)較長,囊括的角色也相對較多。出了問題排查難度大,周期長,而且涉及團隊配合問題也不好把控,下面我們來總結(jié)一下哪些環(huán)節(jié)容易出問題導致埋點質(zhì)量問題.
如果在數(shù)據(jù)產(chǎn)出階段不進行把控,等到了應用階段就會出現(xiàn):數(shù)據(jù)不完整、數(shù)據(jù)重復、數(shù)據(jù)不一致、數(shù)據(jù)不匹配等數(shù)據(jù)問題,所以解決埋點質(zhì)量問題要做到“預防為主、防治結(jié)合、綜合治理”的方針,下面我們來看下如何進行埋點質(zhì)量管理。
要開展埋點質(zhì)量的管理,筆者認為可以從以下三個角度開始執(zhí)行:意識、制度&流程、工具。
這里所謂的意識更多的是一種價值觀、信念或者說是一種行為“動機”。是每個同學做事對自我要求的一項軟性標準,類似于“道德”,可能讀到這大家覺得有些浮夸,怎么管理個埋點都上升到道德層面了。別著急,繼續(xù)往下看~
對于執(zhí)行層,無論是分析師或埋點產(chǎn)品必須要對出自自己手中的需求要負責,時刻意識到,埋點需求是整條數(shù)據(jù)鏈路的源頭,并且用戶實時發(fā)生數(shù)據(jù)擁有著不可回溯性。如果要是從源頭開始“錯、缺、亂”,那后續(xù)的環(huán)節(jié)不僅增加了成本,同時這部分數(shù)據(jù)也“白白流失”了。
而對于高層管理者在任職期間要適當?shù)慕o予數(shù)據(jù)治理一些側(cè)重,無論是在人力上還是時間上。讓自己或自己的上級領(lǐng)導提升一些基礎(chǔ)建設(shè)的意識,磨刀不一定會誤砍柴功。用產(chǎn)品進行向上管理固然重要,畢竟是一個看的見、用得到并且能“體會”價值的載體。
如果只在乎表面光鮮,那背后的“千瘡百孔”要何時才能有機會修補。任何一個組織創(chuàng)建時都需要有一個文化或者信念,在做事的時候可以時刻提醒自己。所以在質(zhì)量管理的第一個重要角度是意識。
上面講述了意識層面上的統(tǒng)一,下面開始說的就是行為上的規(guī)范。所謂無規(guī)矩不成方圓,任何一件事有一個良好的規(guī)范去執(zhí)行,那出錯的概率就會比每個人自由發(fā)揮低很多。這里所說的制度包括兩個方面:角色流程和采集規(guī)范。
埋點從需求產(chǎn)出開始要經(jīng)歷:埋點開發(fā)、數(shù)據(jù)上報、數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)入庫最終到業(yè)務應用,涉及的人員包括埋點產(chǎn)品&分析師、開發(fā)、測試、采集工程師、倉庫工程師等。
各個環(huán)節(jié)能有機組合就需要一個良好的配合制度,既能保證工作有條不紊,同時又避免了權(quán)責混亂導致的問題無法及時響應。以下有個簡短的配合流程可以簡單作為參考:
a) 文檔規(guī)范
文檔規(guī)范要求負責埋點的同學列清相關(guān)需求點,包括:所需要的事件信息、統(tǒng)計位置、打點邏輯、上報時機。甚至還可能有失敗后如何處理、失敗原因、變更歷史等相關(guān)內(nèi)容,細化的需求文檔有利于降低其他環(huán)節(jié)同學的理解偏差,也便于埋點使用時了解前因后果及錯誤信息。
b) 接入規(guī)范
是指業(yè)務開發(fā)同學在使用埋點組件時要嚴格遵守組件方提供sdk的使用規(guī)則,例如通用事件內(nèi)擴展字段的埋點位置、上報時機等。切不可根據(jù)“自我經(jīng)驗”進行更改優(yōu)化。
c) 命名規(guī)范
命名規(guī)范適用于埋點信息的命名,包括事件id、事件參數(shù)以及實際的參數(shù)值,做到以下原則:
方便解讀
不要有特殊字符,不要采用系統(tǒng)關(guān)鍵字或預置關(guān)鍵字進行命名
字段不易過長
版本前后字段映射統(tǒng)一等
無法挨個維護的的參數(shù)值可以采用spm或scm模型來制定采集規(guī)范。
spm叫超級位置模型,最早是受到土地戶籍制度啟發(fā)而設(shè)計的位置系統(tǒng),目的應用于頁面的統(tǒng)計、追蹤頁面的來源等場景,通常在埋點時作為埋點參數(shù)上報到數(shù)據(jù)后臺。其編碼形式采用A.B.C.D四層級進行組合,分別代表了業(yè)務、頁面、頁面區(qū)塊、區(qū)塊內(nèi)的點位,
我們以小紅書的商城首頁舉例:
業(yè)務:商城(shop_center)
頁面:首頁(home_page)
頁面區(qū)塊:變美季(beauty)
區(qū)塊內(nèi)點位:3
spm模型命名澳大利亞·秋冬必備神級修復的位置內(nèi)容就可以寫成:shop_center.home_page.beauty.3
在統(tǒng)計數(shù)據(jù)時可以通過該參數(shù)知道這個模塊的位置的流量大小情況。
scm叫超級內(nèi)容模型,用來標識唯一一塊內(nèi)容的模型,在埋點時scm模型的數(shù)據(jù)作為埋點參數(shù)上報到數(shù)據(jù)后臺,其編碼形式和spm一樣也是通過A.B.C.D四個層級進行編碼,只不過四個層級記錄的信息與spm有所差別,分別是:內(nèi)容來源、投放算法、算法版本以及對應的人群,還以上面的內(nèi)容為例:
內(nèi)容來源(content_source):shop
投放算法(algorithm):cf
算法版本(version):3.3
對應人群(crowd):woman
該條內(nèi)容:澳大利亞·秋冬必備神級修復的內(nèi)容情況如下:shop.cf.3.3.woman, 可以統(tǒng)計不同位置下該條內(nèi)容所展示的信息和流量情況
spm和scm作為兩種不同的編碼規(guī)范,我覺得可以根據(jù)自己的需要進行相關(guān)的改良,比如更改層級或更改定義等。
埋點模型采用的是事件模型,事件模型描述了一個人做某件事情所需要的幾個重點要素:時間(when)、地點(where)、人物(who)、途徑(how)、結(jié)果(what)
例如:
小明4月3號早上9點用小米手機在京東買了一個iphone12,轉(zhuǎn)譯到埋點語言就是:
以上設(shè)備信息均為虛擬信息,僅作參考
實現(xiàn)以上信息采集的埋點方式當前行業(yè)內(nèi)有:代碼埋點、無埋點。
代碼埋點:代碼埋點是根據(jù)具體埋點需求進行數(shù)據(jù)采集的方式,這也是用戶行為數(shù)據(jù)最早的采集方式,代碼埋點可支持客戶端埋點和服務端埋點。客戶端埋點主要采集用戶行為,服務端埋點更多采集的是業(yè)務數(shù)據(jù)。
優(yōu)點:
埋點可以做到按需采集、減少無效的信息上報;
事件觸發(fā)方式可以自定義,降低端上的資源消耗
缺點:
新增埋點周期較長,需要跟隨版本迭代
管理成本較高,造成系統(tǒng)代碼“冗余”
采集數(shù)據(jù)有“缺失”,只能獲取到上線之后的數(shù)據(jù)
無埋點:無埋點是識別端上各區(qū)塊元素,對其進行全面的采集
優(yōu)點:
新版本上線也可看到歷史數(shù)據(jù)
前端埋點成本低,管理成本低
埋點范圍覆蓋相對較廣
缺點:
數(shù)據(jù)冗余過剩
對應用開發(fā)的元素命名和開發(fā)規(guī)范要求嚴格
不能進行自定義數(shù)據(jù)的采集
服務端壓力較大
為了埋點數(shù)據(jù)全&準的兩個準則,一般可以采取兩種方式組合的方式,重點業(yè)務、非重點頁面采用代碼埋點,重點頁面非重點業(yè)務采用無埋點,合理分配兩種埋點策略做到不丟不漏在合理的維護成本范圍內(nèi),盡可能多而全的采集。
埋點模型的具體原理和如何埋點如有興趣可在公眾號內(nèi)自行學習。
雖然有了意識上的“統(tǒng)一“、制度上的規(guī)范,但我相信依舊有一些團隊在沿用公用文檔維護埋點信息,文檔化維護方式在信息量小的時候問題還不凸顯,但當面對成百上千的埋點就會出現(xiàn):埋點信息維護不全查找困難、測試同學面對“海量”的上報數(shù)據(jù)頭暈眼花極容易漏測、實際上報與需求不符無法及時發(fā)現(xiàn)等。
所以埋點質(zhì)量的最后一個環(huán)節(jié)就需要通過平臺化來進行輔助管理,主要管理的方向有以下幾個方向:
元數(shù)據(jù)管理完善、可溯源,提升查詢效率
自動化測試+人工校驗、降低漏測風險
質(zhì)量監(jiān)控,提升對錯誤埋點的發(fā)現(xiàn)效率
引入埋點流程、輔助進行“團隊管理”
a) 元數(shù)據(jù)的完善
元數(shù)據(jù)管理主要包含以下內(nèi)容:事件基礎(chǔ)信息、業(yè)務組織架構(gòu)、當前開發(fā)狀態(tài)、操作日志及變動日志
事件基礎(chǔ)信息:事件id&名稱、參數(shù)id&名稱、參數(shù)值id&名稱,統(tǒng)計口徑、上報時機、版本、需求地址等。
業(yè)務組織架構(gòu):事件歸屬的頁面、功能層級結(jié)構(gòu)等信息
當前開發(fā)狀態(tài):該事件所處的流轉(zhuǎn)狀態(tài),包括:需求中、需求完成、開發(fā)中、開發(fā)完成、測試中、測試上線、灰度、正式上線
操作日志及變動日志:記錄系統(tǒng)上所有人員對于元數(shù)據(jù)的操作日志以及該事件歷史版本變動日志等
有了完備的元數(shù)據(jù)信息,還需要提供完善的篩選和查找機制,讓埋點使用人員可以方便管理和查詢;同時平臺可以根據(jù)埋點組件規(guī)范和埋點信息自動生成一段代碼給到業(yè)務開發(fā)同學,即降低了代碼埋點的開發(fā)成本,也降低了出錯的概率。
b) 自動化測試
對于測試而言,有了完善元數(shù)據(jù)后埋點平臺可以提供:
1.自動化的測試功能
可以根據(jù)實際上報的數(shù)據(jù)明細自動比對元數(shù)據(jù)模塊下維護的信息內(nèi)容,在每次測試任務中都會自動提醒哪些事件不符合規(guī)范,極大的提高了測試效率,加上后期的人工校驗,也會降低漏測的概率。
2.規(guī)范的數(shù)據(jù)展示方式以及詳細的信息記錄
傳統(tǒng)的測試方式一邊需要對著文檔、一邊需要看著一條巨長的上報數(shù)據(jù)來找到需要比對的信息來確認埋點是否準確。平臺完全可以結(jié)構(gòu)化上報數(shù)據(jù),隱藏無關(guān)維度信息,并根據(jù)上報內(nèi)容關(guān)鍵字(事件或參數(shù)信息)自動去元數(shù)據(jù)內(nèi)進行數(shù)據(jù)查詢,埋點同學每次測試任務只需要了解版本需求范圍即可。
c) 質(zhì)量監(jiān)控
即使測試通過了,埋點數(shù)據(jù)就一定讓人放心了么,肯定不是的,上線后面對大樣本使用,用戶app什么樣的機型都有,甚至會被篡改一些信息。為了能讓最終上報的數(shù)據(jù)減少錯誤,埋點平臺可以提供質(zhì)量管理模塊,具體監(jiān)控策略可以根據(jù)數(shù)據(jù)質(zhì)量評估標準通用的5項準則:完整性、及時性、唯一性、穩(wěn)定性、準確性進行設(shè)定。
d) 引入埋點流程輔助管理
整個埋點平臺使用流程可以根據(jù)上面2.制度&流程的角色流程進行劃分和管理,上線前每個環(huán)節(jié)由相關(guān)負責人員進行確認,多層確認機制可以保證埋點信息的完善和準確,也為后續(xù)管理上帶來了極大的便利性。
埋點平臺功能框架參考如下:
數(shù)據(jù)質(zhì)量問題在業(yè)務發(fā)展到一定階段都會遇到,就像升職以后需要管理團隊一樣,不同級別面臨的問題不一樣,所需要采用的手段也不一樣。希望本篇文章可以讓那些即將面臨這個問題或已經(jīng)身在其中的小伙伴能有一部分可借鑒的地方,因篇幅問題涉及sdk、埋點設(shè)計以及平臺搭建的部分都沒法詳細展開描述,如果對此感興趣或有疑問的同學歡迎一起交流。
-END-
本文為作者獨立觀點,不代表鳥哥筆記立場,未經(jīng)允許不得轉(zhuǎn)載。
《鳥哥筆記版權(quán)及免責申明》 如對文章、圖片、字體等版權(quán)有疑問,請點擊 反饋舉報
我們致力于提供一個高質(zhì)量內(nèi)容的交流平臺。為落實國家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評論自律管理,為了保護用戶創(chuàng)造的內(nèi)容、維護開放、真實、專業(yè)的平臺氛圍,我們團隊將依據(jù)本公約中的條款對注冊用戶和發(fā)布在本平臺的內(nèi)容進行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質(zhì)內(nèi)容,同時也將采取必要措施管理違法、侵權(quán)或有其他不良影響的網(wǎng)絡(luò)信息。
一、根據(jù)《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
1)反對憲法所確定的基本原則;
2)危害國家安全,泄露國家秘密,顛覆國家政權(quán),破壞國家統(tǒng)一,損害國家榮譽和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
5)煽動民族仇恨、民族歧視,破壞民族團結(jié);
6)破壞國家宗教政策,宣揚邪教和封建迷信;
7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動非法集會、結(jié)社、游行、示威、聚眾擾亂社會秩序;
10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權(quán)益;
11)通過網(wǎng)絡(luò)以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進行網(wǎng)絡(luò)欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內(nèi)容;
2. 不友善:不尊重用戶及其所貢獻內(nèi)容的信息或行為。主要表現(xiàn)為:
1)輕蔑:貶低、輕視他人及其勞動成果;
2)誹謗:捏造、散布虛假事實,損害他人名譽;
3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進行揭露或描述,以此來激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應,蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
6)謾罵:以不文明的語言對他人進行負面評價;
7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網(wǎng)站秩序的內(nèi)容,或進行相關(guān)行為。主要表現(xiàn)為:
1)多次發(fā)布包含售賣產(chǎn)品、提供服務、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
2)單個帳號多次發(fā)布包含垃圾廣告的內(nèi)容;
3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉(zhuǎn)網(wǎng)站等,誘騙用戶點擊鏈接
5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當曝光;
6)購買或出售帳號之間虛假地互動,發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關(guān)交易。
7)發(fā)布包含欺騙性的惡意營銷內(nèi)容,如通過偽造經(jīng)歷、冒充他人等方式進行惡意營銷;
8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。
4. 色情低俗信息,主要表現(xiàn)為:
1)包含自己或他人性經(jīng)驗的細節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內(nèi)容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚低俗、庸俗、媚俗內(nèi)容。
5. 不實信息,主要表現(xiàn)為:
1)可能存在事實性錯誤或者造謠等內(nèi)容;
2)存在事實夸大、偽造虛假經(jīng)歷等誤導他人的內(nèi)容;
3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機構(gòu)或個人存在關(guān)聯(lián)。
6. 傳播封建迷信,主要表現(xiàn)為:
1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治??;
2)求推薦算命看相大師;
3)針對具體風水等問題進行求助或咨詢;
4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;
7. 文章標題黨,主要表現(xiàn)為:
1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來誘導用戶;
2)內(nèi)容與標題之間存在嚴重不實或者原意扭曲;
3)使用夸張標題,內(nèi)容與標題嚴重不符的。
8.「飯圈」亂象行為,主要表現(xiàn)為:
1)誘導未成年人應援集資、高額消費、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
4)以號召粉絲、雇用網(wǎng)絡(luò)水軍、「養(yǎng)號」形式刷量控評等行為
5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導未成年人不良嗜好影響未成年人身心健康的;
2)不當評述自然災害、重大事故等災難的;
3)美化、粉飾侵略戰(zhàn)爭行為的;
4)法律、行政法規(guī)禁止,或可能對網(wǎng)絡(luò)生態(tài)造成不良影響的其他內(nèi)容。
二、違規(guī)處罰
本網(wǎng)站通過主動發(fā)現(xiàn)和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質(zhì)量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當一個用戶發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將依據(jù)相關(guān)用戶違規(guī)情節(jié)嚴重程度,對帳號進行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將加重處罰。
三、申訴
隨著平臺管理經(jīng)驗的不斷豐富,本網(wǎng)站出于維護本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網(wǎng)站進行反饋。
(規(guī)則的最終解釋權(quán)歸屬本網(wǎng)站所有)