-- NO.11 --
數據分析的下限,取決于邏輯歸納。與其說提高分析質量,不如說提升邏輯歸納能力。邏輯歸納,需要擁有良好的邏輯思維,并結合領域知識形成該領域的分析方法。而領域方法,進一步歸納則能夠成為通用了方法論。關于數據分析,本文將從邏輯思維和分析方法2個角度進行解讀,其中分析方**介紹數據分析前的準備以及數據如何為我們創(chuàng)造長期價值。邏輯思維,是在認識事物的過程中借助概念、判斷、推理等思維形式反映客觀現實的理性認識過程。借助邏輯思維,能夠確立執(zhí)行方向,減少方向的偏移度以及分析的誤差。原始的數據并沒有太多的價值,它是已經發(fā)生的事實或者結果。從中發(fā)掘價值則是數據分析的目的。在數據分析中,其過程是與邏輯歸納相近的,過程如下:只有具備了良好邏輯思維,才能更好的幫助我們數據分析。在訓練自己邏輯思維時,首先要保證信息的完整性,其次才是討論準確性。如果陳述和提問不夠清晰,后續(xù)論證是沒有意義的。
初步了解了邏輯,接下來將與各位分享4種思維方式以及其運用方法,分別是目標、結構化、推理、逆向思維。目標思維,作用是明確目標的定義及完整性,校準執(zhí)行的方向。從邏輯論證的要素來看,目標只是一個論點,而判斷論點是否有效、正確,則需要細究其論據和論證方式。將目標映射至三要素并進行結構化拆解,會變成我們熟悉的需求4要素,再次延伸又會變成5W2H法。
熟練運用目標思維,不僅能幫助我們分析問題,還能運用于生活的許多方面。在陳述問題時所使用的KWIC方法,其實也是邏輯要素的延伸:信息越全面,溝通的成本越低,后續(xù)的論證質量才能更高。目標思維強調的是方向,結構化思維強調的是拆解和延伸。在上一節(jié)中目標的拆解和延伸使用的就是結構化的思維,它能夠幫助我們將無序、散亂的信息進行聚焦、歸納、分類。問題樹,是大家較為熟悉的方法,也是我們常使用的“腦圖”。它是一種以樹狀圖形來分析存在的問題及其相互關系的方法,也是邏輯樹的一種類型。在邏輯樹中,每一層都是下一層的總結概括,同樹干內的延伸范圍相同,不同樹干的延伸范圍相互獨立。在使用問題樹時將一個已知問題當成樹干,然后根據相關問題增加樹干或樹枝,它能夠幫助我們更全面的找到相關項。設置第一條樹干時有兩種方式,自上而下以及自下而上。自上而下其實是以終為始,通過最終的目標進行拆解;自下而上則常見于頭腦風暴,當缺少拆解思路時,我們可以將信息完全羅列,并對其進行歸類逐層向上聚合。在拆解時,我們應注意樹干間的平衡,假設某個樹干上的樹枝過多或過長,其上層的拆解維度可能是不正確的。在邏輯樹的使用場景下,公式法不太關注細分場景以及整體漏斗。在進行細化分析時結合場景、操作流程,對公式進行進一步的細化。在活動中分析成交時,會使用訪問人數、點擊購買按鈕人數、成交人數去分析漏斗。但漏斗數據往往是不完整的,這會影響推斷的準確性。結合場景、操作流程并輸出公式進行數據分析,會比漏斗更為直觀。以下載app后用戶的注冊流程為例,通過上圖,可以拆解出以下公式:
b、微信注冊人數=進入注冊頁面人數+瀏覽其他頁面引流進入人數-進入注冊頁面人數*跳失率-登錄人數-點擊手機號登錄注冊人數c、手機號注冊人數=進入注冊頁面人數+瀏覽其他頁面引流進入人數-進入注冊頁面人數*跳失率-登錄人數-點擊微信登錄注冊人數-進入手機號登錄頁面人數*跳失率-輸入手機號未獲取驗證碼人數-獲取驗證碼未輸入人數-輸入驗證碼未登錄人數公式羅列清楚后,代入數據就能夠了解是哪個數據和我們的預期不同,然后再根據數據優(yōu)化我們的交互。這兩種結構化方式,其實不太適合用于數據分析,但能夠幫助我們梳理思路便于全局思考。二分法不適用于數據分析的原因是,世界不是非黑即白的,它很難將某個數據指標的值枚舉完畢。四個象限能夠很好的用于任務分類,關于“重要”和“緊急”的程度,我們也可以使用坐標軸的值進行標記,但如果要細究哪個元素影響了”重要“和”緊急“的值,矩陣法就難以承載了。確認論點,結構化論據,下一步是論證。在論證中運用推理思維能夠幫助我們迅速找到問題的異同點,從而發(fā)現它們的規(guī)律。推理主要使用的方法是歸納、演繹、類比法,而在推理過程中還貫穿著對因果的辯證。
歸納法,指從特殊(部分樣本)到一般(全量樣本)的過程,通俗的說是從個別的經驗歸納出普遍規(guī)律的方法。它更偏感性思維,其推理方式不夠嚴謹,常用于開拓思路。在產品工作中我們會遇見許多使用歸納法的情景,如:“很多用戶都需要這個功能,所以我們應該盡快實現。”這實質上是以偏概全的方法,一旦有一個用戶不滿足這個前提,這個結論就無法成立。這里并不是說如果有用戶不需要這個功能需求就不承接了,而是要增加更多的衡量維度,如樣本數量、樣本占比、投入產出比等。在輸出結論之前需要判斷樣本是否足夠有代表性,判斷是必然事件還是隨機事件。這也是為什么數據分析需要長時間的收集樣本并觀察數據,樣本量太小會使其代表性不足,觀察周期太短會被數據的波動所迷惑,很容易讓我們做出錯誤的判斷。演繹法則與歸納法相反,是從既有經證實的普遍性結論,推導出個別性結論的一種方法,常見的表現形式是邏輯三段論。假設大前提為真,小前提為真,那結論一定為真。演繹法追求的是前后一致,不自相矛盾,但大部分人都倒在了第一步,即大前提本身是不成立的。不成立的原因是,大前提并非經證實的普遍性結論,而是通過歸納法輸出的結論。要避開歸納法的陷阱,我們則需要對其因果進行辯證。
因果辯證,同時適用于演繹和歸納法,它們都是由因及果的過程。近期互聯網保險的營銷活動由于監(jiān)管原因,無法使用現金及優(yōu)惠券獎品促進成交,一定程度上減少了活動的數量。拆解完畢后先不進行辯證,而是先對因果關系進行枚舉:3)這個原因一定會引起這個結果嗎?是否有其他的原因?在上述的案例中假設原因和結果都為真,套入第3點做出以下提問:1)使用現金及優(yōu)惠券獎品,一定會使成交效果更好嗎,是否有其他的方式?2)不使用這2種獎品,活動一定不能做嗎,是否有其他的獎品?3)活動沒法做,一定不能促進成交嗎,是否有其他的方式?看到這里,我們會發(fā)現這些原因只是結果的必要不充分條件。我們應先對結論提出假設,并設計實驗或采取其他的手段驗證假設,最終驗證后的結果才是真正的結論。聚焦,是以終為始,問題樹中的“自上而下”拆解是其表現形式之一。發(fā)散,是因為從正向思考變?yōu)槟嫦蛩伎?/span>,思考習慣的改變能夠開拓我們的思路,并幫助我們補全邏輯。從用戶出發(fā)并沒有錯誤,從商品出發(fā)能幫助我們補全分析的維度。
同樣是活躍度降低,”進入“這個詞會從入口出發(fā),分析其流量情況。從”跳出“出發(fā),則會從交互、設計層面出發(fā)分析。
這里的逆向主要是為了開拓思路,并不是說要直接給予用戶獎品。在開拓思路后進一步延伸,方案可以調整為,給予用戶部分獎品,成交后再給予另一部分。校正方向,使用目標思維;分解問題和提出假設,使用結構化思維;邏輯推理用于論證,而逆向思維則用于補全我們的邏輯。
良好的邏輯思維,結合領域知識能夠幫助我們快速形成不同領域的方法,并解決問題。數據分析前的準備過程,在我看來比實際的分析更為重要。假設目標是錯的,我們就不應該執(zhí)行。而目標不同,分析類型和分析內容也不同,同時執(zhí)行多個方向,很容易使自己陷入混亂。數據分析,能幫助我們了解業(yè)務運行狀況,并從中發(fā)現問題、優(yōu)化問題。其次,還能夠幫助洞察下一個增長點。但數據分析的意義,往往在數據產生之前。我們應圍繞產品目標,進行產品設計以及運營策劃。如果最開始的目標及指標設置錯誤,后續(xù)的工作將難以為繼。目標是結果,而指標是對結果分拆的具體要求,是對目標的衡量。假設我們的目標是提升年度成交金額,那衡量這個目標的方法是什么呢?根據衡量的方法我們才能定向的設置調整產品設計及運營策略。如果缺少可衡量目標的單位和方法,目標會難以達成。而圍繞目標設置數據的采集方案,可以大大節(jié)省數據過濾和清洗的時間。甚至于在明確指標后再最開始就設置好分析模型,通過監(jiān)測模型中的數據情況更及時的發(fā)現問題,做出更高質、高效的決策。辨別了目標和指標,下一步則是運用結構化思維進行拆解、延伸。在拆解之前,需要對自己提問:拆解出的指標目的是什么?根據目的我們才能有傾向性的分析。根據指標目的,可以分為結果指標、過程指標以及觀察指標。結果指標用于衡量目標,過程指標用于體現如何完成。觀察指標則指的受影響指標,其是否會受到自變量(結果指標)的影響,導致上升或下降。在上圖中,基于成交訂單數,設置過程指標為訂單平均金額及商品分布能幫助我們了解完成的方式。上圖的用戶付費率,可以監(jiān)測成交訂單數上升,是否帶動用戶付費率的上升,從而判斷是局部還是整體上升;而成交深度及ARPU/LTV則可以幫助我們考察下一個增長點是什么。在設置結果指標時,除了核心指標,還應輔以制衡性指標,它的目的是希望核心指標完成的更為健康。核心指標和制衡性指標所延展的過程、觀察指標是不同的。完成了目標和指標的設置,接下來是對每個指標進行細化分析,分析類型包含:描述性分析、預測性分析和規(guī)范性分析。類型不同,作用也不同。數據報表能夠幫助我們描述事件發(fā)展的情況,但很難解釋某種結果發(fā)生的原因和未來可能的趨勢。它更偏向結果性的描述,此前的結果對此后是不具備太多參考意義的。表現形式:用戶相似度及物品相似度計算、用戶購買飽和度、用戶成交影響因子預測性分析可以理解為對結果和變量的關系進行預測的過程,包含相似度、相關性分析、回歸分析等。相似度多用于推薦算法,通過計算用戶的相似度和商品相似度從而推薦給用戶。而相關分析用于預測變量的關聯性,如用戶的成交會受什么因素影響。實證性分析,指是什么,偏向于客觀;規(guī)范性分析指應當做什么,偏向于主觀。在實際使用過程,上述的4種分析類型常常會被混合使用,混合使用時應明確不同類型我們應采取的分析維度。數據分析是有順承關系的,先采集事實,再根據事實或者預測,提出我們的假設。逐步灰度地驗證假設,最終才輸出我們的結論。不能將主觀猜測強加于事實之上,已經發(fā)生的結果并不一定是未來的結果學習了方法,做好了準備,終于進入了分析的環(huán)節(jié)。筆者此前面向的數據分析,常常是“一錘子買賣”,花了很大的力氣采集數據卻沒有了下文。為了使有用功更多,下文將從用戶和收益2個維度分享數據如何為我們沉淀長期價值。這一步是為了讓我們知道完成指標的用戶是誰,常常以產品的會員體系作為切入點。會員體系越清晰,分析效果越好。
本節(jié)將以電商產品為例,和各位分享如何基于用戶的延伸分析。身份特征,可以從自然屬性、社會屬性向下細分,包含用戶的性別、年齡、職業(yè)、教育等。渠道屬性,指用戶的注冊時間、注冊平臺、注冊來源等。決策類型,主要分為決策周期、品類偏好、促銷偏好、對象偏好,這是用戶分析中常常被忽略的一方面。決策周期中的首次訪問,指的首次觸及該商品的時間。結合次數、時長以及成交時間,從而了解用戶的決策周期。品類偏好,結合品牌和歷史成交單數,能夠幫助我們獲悉品牌、價格綜合對用戶的影響。而成交品類、商品、單數則是幫助我們理解其品類購買深度及路徑,用于進行關聯推薦和評判用戶的價值。促銷偏好,結合品類和折扣金額了解用戶的敏感度,能更好的提高其轉化率。對象偏好,同樣是了解購買深度及路徑,不過維度不同。
在用戶層面的分析,此前接觸的一些朋友都非常熱衷于使用RFM模型,在使用過程中也應“因地制宜”。品類深度、對象深度是影響決策類型的因子,當它們在購買路徑時則聚焦于次序。
根據次序,制定運營的發(fā)力點,再遵循用戶的購買路徑制定轉化路徑。
在用戶分布相對穩(wěn)定的前提下,應順從用戶的購買規(guī)律而非傾力于另一條主線。一專多強的前提是專,只有聚焦優(yōu)勢品類或主題建立了優(yōu)勢,才能為其他的方向供應炮彈。前面解決的問題是:他是誰,買什么以及怎么買。最后一點,則是增長觀察。
購買路徑聚焦于次序,增長觀察聚焦于深度。購買的次序是運營的主線,購買的深度用于精細化運營。了解用戶在品類和對象的購買深度,再輔以ARPU與LTV的比對,從用戶的剩余潛力尋找平臺增長點的方式。在一次交流會上,前輩阿翹對我提問:“你所負責的產品,用戶畫像是怎么樣的?”當時我把平臺用戶的地域、年齡、性別等分布介紹了一番。緊接著他提問:“根據這樣的畫像你能夠做什么呢?”再后來,我才學會了把數據聚合成特征,把特征集合成模型。基于對用戶的認識建立模型,以上一小節(jié)的決策模型為例。將決策類型、品類偏好、對象偏好、促銷偏好4個因子的關聯,并輔以用戶的基礎信息進行組合。這樣一來冰冷的數據也被賦予了情感化的表達,無論是產品設計、交互設計、產品運營都會變得容易的多。建立起用戶模型,才能夠更好地進行情感化設計、精細化運營。
收益,常用成交或ROI進行衡量。那我們怎么判斷與收益相關的行為呢?有關程度又有多高?
關于收益及影響收益的行為,二者都屬于無序分類變量,此類數據的分析方法是卡方校驗。卡方檢驗,用于統計樣本的實際觀測值與理論推斷值之間的偏離程度,如果卡方值越大,實際觀測值與理論推斷值偏差程度越大。反之,二者偏差越?。蝗魞蓚€值完全相等時,卡方值就為0,表明理論值完全符合。在實際分析時,會先進行假設,并通過計算判定其假設成立的概率從而反推其不成立的概率。假設關注與成交行為無關,成交率應不隨關注行為變化而變化,或數據抖動較小。當我們計算出卡方值時,可以初步判定由于卡方值較大,實際觀測值與理論推斷值差異較為明顯,原假設關注與成交無關成立的可能性是比較小的。而到了判定可能性具體的程度,則是根據P值(用于判斷判定假設檢驗結果)進行校驗,P值越小,原假設關注與成交無關的概率也越小。由于其自由度等于1,結合卡方值再查詢卡方分布表可得P<0.01,所以原假設成立的可能也越小,即關注與成交有關的概率非常大。在實際使用時,同樣的也須兼顧樣本和觀測時間周期,樣本包含準確性和數量,觀測時間周期則用于分辨其抖動性。這2者較為基礎也就不過多描述了。相關性分析,用于代表相關程度,只能說明有關但并不能說明因果性。對變量之間的依賴關系進行定量關系及因果關系的研究,我們還會使用回歸分析進行計算。但由于計算方式并非本文的重心,在此也不過多的贅述了。本小節(jié),也有較多的概念并未在本文提及,此部分將附在文末。
個人認為數學方法是非常重要的領域知識,很多時候不是不會數據分析,而是不知道使用什么方法分析。因為不曾見過,所以也未曾往陌生的方向思考。
遇到這樣的問題時,先運用逆向思維確認分析目標,其次再進行結構化的拆解,再逐層學習分析時應該使用的方法。若時間寬裕,還是建議閱讀統計學相關的書籍。耐下性子閱讀,工具書的收益會比大部分同領域的文章都大。這篇文章寫完,前后花了大半年時間的《產品經理的能力模型》專題也就結束了。開設公眾號的初衷是因為0-2歲的產品經理受到的毒害太多了,想寫一些比較樸實的文章。其次也想借著寫作提煉自己的知識,沉淀自己的方法論。下一個階段,公眾號將更垂直于產品運營。也由于今年的重心是學習,本就不快的發(fā)文頻率可能會再次減緩,也請多多擔待。參考資料
https://zhuanlan.zhihu.com/p/94070722https://blog.csdn.net/weixin_34203832/article/details/88687669https://blog.csdn.net/snowdroptulip/article/details/78770088https://www.cnblogs.com/mahailuo/p/10932026.htmlhttps://baike.baidu.com/item/P%E5%80%BC/7083622?fr=aladdinhttps://www.zhihu.com/question/20045543https://www.jianshu.com/p/bbe0c702b5ad
我們致力于提供一個高質量內容的交流平臺。為落實國家互聯網信息辦公室“依法管網、依法辦網、依法上網”的要求,為完善跟帖評論自律管理,為了保護用戶創(chuàng)造的內容、維護開放、真實、專業(yè)的平臺氛圍,我們團隊將依據本公約中的條款對注冊用戶和發(fā)布在本平臺的內容進行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質內容,同時也將采取必要措施管理違法、侵權或有其他不良影響的網絡信息。
一、根據《網絡信息內容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進行處理。
1. 違反法律法規(guī)的信息,主要表現為:
1)反對憲法所確定的基本原則;
2)危害國家安全,泄露國家秘密,顛覆國家政權,破壞國家統一,損害國家榮譽和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
5)煽動民族仇恨、民族歧視,破壞民族團結;
6)破壞國家宗教政策,宣揚邪教和封建迷信;
7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動非法集會、結社、游行、示威、聚眾擾亂社會秩序;
10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權益;
11)通過網絡以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進行網絡欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內容;
2. 不友善:不尊重用戶及其所貢獻內容的信息或行為。主要表現為:
1)輕蔑:貶低、輕視他人及其勞動成果;
2)誹謗:捏造、散布虛假事實,損害他人名譽;
3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進行揭露或描述,以此來激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應,蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
6)謾罵:以不文明的語言對他人進行負面評價;
7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網站秩序的內容,或進行相關行為。主要表現為:
1)多次發(fā)布包含售賣產品、提供服務、宣傳推廣內容的垃圾廣告。包括但不限于以下幾種形式:
2)單個帳號多次發(fā)布包含垃圾廣告的內容;
3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內容;
4)多次發(fā)布包含欺騙性外鏈的內容,如未注明的淘寶客鏈接、跳轉網站等,誘騙用戶點擊鏈接
5)發(fā)布大量包含推廣鏈接、產品、品牌等內容獲取搜索引擎中的不正當曝光;
6)購買或出售帳號之間虛假地互動,發(fā)布干擾網站秩序的推廣內容及相關交易。
7)發(fā)布包含欺騙性的惡意營銷內容,如通過偽造經歷、冒充他人等方式進行惡意營銷;
8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內容審核的廣告內容。
4. 色情低俗信息,主要表現為:
1)包含自己或他人性經驗的細節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內容;
4)帶有性暗示、性挑逗等易使人產生性聯想;
5)展現血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚低俗、庸俗、媚俗內容。
5. 不實信息,主要表現為:
1)可能存在事實性錯誤或者造謠等內容;
2)存在事實夸大、偽造虛假經歷等誤導他人的內容;
3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機構或個人存在關聯。
6. 傳播封建迷信,主要表現為:
1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治病;
2)求推薦算命看相大師;
3)針對具體風水等問題進行求助或咨詢;
4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;
7. 文章標題黨,主要表現為:
1)以各種夸張、獵奇、不合常理的表現手法等行為來誘導用戶;
2)內容與標題之間存在嚴重不實或者原意扭曲;
3)使用夸張標題,內容與標題嚴重不符的。
8.「飯圈」亂象行為,主要表現為:
1)誘導未成年人應援集資、高額消費、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
4)以號召粉絲、雇用網絡水軍、「養(yǎng)號」形式刷量控評等行為
5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內容,主要表現為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導未成年人不良嗜好影響未成年人身心健康的;
2)不當評述自然災害、重大事故等災難的;
3)美化、粉飾侵略戰(zhàn)爭行為的;
4)法律、行政法規(guī)禁止,或可能對網絡生態(tài)造成不良影響的其他內容。
二、違規(guī)處罰
本網站通過主動發(fā)現和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內容質量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當一個用戶發(fā)布違規(guī)內容時,本網站將依據相關用戶違規(guī)情節(jié)嚴重程度,對帳號進行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內容時,本網站將加重處罰。
三、申訴
隨著平臺管理經驗的不斷豐富,本網站出于維護本網站氛圍和秩序的目的,將不斷完善本公約。
如果本網站用戶對本網站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網站進行反饋。
(規(guī)則的最終解釋權歸屬本網站所有)