很可惜 T 。T 您現(xiàn)在還不是作者身份,不能自主發(fā)稿哦~
如有投稿需求,請把文章發(fā)送到郵箱tougao@appcpx.com,一經(jīng)錄用會有專人和您聯(lián)系
咨詢?nèi)绾纬蔀榇河鹱髡哒埪?lián)系:鳥哥筆記小羽毛(ngbjxym)
轉(zhuǎn)行數(shù)據(jù)分析的路上,很多同學(xué)都有這些困擾
“面對五花八門的學(xué)習(xí)資料,不知道從哪兒入手”
“沒接觸過數(shù)據(jù)分析工具,擔(dān)心學(xué)習(xí)起來很難”
“沒有數(shù)據(jù)分析項目經(jīng)驗,害怕找工作被拒”
很多小白在剛接觸數(shù)據(jù)分析的時候,缺乏數(shù)據(jù)思維的支持,做起分析來感覺找不準方向,很難通過分析挖掘出數(shù)據(jù)的價值。
為幫助大家更好的了解數(shù)據(jù)分析,快速補齊數(shù)據(jù)分析崗位所需能力,我今天給剛?cè)胄械男氯藗兎窒硪环N通用的數(shù)據(jù)分析思維,“Why-What-How”模型,這個模型在講解概念和執(zhí)行上是個不錯的思維模型,在很多種分析場景都可以借鑒使用。本文將按照這個模型框架來拆分數(shù)據(jù)分析幫助新手小白更好地理解數(shù)據(jù)分析師這個崗位。
數(shù)據(jù)分析是為了能以量化的方式來分析業(yè)務(wù)問題并得出結(jié)論,其中有兩個重點詞語:量化和業(yè)務(wù)。 量化是為了統(tǒng)一認知,并且確保路徑可回溯,可復(fù)制。除量化之外,另外一個重點詞語是業(yè)務(wù)。只有解決業(yè)務(wù)問題分析才能創(chuàng)造價值,價值包括個人價值和公司價值。
那么,如何站在業(yè)務(wù)方的角度思考問題呢,總結(jié)起來就是八個字:
憂其所慮,給其所欲
在溝通上,確定業(yè)務(wù)方想要分析什么,提出更合理專業(yè)的衡量和分析方式,同時做好節(jié)點同步,切忌一條路走到黑。舉例來講,業(yè)務(wù)方說要看頁面停留時長,但他實際想要的,可能是想衡量用戶質(zhì)量,那么留存率、目標轉(zhuǎn)化率才是更合適的指標。
在闡述分析結(jié)果上,要記得結(jié)論先行,逐層講解,再提供論據(jù)。因為業(yè)務(wù)方或管理層時間都是有限的,洋洋灑灑一大篇郵件,未看先暈,誰都沒心思看你到底分析了啥。
在提供信息量及可落地建議上,先要明白什么叫信息量:提供了對方不知道的信息。太陽明天從東方升起不算信息量,從西方升起才是。
數(shù)據(jù)分析的本質(zhì)是抓住變與不變。“變”是數(shù)據(jù)分析的基礎(chǔ),如果一個業(yè)務(wù)每天訂單是 10000 單,或者每天都是以 10% 的速度穩(wěn)步增長,那就沒有分析的必要了。而若想抓住變,得先形成“不變”的意識。
因此,我建議新手要形成習(xí)慣,每天上班第一時間查看數(shù)據(jù):實時&日周月報;記錄關(guān)鍵數(shù)據(jù)(榜單&報告)。在“不變”的基礎(chǔ)上,便能逐漸培養(yǎng)出指標敏感性,即意識指標偏離的能力。這主要是通過各種日環(huán)比,周月同比的監(jiān)控以及日常的好奇心來保持。
下面我將從數(shù)據(jù)分析師的類別,需要掌握的技能以及工作日常三方面進行講解。
科研數(shù)據(jù)分析:模型非系統(tǒng)化,純粹學(xué)術(shù),實際應(yīng)用很難落地;要求編程能力極強,模型理論能力極強
業(yè)務(wù)數(shù)據(jù)分析:非系統(tǒng)化,純粹業(yè)務(wù),無需要求編程能力,模型較為簡單
數(shù)據(jù)挖掘解決方案:系統(tǒng)化,糅合學(xué)術(shù)與業(yè)務(wù),要求編程能力中等,模型理論能力中底下
一般來說,業(yè)務(wù)數(shù)據(jù)分析應(yīng)用場景廣泛,更適合職場人士。
統(tǒng)計概率是數(shù)據(jù)挖掘理論知識的基礎(chǔ)。在日常的數(shù)據(jù)分析工作中,常常會用到統(tǒng)計概率論的知識。統(tǒng)計概率涉及到的條件概率、概率分布,統(tǒng)計檢驗等知識是學(xué)習(xí)數(shù)據(jù)挖掘必備的先驗條件。
書籍推薦:《深入淺出統(tǒng)計學(xué)》《統(tǒng)計學(xué)-從數(shù)據(jù)到結(jié)論》
想要從事數(shù)據(jù)分析一職,最重要的就是要擁有數(shù)據(jù)分析的思維,很多小伙伴上來就學(xué)習(xí)各種工具和編程語言,但是發(fā)現(xiàn)學(xué)會了這些編程語言之后依然不會數(shù)據(jù)分析。數(shù)據(jù)分析的思維也不是一蹴而就,需要慢慢積累,多學(xué)一些分析的模型,多看一些數(shù)據(jù)分析的案例,以下是小編整理了數(shù)據(jù)分析常用到的模型。
由于不同版本的演繹,造成了分析方法種類繁多,令人眼花繚亂,甚至高深莫測。其實真不用把分析方法看的太高大上了,所有的分析方法總結(jié)起來就兩種:分類和對比。
2.21 對比分析
顧名思義就是將兩個或兩個以上的數(shù)據(jù)進行比較,分析它們之間的差異,從而發(fā)現(xiàn)數(shù)據(jù)的變化情況和規(guī)律。對比分析法分為靜態(tài)比較和動態(tài)比較兩類,用來判斷某個數(shù)據(jù)是好還是壞,以及某幾個數(shù)據(jù)之間的差異性。
一般在數(shù)據(jù)分析中我們可以從這樣幾個角度進行對比:
2.22 分類分析
分類分析就是把分析對象總體中具有不同性質(zhì)的對象區(qū)分開,把性質(zhì)相同的對象合并在一起,保持各組內(nèi)對象屬性的一致性、組與組之間屬性的差異性,以便進一步運用各種數(shù)據(jù)分析方法來揭示內(nèi)在的數(shù)量關(guān)系,最終目的是為了方便對比, 所以經(jīng)常和對比分析法一起用 。
分類分析一般有以下幾種分類方法:
數(shù)據(jù)分析是用來解決具體行業(yè)問題的,需要從業(yè)務(wù)的角度出發(fā)了解各個指標,以及每個指標之間的關(guān)系,還需要聯(lián)系業(yè)務(wù)去理解數(shù)據(jù)。所以,工作中數(shù)據(jù)分析脫離不了業(yè)務(wù),在分析中要找到導(dǎo)致問題發(fā)生的根本原因,而不只是單純的統(tǒng)計數(shù)據(jù)。
業(yè)務(wù)知識包括某個行業(yè)的常用指標、業(yè)務(wù)流程。需要注意的是,不同行業(yè)的指標、業(yè)務(wù)流程是不一樣的,所以需要學(xué)習(xí)的時候針對你的目標行業(yè)去學(xué)習(xí)準備。如果是剛?cè)腴T,這塊內(nèi)容做到了解即可,等進入工作以后,再慢慢深入業(yè)務(wù),積累業(yè)務(wù)經(jīng)驗。
下面列舉了工作中常用到的指標(部分):
由于需要處理大量的數(shù)據(jù),所以在分析數(shù)據(jù)時經(jīng)常使用專門用于分析的工具。由于在數(shù)據(jù)分析過程中進行的分析計算非常復(fù)雜,因此使用分析工具可以實現(xiàn)高效計算。
每個公司使用的分析工具各不相同,如果對編程覺得有困難的小伙伴可以選擇SPSSPRO。
經(jīng)過前面的分析,我們從整體上知道了數(shù)據(jù)分析師需要掌握的能力。但并不是說,這些能力全都掌握了你才能找到一份數(shù)據(jù)分析師的工作。因為不同的職位的要求不一樣的。
下面我們首先看看數(shù)據(jù)分析的工作內(nèi)容是什么樣的?針對不同的工作內(nèi)容,我們來談需要掌握的技能程度。
數(shù)據(jù)分析師的日常工作內(nèi)容可以大致分為以下三類,每個類型給出了相應(yīng)的場景方便大家理解,通過這些常見的數(shù)據(jù)分析場景,你就可以獲得數(shù)據(jù)分析項目的基本流程。
3.11 基本統(tǒng)計指標
數(shù)據(jù)指標是通過對數(shù)據(jù)進行分析得到的一個匯總結(jié)果,是將業(yè)務(wù)單元精分和量化后得到的度量值,使得業(yè)務(wù)目標可描述、可度量、可拆解。
如對一款軟件來說,其常見的指標包括:每日活躍用戶數(shù)、新注冊用戶數(shù)、次日留存率、七日留存率等。
數(shù)據(jù)分析前需要確定使用哪些指標去衡量業(yè)務(wù)成果。例如,針對一個APP產(chǎn)品來說,每當(dāng)運營上新功能或新活動時,就需要去確定該用哪些指標去衡量這些功能或活動的效果;若后續(xù)要做一些深入分析的話,還需要考慮設(shè)計一些更深層次的指標。
但數(shù)據(jù)指標體系的搭建并不是單個部門能夠完成的,應(yīng)至少有業(yè)務(wù)團隊(包括市場、運營、產(chǎn)品等)、數(shù)據(jù)團隊以及開發(fā)團隊三個團隊的共同協(xié)作。
3.12 報表開發(fā)——制作日常日報、月報、周報
圖中展示的是11月TOP10 熱銷產(chǎn)品情況,這是專門向領(lǐng)導(dǎo)匯報當(dāng)月工作的內(nèi)容, 告訴領(lǐng)導(dǎo)業(yè)務(wù)線的發(fā)展情況。如果在公司中只是處理類似這樣的需求,數(shù)據(jù)源多數(shù)是在公司某個系統(tǒng)上進行下載成 excel,然后用 excel + PPT 就可以完成。
技術(shù)要求:可以使用數(shù)據(jù)處理、pro繪圖、ppt寫分析報告即可
業(yè)務(wù)要求:對于新手同學(xué)多做幾個開源的項目,明白常規(guī)的分析思路就好
3.13 可視化看板代替上述的日報、周報、月報
當(dāng)公司認為數(shù)據(jù)發(fā)揮的價值越來越大,業(yè)務(wù)需求也越來越多的時候,會發(fā)現(xiàn)寫日報、周報、月報這樣做需求效率太低了??赡軙紤]使用 powerbi、tableau 這樣付費的可視化軟件進行需求開發(fā)。如下圖,制作成這樣的可視化看板,不管是業(yè)務(wù)同學(xué)還是上級領(lǐng)導(dǎo),都會很方便的得到各個維度的數(shù)據(jù),還能實現(xiàn)業(yè)務(wù)同學(xué)的自主分析需求。
看板搭建主要以“簡單高效”為主要目標,一般來說,需要滿足以下幾個設(shè)計要點:
業(yè)務(wù)要求:能夠掌握當(dāng)下業(yè)務(wù)的流程、另外公司也會有相應(yīng)的產(chǎn)品經(jīng)理會和你一起定下需要的數(shù)據(jù)指標,難點在定下的指標要能實現(xiàn)。
3.21 專題分析
根據(jù)特定問題分析,比如某公司領(lǐng)導(dǎo)提出過度降價導(dǎo)致洗發(fā)水 A 的年度利潤下降這樣的一個需求,然后讓你來具體分析下。
針對領(lǐng)導(dǎo)提出的需求,開始提出上文所示的假設(shè),并作數(shù)據(jù)處理,看到這里的同學(xué)希望先停留幾分鐘想下,為什領(lǐng)導(dǎo)會認為是過度下降導(dǎo)致了利潤下降了呢?難道是領(lǐng)導(dǎo)是看到洗發(fā)水 A 全年利潤下降,并且對當(dāng)時降價運營活動印象深刻,就是暫時這樣認為的嗎? 其實經(jīng)驗豐富的數(shù)據(jù)分析師會站在和領(lǐng)導(dǎo)一樣的高度上來考慮問題,把問題會進行轉(zhuǎn)變,如下:
其實領(lǐng)導(dǎo)的問題應(yīng)該是洗發(fā)水 A 的年度利潤未能達到要求,讓數(shù)據(jù)分析同學(xué)找出原因的。如果從事數(shù)據(jù)分析一段時間后,腦子中對于業(yè)績下滑這樣的專題分析,會很快的想出 4p 營銷理論,直接從產(chǎn)品、渠道、促銷、價格全面的進行考慮,不會有遺漏。所以正確的提出假設(shè)應(yīng)該是這樣的:
那么大家感覺這塊需要什么技能呢?只能說是常年積累的業(yè)務(wù)知識以及分析方法
3.22 探索/診斷分析
如果某個指標出現(xiàn)異常要怎么排查:
案例:如何分析次日留存率下降的問題
業(yè)務(wù)問題關(guān)鍵是問對問題,然后才是拆解問題去解決。
(1)兩層模型:從用戶畫像、渠道、產(chǎn)品、行為環(huán)節(jié)等角度細分,明確到底是 哪里的次日留存率下降了
(2)指標拆解:次日留存率 = Σ 次日留存數(shù) / 今日獲客人數(shù)
(3)原因分析:
1)內(nèi)部:a. 運營活動 b. 產(chǎn)品變動 c. 技術(shù)故障 d. 設(shè)計漏洞(如產(chǎn)生可以擼羊毛的設(shè)計)
2)外部: a. 競品 b. 用戶偏好 c. 節(jié)假日 d. 社會事件(如產(chǎn)生輿論)
(4)計算總留存下降量、abcd 四個渠道下降量,做比例
3.23 預(yù)測性分析
預(yù)測分析即根據(jù)往期數(shù)據(jù)進行預(yù)測,從描述性和診斷性分析中總結(jié)數(shù)據(jù)結(jié)果影響因素與發(fā)展態(tài)勢,以了解可能發(fā)生的情況。
對于未來數(shù)據(jù)的,舉個例子,比如預(yù)測電商網(wǎng)站用戶的流失分析,并挖掘出影響用戶流失的關(guān)鍵因素。這塊內(nèi)容就是要涉及到算法使用了。
技術(shù)要求:
業(yè)務(wù)要求:
能夠明白公司相應(yīng)業(yè)務(wù)流程即可,一般公司里面會有一到兩周的熟悉業(yè)務(wù)的時間。
撰寫數(shù)據(jù)分析報告可以說是數(shù)據(jù)分析師最核心的工作,是數(shù)據(jù)分析師核心價值的體現(xiàn),常見的報告包括以下3種:
數(shù)據(jù)分析的目的是為了更好的支撐業(yè)務(wù)發(fā)展,通過數(shù)據(jù)收集(數(shù)據(jù)埋點等),分析數(shù)據(jù)之間的關(guān)系(建模、搭建指標體系),反饋到目標業(yè)務(wù)線,用于指導(dǎo)業(yè)務(wù)工作。做數(shù)據(jù)分析首先數(shù)據(jù)準確性是第一位的,然后就是要站在業(yè)務(wù)方的角度思考問題,憂其所慮,予其所欲,這樣做出來的分析更容易產(chǎn)出價值。
本文為作者獨立觀點,不代表鳥哥筆記立場,未經(jīng)允許不得轉(zhuǎn)載。
《鳥哥筆記版權(quán)及免責(zé)申明》 如對文章、圖片、字體等版權(quán)有疑問,請點擊 反饋舉報
我們致力于提供一個高質(zhì)量內(nèi)容的交流平臺。為落實國家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評論自律管理,為了保護用戶創(chuàng)造的內(nèi)容、維護開放、真實、專業(yè)的平臺氛圍,我們團隊將依據(jù)本公約中的條款對注冊用戶和發(fā)布在本平臺的內(nèi)容進行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質(zhì)內(nèi)容,同時也將采取必要措施管理違法、侵權(quán)或有其他不良影響的網(wǎng)絡(luò)信息。
一、根據(jù)《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
1)反對憲法所確定的基本原則;
2)危害國家安全,泄露國家秘密,顛覆國家政權(quán),破壞國家統(tǒng)一,損害國家榮譽和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
5)煽動民族仇恨、民族歧視,破壞民族團結(jié);
6)破壞國家宗教政策,宣揚邪教和封建迷信;
7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動非法集會、結(jié)社、游行、示威、聚眾擾亂社會秩序;
10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權(quán)益;
11)通過網(wǎng)絡(luò)以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進行網(wǎng)絡(luò)欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內(nèi)容;
2. 不友善:不尊重用戶及其所貢獻內(nèi)容的信息或行為。主要表現(xiàn)為:
1)輕蔑:貶低、輕視他人及其勞動成果;
2)誹謗:捏造、散布虛假事實,損害他人名譽;
3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進行揭露或描述,以此來激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應(yīng),蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
6)謾罵:以不文明的語言對他人進行負面評價;
7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網(wǎng)站秩序的內(nèi)容,或進行相關(guān)行為。主要表現(xiàn)為:
1)多次發(fā)布包含售賣產(chǎn)品、提供服務(wù)、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
2)單個帳號多次發(fā)布包含垃圾廣告的內(nèi)容;
3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉(zhuǎn)網(wǎng)站等,誘騙用戶點擊鏈接
5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當(dāng)曝光;
6)購買或出售帳號之間虛假地互動,發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關(guān)交易。
7)發(fā)布包含欺騙性的惡意營銷內(nèi)容,如通過偽造經(jīng)歷、冒充他人等方式進行惡意營銷;
8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。
4. 色情低俗信息,主要表現(xiàn)為:
1)包含自己或他人性經(jīng)驗的細節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內(nèi)容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚低俗、庸俗、媚俗內(nèi)容。
5. 不實信息,主要表現(xiàn)為:
1)可能存在事實性錯誤或者造謠等內(nèi)容;
2)存在事實夸大、偽造虛假經(jīng)歷等誤導(dǎo)他人的內(nèi)容;
3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機構(gòu)或個人存在關(guān)聯(lián)。
6. 傳播封建迷信,主要表現(xiàn)為:
1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治??;
2)求推薦算命看相大師;
3)針對具體風(fēng)水等問題進行求助或咨詢;
4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;
7. 文章標題黨,主要表現(xiàn)為:
1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來誘導(dǎo)用戶;
2)內(nèi)容與標題之間存在嚴重不實或者原意扭曲;
3)使用夸張標題,內(nèi)容與標題嚴重不符的。
8.「飯圈」亂象行為,主要表現(xiàn)為:
1)誘導(dǎo)未成年人應(yīng)援集資、高額消費、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
4)以號召粉絲、雇用網(wǎng)絡(luò)水軍、「養(yǎng)號」形式刷量控評等行為
5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導(dǎo)未成年人不良嗜好影響未成年人身心健康的;
2)不當(dāng)評述自然災(zāi)害、重大事故等災(zāi)難的;
3)美化、粉飾侵略戰(zhàn)爭行為的;
4)法律、行政法規(guī)禁止,或可能對網(wǎng)絡(luò)生態(tài)造成不良影響的其他內(nèi)容。
二、違規(guī)處罰
本網(wǎng)站通過主動發(fā)現(xiàn)和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質(zhì)量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當(dāng)一個用戶發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將依據(jù)相關(guān)用戶違規(guī)情節(jié)嚴重程度,對帳號進行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當(dāng)涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將加重處罰。
三、申訴
隨著平臺管理經(jīng)驗的不斷豐富,本網(wǎng)站出于維護本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網(wǎng)站進行反饋。
(規(guī)則的最終解釋權(quán)歸屬本網(wǎng)站所有)