?數(shù)據(jù)分析與數(shù)據(jù)化運營的關(guān)鍵知識點,全在這里了

導(dǎo)讀:本文是《Python數(shù)據(jù)分析與數(shù)據(jù)化運營》(第2版)的讀書筆記,作者除介紹這本書適合有哪些需求的人閱讀之外,還整理了這本書最精華部分的知識點,值得收藏。
本文為華章科技內(nèi)容合伙人之「鑒書小分隊」成員老楊同志在閱讀《Python數(shù)據(jù)分析與數(shù)據(jù)化運營》(第2版)后原創(chuàng)的讀書筆記。
本文結(jié)構(gòu):
01 總覽
02 數(shù)據(jù)分析
1. 核?內(nèi)容
2. 閱讀建議
03 數(shù)據(jù)化運營
1. 會員數(shù)據(jù)化運營
1.1 關(guān)鍵指標
1.2 應(yīng)用場景
1.3 分析模型
2. 商品數(shù)據(jù)化運營
2.1 關(guān)鍵指標
2.2 應(yīng)用場景
2.3 分析模型
3. 流量數(shù)據(jù)化運營
3.1 關(guān)鍵指標
3.2 應(yīng)用場景
3.3 分析模型
4. 內(nèi)容數(shù)據(jù)化運營
4.1 關(guān)鍵指標
4.2 應(yīng)用場景
4.3 分析模型
?先,《Python數(shù)據(jù)分析與數(shù)據(jù)化運營》不是?本講解Python語?的書。Python只是用于數(shù)據(jù)分析進而支撐數(shù)據(jù)化運營的開發(fā)?具。因此,如果希望學(xué)習(xí)Python語?,這本書不太適合。
其次,這不是?本講解機器學(xué)習(xí)算法的書。雖然整本書?數(shù)據(jù)分析和數(shù)據(jù)化運營?量的使用到了這些算法,但更多側(cè)重應(yīng)用層?舉例,?不是算法模型的數(shù)學(xué)證明。因此,如果希望深?研究機器學(xué)習(xí)算法模型的原理,這本書也不太適合。
再次,這本書完整的講解了數(shù)據(jù)分析的整個過程,每個步驟都進?了較為細致深?的解析,包括常用算法模型的介紹。如果希望較為快速的上?數(shù)據(jù)分析,拋開各種繁瑣理論和算法,加快學(xué)習(xí)效率,這本書?較適合。
最后,我認為這本書最精華的部分,是?常完整的總結(jié)了數(shù)據(jù)化運營中各個主題下的業(yè)務(wù)模型,基礎(chǔ)知識點、關(guān)鍵指標、應(yīng)用場景、業(yè)務(wù)模型等等,?常完整。即使拋開Python語?,單純把這部分內(nèi)容拉出來, 都?常適合運營?員學(xué)習(xí)。因此,如果希望學(xué)習(xí)數(shù)據(jù)化運營的思維,這本書?常適合。
1. 核?內(nèi)容
本書前半部分(1~4章),主要講數(shù)據(jù)分析。其中:
第 1 章作為入門章節(jié),主要介紹了Python語?和數(shù)據(jù)化運營的基本知識。較?篇幅講解數(shù)據(jù)分析常用的三?庫,最后給了?個簡單的案例。第 2 章主要講解數(shù)據(jù)采集,即通過各種數(shù)據(jù)源采集數(shù)據(jù)并進?最原始的解析,包含了?些特征提取的內(nèi)容。第 3 章主要講數(shù)據(jù)預(yù)處理。數(shù)據(jù)預(yù)處理是數(shù)據(jù)分析中?常關(guān)鍵的?個步驟,對算法模型擬合的效果影響很?。當(dāng)然,其內(nèi)容也?常豐富,書中分 10 個小節(jié)分別講解了數(shù)據(jù)清洗、標志轉(zhuǎn)換、數(shù)據(jù)降維、樣本不均衡、數(shù)據(jù)源沖突、抽樣、共線性、相關(guān)性分析、數(shù)據(jù)標準化、數(shù)據(jù)離散化、?結(jié)構(gòu)化數(shù)據(jù)預(yù)處理等內(nèi)容。第 4 章主要講算法模型,核?內(nèi)容包括 聚類、回歸、分類、時間序列分析等模型。2. 閱讀建議
第1章簡單看看,有?個?體的概念。三?庫不用去記憶,用到時再去翻看附錄。第2章快速瀏覽?遍就可以了,內(nèi)容太細節(jié),沒必要看的太仔細。第3章和第4章對于理解數(shù)據(jù)分析的步驟和思路?較重要,需要反復(fù)閱讀。第3章中的數(shù)據(jù)清洗、數(shù)據(jù)降維、數(shù)據(jù)標準化,是?乎所有建模前的必備步驟。第4章集中在聚類、回歸、分類、時間序列分析模型的學(xué)習(xí),基本可以解決常?的絕?部分問題。另外,書中的內(nèi)容相對?較簡略,還需要再尋找資料深?學(xué)習(xí)(如周志華的??書)。基于個?理解,梳理的數(shù)據(jù)分析步驟及內(nèi)容如下:
本書后半部分(5~8章),主要講數(shù)據(jù)化運營業(yè)務(wù)層?的內(nèi)容,重點在 關(guān)鍵指標、應(yīng)用場景、分析模型。
從實際?作的?度來說,數(shù)據(jù)分析的算法模型相對是較固定的,反?是這些業(yè)務(wù)層?的內(nèi)容,可能更具有實際意義,也更需要經(jīng)驗。尤其是 “會員數(shù)據(jù)化運營”和“商品數(shù)據(jù)化運營”兩個章節(jié),?乎適用所有的商業(yè)場景。
所以個?認為這部分內(nèi)容是本書的精華所在,值得反復(fù)細讀并深?理解。因此下?把關(guān)鍵指標、應(yīng)用場景、分析模型完整的記錄了下來。
1. 會員數(shù)據(jù)化運營
1.1 關(guān)鍵指標
會員整體指標:注冊會員數(shù)、激活會員數(shù)、購買會員數(shù)。會員營銷指標:可營銷會員數(shù)、營銷費用、用券會員/?額/訂單?例、營銷收?、營銷費率、每注 冊/訂單/會員收?、每注冊/訂單/會員成本。會員活躍度指標:整體會員活躍度、?/周/?活躍?戶數(shù)。會員價值度指標:會員價值分群、復(fù)購率、消費頻次、最近?次購買時間、最近?次購買?額。會員終?價值指標:會員?命周期價值/訂單量/平均訂單價值、會員?命周期轉(zhuǎn)化率、會員?命周 期剩余價值。會員異動指標:會員流失率、會員異動?。1.2 應(yīng)用場景
會員營銷會員關(guān)懷1.3 分析模型
會員細分模型:重點推薦ABC分類法,更利于分清主次、抓住關(guān)鍵。會員活躍度模型:借鑒RFM模型,構(gòu)建了RFE模型,以評估會員活躍度。會員價值度模型:常用的RFM模型。會員流失預(yù)測模型:基于業(yè)務(wù)?為對用戶流失的概率估計和分類。會員特征分析模型營銷響應(yīng)預(yù)測模型2. 商品數(shù)據(jù)化運營
2.1 關(guān)鍵指標
銷售指標:訂單量/商品銷售量、訂單?額/商品銷售額、每訂單?額/客單價/件單價、訂單轉(zhuǎn)化率、?付轉(zhuǎn)化率、有效訂單量/有效訂單?額/有效商品銷售量/有效商品銷售額、訂單有效率/廢單 率、?利/?利率。促銷活動指標:每訂單成本/每有效訂單成本、每優(yōu)惠券收益/每積分兌換收益、活動直接收?/活動 間接收?、活動收?貢獻、活動拉升?例。供應(yīng)鏈指標:庫存可用天數(shù)、庫存量、庫齡、滯銷?額、缺貨率、殘次數(shù)量/殘次?額/殘次占?、 庫存周轉(zhuǎn)天數(shù)。2.2 應(yīng)用場景
銷售預(yù)測庫存分析市場分析促銷分析2.3 分析模型
商品價格敏感度模型:輔助銷售定價、促銷活動折扣?例等。新產(chǎn)品市場定位模型:基于相似度算法,實現(xiàn)競品分析。銷售預(yù)測模型:通過 時序分析、回歸、分類(客戶是否購買?為的分類) ?法預(yù)測銷售情況。商品關(guān)聯(lián)銷售模型:基于關(guān)聯(lián)算法,分析關(guān)聯(lián)商品。異常訂單檢測商品規(guī)劃的最優(yōu)組合:基于線性規(guī)劃等算法尋找最優(yōu)解。3. 流量數(shù)據(jù)化運營
3.1 關(guān)鍵指標
站外營銷推?指標:曝光量、點擊量、點擊率、CPM、CPD、CPC、CPA、每UV成本、每訪問成本、ROI、每點擊/UV/訪問/?標轉(zhuǎn)化收益。?站流量數(shù)量指標:到達率、UV、Visit、PV、新訪問占?、實例數(shù)。?站流量質(zhì)量指標:訪問深度、停留時間、跳出/跳出率、退出/退出率、產(chǎn)品?轉(zhuǎn)化率、加?購物?轉(zhuǎn)化率、結(jié)算轉(zhuǎn)化率、下載轉(zhuǎn)化率、注冊轉(zhuǎn)化率、購物?內(nèi)轉(zhuǎn)化率。3.2 應(yīng)用場景
流量采購:流量預(yù)測、效果評估、效果分析、作弊檢測。流量分發(fā):內(nèi)部?告、活動引導(dǎo)、?然引導(dǎo)、個性化推薦。3.3 分析模型
流量波動檢測渠道特征聚類?告整合傳播模型:?告來源路徑、?標轉(zhuǎn)化歸因、?告渠道的關(guān)聯(lián)訪問。流量預(yù)測模型:基于現(xiàn)有流量及?告費用等因素預(yù)測?定條件下可以產(chǎn)?多少流量。4. 內(nèi)容數(shù)據(jù)化運營
4.1 關(guān)鍵指標
內(nèi)容質(zhì)量指標:原創(chuàng)度。SEO類指標:收錄數(shù)量/?例、關(guān)鍵字排名、點擊量和點擊率。內(nèi)容互動指標:收藏量、點贊量、評論量、傳播量/傳播率、?次傳播率。?標轉(zhuǎn)化指標4.2 應(yīng)用場景
內(nèi)容采集內(nèi)容創(chuàng)作內(nèi)容分發(fā)內(nèi)容管理4.3 分析模型
情感分析模型:基于樸素?葉斯、SVM 等分類算法分析內(nèi)容的情感傾向(正向、中性、負向)。搜索優(yōu)化模型?章關(guān)鍵字模型:通過 詞頻統(tǒng)計、TF-IDF 模型識別?章的關(guān)鍵字。主題模型:提煉出?字中隱含主題。垃圾信息監(jiān)測模型:基于分類算法實現(xiàn)垃圾信息識別。關(guān)于作者:老楊同志,資深程序員,重度算法控。
延伸閱讀《Python數(shù)據(jù)分析與數(shù)據(jù)化運營》(第2版)
推薦語:這是一本將數(shù)據(jù)分析技術(shù)與數(shù)據(jù)使用場景深度結(jié)合的著作,從實戰(zhàn)角度講解了如何利用Python進行數(shù)據(jù)分析和數(shù)據(jù)化運營。本書與同類書大的不同在于,并不只有純粹的關(guān)于數(shù)據(jù)分析技術(shù)和工具的講解,而且還與數(shù)據(jù)使用場景深度結(jié)合,在業(yè)務(wù)上真正可指導(dǎo)落地。此外,本書作者提供微信、郵箱等,可通過實時和離線兩種方式及時為讀者在線傳道、受業(yè)、解惑。
本文系作者:
趙同學(xué)
授權(quán)發(fā)表,鳥哥筆記平臺僅提供信息存儲空間服務(wù)。
本文為作者獨立觀點,不代表鳥哥筆記立場,未經(jīng)允許不得轉(zhuǎn)載。
《鳥哥筆記版權(quán)及免責(zé)申明》
如對文章、圖片、字體等版權(quán)有疑問,請點擊
反饋舉報
我們致力于提供一個高質(zhì)量內(nèi)容的交流平臺。為落實國家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評論自律管理,為了保護用戶創(chuàng)造的內(nèi)容、維護開放、真實、專業(yè)的平臺氛圍,我們團隊將依據(jù)本公約中的條款對注冊用戶和發(fā)布在本平臺的內(nèi)容進行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質(zhì)內(nèi)容,同時也將采取必要措施管理違法、侵權(quán)或有其他不良影響的網(wǎng)絡(luò)信息。
一、根據(jù)《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
1)反對憲法所確定的基本原則;
2)危害國家安全,泄露國家秘密,顛覆國家政權(quán),破壞國家統(tǒng)一,損害國家榮譽和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
5)煽動民族仇恨、民族歧視,破壞民族團結(jié);
6)破壞國家宗教政策,宣揚邪教和封建迷信;
7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動非法集會、結(jié)社、游行、示威、聚眾擾亂社會秩序;
10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權(quán)益;
11)通過網(wǎng)絡(luò)以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進行網(wǎng)絡(luò)欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內(nèi)容;
2. 不友善:不尊重用戶及其所貢獻內(nèi)容的信息或行為。主要表現(xiàn)為:
1)輕蔑:貶低、輕視他人及其勞動成果;
2)誹謗:捏造、散布虛假事實,損害他人名譽;
3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進行揭露或描述,以此來激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應(yīng),蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
6)謾罵:以不文明的語言對他人進行負面評價;
7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網(wǎng)站秩序的內(nèi)容,或進行相關(guān)行為。主要表現(xiàn)為:
1)多次發(fā)布包含售賣產(chǎn)品、提供服務(wù)、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
2)單個帳號多次發(fā)布包含垃圾廣告的內(nèi)容;
3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉(zhuǎn)網(wǎng)站等,誘騙用戶點擊鏈接
5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當(dāng)曝光;
6)購買或出售帳號之間虛假地互動,發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關(guān)交易。
7)發(fā)布包含欺騙性的惡意營銷內(nèi)容,如通過偽造經(jīng)歷、冒充他人等方式進行惡意營銷;
8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。
4. 色情低俗信息,主要表現(xiàn)為:
1)包含自己或他人性經(jīng)驗的細節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內(nèi)容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚低俗、庸俗、媚俗內(nèi)容。
5. 不實信息,主要表現(xiàn)為:
1)可能存在事實性錯誤或者造謠等內(nèi)容;
2)存在事實夸大、偽造虛假經(jīng)歷等誤導(dǎo)他人的內(nèi)容;
3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機構(gòu)或個人存在關(guān)聯(lián)。
6. 傳播封建迷信,主要表現(xiàn)為:
1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治??;
2)求推薦算命看相大師;
3)針對具體風(fēng)水等問題進行求助或咨詢;
4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;
7. 文章標題黨,主要表現(xiàn)為:
1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來誘導(dǎo)用戶;
2)內(nèi)容與標題之間存在嚴重不實或者原意扭曲;
3)使用夸張標題,內(nèi)容與標題嚴重不符的。
8.「飯圈」亂象行為,主要表現(xiàn)為:
1)誘導(dǎo)未成年人應(yīng)援集資、高額消費、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
4)以號召粉絲、雇用網(wǎng)絡(luò)水軍、「養(yǎng)號」形式刷量控評等行為
5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導(dǎo)未成年人不良嗜好影響未成年人身心健康的;
2)不當(dāng)評述自然災(zāi)害、重大事故等災(zāi)難的;
3)美化、粉飾侵略戰(zhàn)爭行為的;
4)法律、行政法規(guī)禁止,或可能對網(wǎng)絡(luò)生態(tài)造成不良影響的其他內(nèi)容。
二、違規(guī)處罰
本網(wǎng)站通過主動發(fā)現(xiàn)和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質(zhì)量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當(dāng)一個用戶發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將依據(jù)相關(guān)用戶違規(guī)情節(jié)嚴重程度,對帳號進行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當(dāng)涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將加重處罰。
三、申訴
隨著平臺管理經(jīng)驗的不斷豐富,本網(wǎng)站出于維護本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網(wǎng)站進行反饋。
(規(guī)則的最終解釋權(quán)歸屬本網(wǎng)站所有)