前言
我們上篇內容,從本文梳理和分享一些該如何刻意訓練數據思維的方法論以及建議,目的主要給大家提供一下數據思維培養(yǎng)的思路。其實,數據思維并不是一日可形成,是需要我們結合日常工作生活來刻意練習,去實踐,發(fā)現問題、解決問題、總結問題的一個不斷積累經驗的過程。然而,無論做產品,運營,銷售,市場,人力資源管理,還是做研發(fā)、測試等工作崗位,在不同的業(yè)務場景下,如何提升付費轉化率,調研用戶滿意度訴求,人力成本分析以及精細化運營做用戶分層分群等工作內容,都會涉及到數據分析的思維方式。其分析的大概思路:確定分析目標→梳理業(yè)務場景→明確核心指標→搭建分析體系→數據可視化→分析數據得出結論。隨著5G以及大數據時代背景下,數據分析領域相關崗位也是呈現多元化的發(fā)展趨勢,如數據運營、經營分析師、商業(yè)分析師、數據科學家、數據工程師、數據架構師、算法工程師、數據產品經理、數據分析師......無論從哪個視角來看,數據分析是不會脫離業(yè)務存在。也很大程度會決定我們所需要掌握的能力棧,如金融行業(yè)的風控模型、電商行業(yè)的轉化漏斗模型等等。那么,我們應該是把數據分析作為一個行業(yè),還是一種技能來看待呢?本文將從數據分析領域的崗位詳解以及數據分析在其他領域的應用進行簡單的梳理分享,其目的主要讓大家清晰地了解“數據分析”后,結合自己的自身經驗和認知情況,是把數據分析作為行業(yè),還是當做一項技能?僅供參考!
01 偏業(yè)務方向的數據分析崗位
偏業(yè)務方向的數據分析,一般屬于運營部門。有數據運營、數據分析師、商業(yè)分析、數據產品經理等,其崗位的職位描述一般是:
建立和優(yōu)化指標體系;
監(jiān)控數據的波動和異常,找出問題;
優(yōu)化和驅動業(yè)務,推動數據化運營;
找出可增長的市場或產品優(yōu)化空間;
輸出專題分析報告;
數據運營
主要負責運營相關數據的分析,協(xié)助運營人員制定數據分析策略,為日常運營提供數據支持,協(xié)調落地,形成推動閉環(huán)等,以活躍指標的下跌舉例:
活躍指標下跌了多少?是屬于合理的數據波動,還是突發(fā)式?
什么時候開始的下跌?
是整體的活躍用戶下跌,還是部分用戶?
為什么下跌?是產品版本,還是運營失誤?
怎么解決下跌的問題
在工具方面,主要以Excel+SQL+PPT+運營思維為主??傊?,往往更關心某個指標為什么下跌或者上升。產品的用戶是什么樣的?怎么能更好的完成業(yè)務的KPI。數據分析師
主要將業(yè)務數據體系化,建立一套指標框架,其次數據提取、清洗、多維度分析、預測;生成策略推動執(zhí)行。如活躍下跌的問題,本質上也是指標問題。什么時候開始下跌,哪部分下跌,都能轉化成對應指標,如日活躍用戶數,新老用戶活躍數,地區(qū)活躍數。指標體系如果工程化自動化,也就是BI,所以數據分析師可以算半個BI分析師,這里不包括BI報表開發(fā)。在工具方面,主要以Excel+SQL+Python/R/SPSS/SAS+PPT。Excel+SQL是必備技能,Python/R/SPSS/SAS任選其一即可。一個優(yōu)秀的數據分析師,應該業(yè)務、管理、分析、工具、設計都不落下。總之,對于新人,比較普適的發(fā)展路線是先成為一位數據分析師。積累相關的經驗,在一兩年后,決定往后的發(fā)展,是數據挖掘和商業(yè)分析師,還是專精數據分析成為管理崗。數據分析的管理崗,比較常見的有數據運營經理/總監(jiān),數據分析經理等,相對應的能力是能建立指標體系,并且解決日常的各類「為什么」問題。商業(yè)分析師
是另外一個方向,更多見于傳統(tǒng)行業(yè),一般更加宏觀,偏行業(yè)研究,主要向高層匯報,基于商業(yè)問題和場景,通過數據洞察商業(yè)問題,為企業(yè)戰(zhàn)略和決策提供數據支持,咨詢/投行對該崗位的需求會比較多,會更多地關注國內外政策,對統(tǒng)計和業(yè)務能力要求更高。若在商業(yè)分析師做數據報告時,需要能站在整個行業(yè)的宏觀角度,去看待本公司、所有競對公司以及上下游的各種關系與優(yōu)劣勢等。比如要開一家快遞驛站,我們就需要考慮哪里開,這就要考慮居民密度,居民消費能力,競爭對手,網上的消費能力等因素。這些數據是宏觀的大指標,往往靠搜索和調研完成,這是和互聯(lián)網數據分析師最大的差異。總之,商業(yè)分析師是需要有一定的MBA或商科背景,在能力上,需要對行業(yè)市場、上下游、商業(yè)敏感度有強烈的洞察力,能夠體系化系統(tǒng)化的進行資料收集、市場研究、競對研究和用戶研究。數據產品經理
這個崗位比較新興,適合對數據特別感興趣的產品經理。它有兩種理解,一種是具備強數據分析能力的PM,一種是公司數據產品的規(guī)劃者。
前者,以數據導向優(yōu)化和改進產品。在產品強勢的公司,數據分析也會劃歸到產品部門,甚至運營也屬于產品部。這類產品經理有更多的機會接觸業(yè)務,屬于順便把分析師的活也干了,一專多能的典型。最典型的場景就是AB測試。大到頁面布局、路徑規(guī)劃、小到按鈕的顏色和樣式,均可以通過數據指標評估。俗話說,再優(yōu)秀的產品經理也跑不過一半AB測試。此類數據產品經理,更多是注重數據分析能力,擅長用分析進行決策。數據是能力的一部分。后者,是真正意義上的數據產品經理。隨著數據量的與日俱增,此時會有不少數據相關的產品項目:包括大數據平臺、埋點采集系統(tǒng)、BI、推薦系統(tǒng)、廣告平臺等。這些當然也是產品,自然需要提煉需求、設計、規(guī)劃、項目排期,乃至落地。
負責推薦算法的產品策略,完成相關推薦及個性化推薦產品的需求分析;
負責分析和挖掘用戶消費內容的行為數據,為改進算法策略提供依據;
負責客戶端數據需求的對接,制定相關埋點規(guī)范及口徑,相關業(yè)務指標驗證;
報表展示工具的落地和應用;
還有,數據產品經理必須了解公司或者業(yè)務線在不同的階段,需要哪些數據產品,并能夠制作出來,這是此職位的核心要求。其次,數據產品經理必須有足夠的數據分析能力,如果有了數據分析的思維,再跟公司業(yè)務結合就會比較容易。最后,數據產品經理是產品經理的一種,所以要同時具備產品經理的能力:了解用戶,需求調研,方案設計,協(xié)調技術、測試、設計等。從職業(yè)發(fā)展上看,數據分析師做數據產品經理更合適。普通的產品經理,對前端、后端的技術棧尚未熟悉,何況日新月異的數據棧。02 偏技術方向的數據分析崗位
偏技術方向的數據分析崗位,如數據挖掘/算法專家等崗位有的歸在研發(fā)部門,有的則單獨成立數據部門。與業(yè)務方向的數據分析師相比較來說,要求更高的統(tǒng)計學能力、數理能力以及編程技巧。有數據挖掘工程師、數據算法工程師、數據倉庫工程師、數據科學家等崗位。下面我們介紹幾個常見的崗位詳解:
數據挖掘
從概念上說,數據挖掘Data mining是一種方式,即可以通過機器學習,而能借助其他算法。比如協(xié)同過濾、關聯(lián)規(guī)則、PageRank等,它們是數據挖掘的經典算法,但不屬于機器學習,所以在機器學習的書籍上,你是看不到的。實際的應用場景中,如共享單車,如何尋找單車使用效率最大化的最優(yōu)投放,就是數據挖掘的工作范疇。數據挖掘工程師,除了掌握算法,同樣需要編程能力去實現,不論R、Python、Scala/Java,至少掌握一種。模型的實施,往往也要求Hadoop/Spark的工程實踐經驗,精通SQL/Hive是必須的。
數據抽取
數據清洗
特征選取/特征工程
數據模型
數據驗證
迭代優(yōu)化
總之,單看環(huán)節(jié),數據挖掘對分析能力沒有業(yè)務型那么高。這不代表業(yè)務不重要,尤其在特征選取方面,對業(yè)務的理解很大程度會影響特征怎么選取,進而影響模型質量。用戶流失是一個經典的考題,如何選取合適的特征,預測用戶會否流失,能夠考察對業(yè)務是否深刻洞察。還有,數據挖掘的業(yè)務領域一樣可以細分。金融行業(yè)的信用模型和風控模型/反欺詐模型、廣告模型的點擊預估模型、電商行業(yè)的推薦系統(tǒng)和用戶畫像系統(tǒng)。從需求提出到落地,數據挖掘工程師除了全程跟進也要熟悉業(yè)務。算法專家
數據挖掘往后發(fā)展,稱為算法專家。后者對理論要求更嚴苛,幾乎都要閱讀國外的前沿論文。方向不局限于簡單的分類或者回歸,還包括圖像識別、自然語言處理、智能量化投顧這種復合領域。這里開始會對從業(yè)者的學校和學歷提出要求,名校+碩士無疑是一個大優(yōu)勢,也有很多人直接做數據挖掘。深度學習則更前沿,它由神經網絡發(fā)展而來,是機器學習的一個子集。因為各類框架開枝散葉,諸多模型百花齊放,也可以算一個全新的分支。除了要求熟悉TensorFlow, Caffe, MXNet等深度學習框架,對模型的應用和調參也是必備的,后者往往是劃分普通人和大牛的天塹。總之,算法專家和深度學習專家,薪資level會更高一級,一般對應于業(yè)務型的數據運營/分析總監(jiān)。數據工程師
更偏數據底層,其核心是做好數據倉庫建設及ETL數據處理。這個崗位基本不涉及數據分析的能力,而對大數據處理能力要求較高,需要較強的編程及架構設計能力。分析歷史、預測未來、優(yōu)化選擇,這是大數據工程師在“玩數據”時最重要的三大任務。通過這三個工作方向,他們幫助企業(yè)做出更好的商業(yè)決策。要求具備一定的統(tǒng)計學、數學理論知識,有實際開發(fā)能力和大規(guī)模的數據處理能力,對行業(yè)有認知。在很多中小型的公司,一方面數據是無序的、缺失的、原始的,另外一方面各種業(yè)務報表又嗷嗷待哺。沒辦法,分析師只能自己擼起袖子,一個人當三個人用。兼做數據清洗+ETL+BI。部分歸屬到技術部的數據分析師,雖然Title叫數據分析(其實應該叫數據分析開發(fā)工程師),其工作職責為建設數據倉庫、數據庫表開發(fā)、數據采集、清洗、存儲、建模、數據應用、數據平臺的建設優(yōu)化等職責,這就是標準的數據工程路線。部分公司會將機器學習模型的部署和實現交給數據工程團隊,這要求數據工程師熟悉sparkMLlib、Mahout此類框架。除此之外,還有算法工程師(核心是機器學習等算法能力)、數據架構師(核心是平臺建設及數據倉庫建設能力)等等,這些崗位要么跟數據分析能力關系不大,要么能力模型已經包含在前面幾個崗位中了,就不一一羅列了。總之,數據科學家是上述崗位的最終形態(tài)之一。其要求的能力更加全面,基本綜合了前面崗位的核心能力,并且對AI能力及編程能力要求更高,這個崗位也會成為未來數據方向的重點發(fā)展趨勢。由于篇幅原因,我們分析上下兩部分,下篇梳理數據分析在各領域的應用。(部分崗位明細整理于網絡)-END-
本文系作者:
小飛象木木自由
授權發(fā)表,鳥哥筆記平臺僅提供信息存儲空間服務。
本文為作者獨立觀點,不代表鳥哥筆記立場,未經允許不得轉載。
《鳥哥筆記版權及免責申明》
如對文章、圖片、字體等版權有疑問,請點擊
反饋舉報
我們致力于提供一個高質量內容的交流平臺。為落實國家互聯(lián)網信息辦公室“依法管網、依法辦網、依法上網”的要求,為完善跟帖評論自律管理,為了保護用戶創(chuàng)造的內容、維護開放、真實、專業(yè)的平臺氛圍,我們團隊將依據本公約中的條款對注冊用戶和發(fā)布在本平臺的內容進行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質內容,同時也將采取必要措施管理違法、侵權或有其他不良影響的網絡信息。
一、根據《網絡信息內容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進行處理。
1. 違反法律法規(guī)的信息,主要表現為:
1)反對憲法所確定的基本原則;
2)危害國家安全,泄露國家秘密,顛覆國家政權,破壞國家統(tǒng)一,損害國家榮譽和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
5)煽動民族仇恨、民族歧視,破壞民族團結;
6)破壞國家宗教政策,宣揚邪教和封建迷信;
7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動非法集會、結社、游行、示威、聚眾擾亂社會秩序;
10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權益;
11)通過網絡以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進行網絡欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內容;
2. 不友善:不尊重用戶及其所貢獻內容的信息或行為。主要表現為:
1)輕蔑:貶低、輕視他人及其勞動成果;
2)誹謗:捏造、散布虛假事實,損害他人名譽;
3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進行揭露或描述,以此來激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應,蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
6)謾罵:以不文明的語言對他人進行負面評價;
7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網站秩序的內容,或進行相關行為。主要表現為:
1)多次發(fā)布包含售賣產品、提供服務、宣傳推廣內容的垃圾廣告。包括但不限于以下幾種形式:
2)單個帳號多次發(fā)布包含垃圾廣告的內容;
3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內容;
4)多次發(fā)布包含欺騙性外鏈的內容,如未注明的淘寶客鏈接、跳轉網站等,誘騙用戶點擊鏈接
5)發(fā)布大量包含推廣鏈接、產品、品牌等內容獲取搜索引擎中的不正當曝光;
6)購買或出售帳號之間虛假地互動,發(fā)布干擾網站秩序的推廣內容及相關交易。
7)發(fā)布包含欺騙性的惡意營銷內容,如通過偽造經歷、冒充他人等方式進行惡意營銷;
8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內容審核的廣告內容。
4. 色情低俗信息,主要表現為:
1)包含自己或他人性經驗的細節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內容;
4)帶有性暗示、性挑逗等易使人產生性聯(lián)想;
5)展現血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚低俗、庸俗、媚俗內容。
5. 不實信息,主要表現為:
1)可能存在事實性錯誤或者造謠等內容;
2)存在事實夸大、偽造虛假經歷等誤導他人的內容;
3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機構或個人存在關聯(lián)。
6. 傳播封建迷信,主要表現為:
1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治??;
2)求推薦算命看相大師;
3)針對具體風水等問題進行求助或咨詢;
4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;
7. 文章標題黨,主要表現為:
1)以各種夸張、獵奇、不合常理的表現手法等行為來誘導用戶;
2)內容與標題之間存在嚴重不實或者原意扭曲;
3)使用夸張標題,內容與標題嚴重不符的。
8.「飯圈」亂象行為,主要表現為:
1)誘導未成年人應援集資、高額消費、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
4)以號召粉絲、雇用網絡水軍、「養(yǎng)號」形式刷量控評等行為
5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內容,主要表現為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導未成年人不良嗜好影響未成年人身心健康的;
2)不當評述自然災害、重大事故等災難的;
3)美化、粉飾侵略戰(zhàn)爭行為的;
4)法律、行政法規(guī)禁止,或可能對網絡生態(tài)造成不良影響的其他內容。
二、違規(guī)處罰
本網站通過主動發(fā)現和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內容質量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當一個用戶發(fā)布違規(guī)內容時,本網站將依據相關用戶違規(guī)情節(jié)嚴重程度,對帳號進行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內容時,本網站將加重處罰。
三、申訴
隨著平臺管理經驗的不斷豐富,本網站出于維護本網站氛圍和秩序的目的,將不斷完善本公約。
如果本網站用戶對本網站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網站進行反饋。
(規(guī)則的最終解釋權歸屬本網站所有)