
原創(chuàng):白楊 全文2791字 預計閱讀5分鐘
前言:這是白楊SEO公眾號原創(chuàng)第149篇。今天是3月最后一天了,所以分享這篇文章,讓大家思考一下,建議看到文尾,歡迎留言。
我們在對比人工手動與機器自動誰更靠譜之前,我們先說說數(shù)據(jù)挖掘與信息收集分析這兩個事兒,好吧。
想象一下,你什么時候需要挖掘數(shù)據(jù)?你最近一次去尋找數(shù)據(jù)是什么時候?在做SEO或者推廣中,你用到過數(shù)據(jù)挖掘嗎?做運營或者市場分析也會用到嗎?如果你回答是,那么請繼續(xù)往下看。比如拿白楊SEO自己來說,我寫公眾號文章都會用到數(shù)據(jù)挖掘。為什么?因為我寫作需要【主題】。主題是什么?就是一篇文章要寫的中心思想,比如本文,主題就是數(shù)據(jù)挖掘重要性,如果關鍵詞就是數(shù)據(jù)挖掘與收集。
那么,你可能會問,白楊SEO,你的主題是如何進行數(shù)據(jù)挖掘的呢?那我這里分享三點給你:比如白楊SEO的谷歌書簽欄里有各大排行榜,比如百度風云榜、知乎熱榜、微博熱榜、搜狗熱榜、新榜熱門文章排名,還有各大搜索引擎,如百度、360、搜狗、微博搜索、頭條搜索、微信搜一搜、淘寶搜索等。
甚至還有我關注的SEO、流量、運營、科技相關的網(wǎng)站。如圖。為什么收集這些,很多人不知道,你寫作的思路也許就在這里。比如百度風云熱搜榜就有最近一天,最近七天熱搜排名關鍵詞。比如知乎,就有最近熱搜問答,再比如打開微信搜一搜也能看到最近熱詞。
每一個關鍵詞背后都是需求。不知道你明白這句話不?比如我拋一個問題,“如何”與“怎樣”兩個關鍵詞,你覺得哪個指數(shù)大?公眾號留言給我。
再比如,我之前朋友圈發(fā)過,如果你不知道搜索引擎背后的流量,你可以打開手機百度,你只需要輸入類似“20歲”、“30歲”“40歲”都會提示不同的需求。再比如,你把副業(yè)兩個字,放到知乎里,你能找到很多副業(yè)項目。
如果上面1、2點你都做了,比如像白楊SEO本篇文章主題一樣,確定是數(shù)據(jù)挖掘與收集,那么,你就可以驗證是否是真需求了。
先從流量驗證,如果你有百度競價后臺,關鍵詞規(guī)劃師工具打開,放入數(shù)據(jù)挖掘,或信息收集看流量如何。如果沒有,可能用5118、愛站之類的工具來看。比如我之前寫過這篇實操舉例:
其次從用戶需求驗證,去微信搜索、知乎、百度知道里,放入關鍵詞,看有沒有人提問,嗯找到提問的共性,那么這就是用戶需求!
我們再說一下信息收集分析。為什么先說數(shù)據(jù)挖掘再說收集呢?因為只有先挖掘出來,然后才有信息收集整理進行分析。
信息收集過來存儲也有很多種方式,不過白楊SEO最喜歡還是用EXCEL表格,因為這樣處理方便??赡軐τ诩夹g的朋友來說,應該是他們喜歡的格式。比如最近火熱的Python,但沒基礎學會它不簡單哈哈哈。
關于數(shù)據(jù)分析這塊,我覺得如果你想往這方面發(fā)展,白楊SEO給你兩個建議:一是你得見過好的數(shù)據(jù)分析案例,你得見過有大量數(shù)據(jù)分析需求,二是你得實操。這個數(shù)據(jù)分析能力是需要不斷在實戰(zhàn)中提升的。
講個真實故事。2016年7月,我受公司委派去湖北聯(lián)通公司做SEO營銷顧問,第一次接觸到大量數(shù)據(jù),我們合作團隊一個同事那處理數(shù)據(jù)真的強,比如數(shù)據(jù)引用,數(shù)據(jù)透視表,還有函數(shù)。感覺比別人用技術代碼處理都快。
你也許會說,我又不會遇到。一般人如果想往高處走,這些基礎技能可能會讓你事半功倍,信么?
說明下,這里的前提是數(shù)據(jù)挖掘與信息收信及分析處理。這里的機器,主要指的是“爬蟲”。爬蟲是什么東東,是搜索引擎那個蜘蛛么,原則可以這么理解。不過這里指的是技術人員寫的采集某網(wǎng)站的規(guī)則的一串代碼。
比如大家做SEO寫內(nèi)容都聽說過【火車頭】采集工具吧。再比如5118站長工具,這些工具來的數(shù)據(jù)就是爬蟲采集。對,你要學會寫采集規(guī)則。
問題來了,到底是用人工來挖掘收集更好還是用爬蟲呢?白楊SEO以前一直是人工派,就是那種所謂要眼見為實,或者理解為保守派。比如2013年幫公司開淘寶店時,為了寫標題找關鍵詞,還有看排名,都是手動一個一個找。
比如現(xiàn)在寫文章,或者去找藍海市場都會手動人工,確實很花時間。為什么我說我寫文章一般2-4小時,因為至少有一小時要花在找主題確定及素材上面啊。
雖然我是人工保守派,但我也不是否定技術流。比如在白楊SEO付費星球我就邀請了Python數(shù)據(jù)采集大牛明白老師做嘉賓,如下圖。再來說說機器爬蟲數(shù)據(jù)采集的能力。去年白楊SEO實戰(zhàn)培訓第二期來了一個大學專業(yè)是學Python的同學伯勁,那是我第一次知道這個東東。有一次,我記得是阿波跟我說,他說我的公眾號被朋友全部采集了,但并未對外,他們說只是用于他們內(nèi)部學習,我第一次感覺很神奇。所以特意邀請了伯勁做了個入門分享。知道了后羿采集器以及Webscraper。后面才知道,原來明白老師已經(jīng)開了一堂課叫《不用寫代碼的爬蟲課》,里面正好講了webscraper,而且寫了好多采集模板,恰好他也在我的星球里。
數(shù)據(jù)挖掘與信息收集分析,人工還是爬蟲誰更靠譜,其實是我故意拋出的問題。其實你心里應該也知道,二者是缺一不可!就算爬蟲,那個邏輯規(guī)則如果沒有人寫,不可能找到想要的。
如果只是人工呢,有時真的太慢了。你可以現(xiàn)在網(wǎng)上隨便搜一搜會數(shù)據(jù)挖掘工具的工作工資待遇就知道了。嘿,寫到這里,你是不是想問:白楊,你是不是想推Python課啊?真不是,哈哈哈。講真,入門容易想精難,實話。但是呢,我倒是推薦一下,不用寫代碼、學爬蟲也能做數(shù)據(jù)挖掘的課給你。對,你沒想錯,就是明白老師又重新打磨一年半的《21堂學會信息收集課》。啥,明白是誰?和我一樣,不太出名(偷笑),不過在技術圈挺出名的。不用寫爬蟲那個第一課,聽說賣出近2000份!不用學爬蟲,也能做好公開數(shù)據(jù)的自動化采集偷偷說下,我已經(jīng)看完了課程了。前期思路很棒,中后期需要愛好學習。當然如果你想偷懶,他已經(jīng)寫了300多個抓取實操爬蟲案例模板,比如抓知乎熱門回答,抓取QQ群成員、抓取頭條搜索結果等等。
本課程已于昨天正式推出,4.1號前原價299的課,現(xiàn)在只要199!對,你沒看錯,你看到這條信息的時候,只剩半天了!因為我覺得你可能需要,所以推薦給你。
當然聲明說一下,如果你沒有時間去學習看,也沒有想用數(shù)據(jù)挖掘就不要買了,自己考慮清楚哈。最后最后,白楊SEO也推薦下自己的付費星球,因為今天是月底,3月的60元優(yōu)惠券即將過期,后續(xù)應該沒有這么大優(yōu)惠了。
目前星球人數(shù)430+,嘉賓12位(與流量相關各行專家,明白老師也在)連續(xù)9周在整個付費星球每周內(nèi)容更新超過90%星球,活躍度也超過90%,如圖(截圖上周數(shù)據(jù))。白楊SEO,專注SEO研究十年,SEO實戰(zhàn)派。個人微信:baiyang2047 對新媒體精準引流有深入研究。前杰恩西運營總監(jiān)(COO),現(xiàn)自由職業(yè)。
我們致力于提供一個高質(zhì)量內(nèi)容的交流平臺。為落實國家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評論自律管理,為了保護用戶創(chuàng)造的內(nèi)容、維護開放、真實、專業(yè)的平臺氛圍,我們團隊將依據(jù)本公約中的條款對注冊用戶和發(fā)布在本平臺的內(nèi)容進行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質(zhì)內(nèi)容,同時也將采取必要措施管理違法、侵權或有其他不良影響的網(wǎng)絡信息。
一、根據(jù)《網(wǎng)絡信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
1)反對憲法所確定的基本原則;
2)危害國家安全,泄露國家秘密,顛覆國家政權,破壞國家統(tǒng)一,損害國家榮譽和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
5)煽動民族仇恨、民族歧視,破壞民族團結;
6)破壞國家宗教政策,宣揚邪教和封建迷信;
7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動非法集會、結社、游行、示威、聚眾擾亂社會秩序;
10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權益;
11)通過網(wǎng)絡以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進行網(wǎng)絡欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內(nèi)容;
2. 不友善:不尊重用戶及其所貢獻內(nèi)容的信息或行為。主要表現(xiàn)為:
1)輕蔑:貶低、輕視他人及其勞動成果;
2)誹謗:捏造、散布虛假事實,損害他人名譽;
3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進行揭露或描述,以此來激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應,蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
6)謾罵:以不文明的語言對他人進行負面評價;
7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網(wǎng)站秩序的內(nèi)容,或進行相關行為。主要表現(xiàn)為:
1)多次發(fā)布包含售賣產(chǎn)品、提供服務、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
2)單個帳號多次發(fā)布包含垃圾廣告的內(nèi)容;
3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉(zhuǎn)網(wǎng)站等,誘騙用戶點擊鏈接
5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當曝光;
6)購買或出售帳號之間虛假地互動,發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關交易。
7)發(fā)布包含欺騙性的惡意營銷內(nèi)容,如通過偽造經(jīng)歷、冒充他人等方式進行惡意營銷;
8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。
4. 色情低俗信息,主要表現(xiàn)為:
1)包含自己或他人性經(jīng)驗的細節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內(nèi)容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚低俗、庸俗、媚俗內(nèi)容。
5. 不實信息,主要表現(xiàn)為:
1)可能存在事實性錯誤或者造謠等內(nèi)容;
2)存在事實夸大、偽造虛假經(jīng)歷等誤導他人的內(nèi)容;
3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機構或個人存在關聯(lián)。
6. 傳播封建迷信,主要表現(xiàn)為:
1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治??;
2)求推薦算命看相大師;
3)針對具體風水等問題進行求助或咨詢;
4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;
7. 文章標題黨,主要表現(xiàn)為:
1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來誘導用戶;
2)內(nèi)容與標題之間存在嚴重不實或者原意扭曲;
3)使用夸張標題,內(nèi)容與標題嚴重不符的。
8.「飯圈」亂象行為,主要表現(xiàn)為:
1)誘導未成年人應援集資、高額消費、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
4)以號召粉絲、雇用網(wǎng)絡水軍、「養(yǎng)號」形式刷量控評等行為
5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導未成年人不良嗜好影響未成年人身心健康的;
2)不當評述自然災害、重大事故等災難的;
3)美化、粉飾侵略戰(zhàn)爭行為的;
4)法律、行政法規(guī)禁止,或可能對網(wǎng)絡生態(tài)造成不良影響的其他內(nèi)容。
二、違規(guī)處罰
本網(wǎng)站通過主動發(fā)現(xiàn)和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質(zhì)量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當一個用戶發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將依據(jù)相關用戶違規(guī)情節(jié)嚴重程度,對帳號進行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將加重處罰。
三、申訴
隨著平臺管理經(jīng)驗的不斷豐富,本網(wǎng)站出于維護本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網(wǎng)站進行反饋。
(規(guī)則的最終解釋權歸屬本網(wǎng)站所有)