chinesefreesexvideos高潮,欧美极品少妇性运交,久久久国产一区二区三区,99久久婷婷国产综合精品,成人国产一区二区三区

APP推廣合作
聯(lián)系“鳥哥筆記小喬”
什么是數據、元數據、主數據和參考數據?
2020-12-03 20:00:00

這是彭文華的第115篇原創(chuàng)

    曾經有段時間給甲方爸爸做項目的時候,他們看我長的顯小,喜歡挑戰(zhàn)一些問題,其中我遇到最多的就是“什么是元數據”。遇到這種問題既不能啰嗦,也不能太過于專業(yè),否則領導會不開熏。

    另外,元數據、主數據也都是數據治理的核心中的核心。今天就給大家把這幾個名詞給徹底解釋清楚。





為什么要取這么多名字?



我初入數據行業(yè)的時候也被一堆的名詞給繞暈了。什么元數據、技術元數據、業(yè)務元數據、操作元數據、主數據、參考數據、事務數據、業(yè)務數據、維度、度量、指標等等等等,那時候簡直一腦門子的官司。

那時候就是劉姥姥進大觀園,看啥都新鮮,看啥也都不懂,長期處于信息過載的狀態(tài)。那時候也沒有人幫我整理整理,自己也沒時間去系統(tǒng)性的學習,只是硬著頭皮邊用邊學,慢慢的加深理解。其實這些東西都是內在關聯(lián)的。我梳理了一下,這樣看就能清楚很多了:

    我們知道,面對大量信息的時候,最好的辦法就是歸類、合并、分解,把它們用一個結構組合起來,這樣就能很容易的理解。其實所有的數據也是一樣,我按照數據的記錄、管理和分析三個用途,對這些數據名詞進行歸類,這樣是不是就清晰多了?





記錄類數據



  • 什么是事務數據?

事務是數據庫的處理數據的一個單元,可以理解為一次數據庫CRUD的操作。事務數據就是記錄下數據庫操作的系統(tǒng)日志數據,以及特定業(yè)務場景中,專門記錄的業(yè)務操作事務記錄的數據,比如用于安全審計的系統(tǒng)登錄日志。

  • 什么是業(yè)務數據?

業(yè)務數據就是為了完成業(yè)務流程而存儲的業(yè)務操作類數據。就是業(yè)務系統(tǒng)的絕大多數表和數據。

  • 什么是日志數據?

早期的日志數據是屬于事務數據中的?,F在大數據時代,用戶訪問數據變得越來越重要,所以單獨分離出來。





什么是元數據



元數據(Meta-data)是描述數據的數據。如何理解這句話?以小學課文《翠鳥》為例, 我告訴你這是一只翠鳥,如果你沒見過翠鳥,你肯定無法理解翠鳥是個什么東西。但是如果是這樣描述一下呢?

翠鳥喜歡停在水邊的葦稈上,一雙紅色的小爪子緊緊地抓住葦稈。它的顏色非常鮮艷。頭上的羽毛像橄欖色的頭巾,繡滿了翠綠色的花紋。背上的羽毛像淺綠色的外衣。腹部的羽毛像赤褐色的襯衫。它小巧玲瓏,一雙透亮靈活的眼睛下面,長著一張又尖又長的嘴。

    上文在描述翠鳥,怎么描述的呢?從這幾個方面:停在那兒、小爪子、顏色、頭上的羽毛、背上的羽毛、腹部的羽毛、體型、眼睛、嘴。

    同理,現在我告訴一個數字:175,你除了對175這個數字有比較確定的量化意義之外,也無法理解175具體代表了什么含義。但是如果是這樣描述一下呢?

    這樣是不是就很清楚了?175的意思是:2020年統(tǒng)計的全國成年男性平均身高,該值的合理閾值是80-260cm,數據目前存在MySQL中,訪問連接是XXXX,由國家統(tǒng)計局的張三在2020年1月1日創(chuàng)建,數據目前是公開的,很安全,質量經過多重確認無誤的。

    上表在描述175這個數據,用了哪些描述項呢?單位、指標、統(tǒng)計時間、統(tǒng)計范圍、合理閾值、數據庫、表、字段、接口、創(chuàng)建人、創(chuàng)建時間、數據權限、質量等級等等。這些都是在描述175這個數據。我們把描述175這個數據的其他數據稱之為“元數據”。

    當然,為了管理方便,我們同樣還能將上述元數據進行歸類:

  • 與業(yè)務規(guī)則、流程相關的描述性數據,我們稱之為業(yè)務元數據;

  • 與存儲、訪問等技術底層的描述性數據,我們稱之為技術元數據;

  • 與數據操作相關的描述性數據,我們稱之為操作元數據;

  • 與數據管理相關的描述性數據,我們稱之為管理元數據。


    元數據解決什么核心問題?

    如上所述,元數據就是為了準確的描述我們擁有的所有數據。其核心的目的是降低人與數據之間的溝通成本。描述的越準確,我們使用數據的成本就越低。





什么是主數據



    主數據(Master Data)就是關于業(yè)務實體的數據。主數據是關鍵業(yè)務實體的最權威、最準確、價值最大的數據,用于建立交易閉環(huán)。其實Master Data翻譯成“核心數據”可能會更合適,因此主數據也被成為“黃金數據”。這么說吧,其實阿里的One ID就是主數據理念的結果。


    對于CRM客戶管理系統(tǒng)來說,用戶就是主數據;對于銀行來說,卡bin碼、開戶行、賬號、理財產品等都是主數據;對于生產企業(yè),BOM表是主數據;對于二手房平臺,房源信息是主數據。貝殼的樓盤字典就是典型的主數據,他們從2008年開始建設,持續(xù)了12年,投入了5、6億。

    所以我們總結一下,主數據一共有以下種類:

  • 與人相關的:用戶、客戶、公民、病人、供應商、學生等;

  • 與物相關的:實體產品、虛擬產品(理財產品)、生產資料(BOM表)等;

  • 與場相關的:地址庫、樓盤字典、POI信息等;

  • 與規(guī)則相關的:財務的賬套等。


    在傳統(tǒng)IT企業(yè),甲方公司的主數據可以立一個千萬級的項目。國內也有很多公司專門做主數據這個行當。主數據的核心思想是全局唯一的標準數據。因此,主數據一般會完成以下工作:

  • 確定核心業(yè)務環(huán)節(jié)

  • 識別主數據

  • 定義和維護主數據匹配規(guī)則(代碼規(guī)則、ID Mapping)

  • 建立及發(fā)布數據標準

  • 主數據的后續(xù)維護及更新





什么是參考數據?



    參考數據就是碼表。





什么是維度、度量、指標?



可以參考之前分享過的文章:

什么是全量、增量、流水、拉鏈、快照、維度、緩慢變化維、度量?


怎么理解數據分析、維度和指標?


今天分享的就這些,擴展閱讀:數據治理相關資料,公眾號“大數據架構師”后臺回復“數據治理”即可下載。



配合以下文章享受更佳







下載 | 阿特拉斯聳聳肩,數據治理法力無邊~~


干貨 | 什么是數據地圖、血緣分析和數據資產?


干貨 | 數據資產化的前提-淺談數據治理體系的建設


干貨 | 樓盤字典為什么能成為貝殼的超級護城河?


下載 | 數據中臺建設方案全套資料來了~~~


我需要你的點贊,愛你喲

大數據架構師
分享到朋友圈
收藏
收藏
評分

綜合評分:

我的評分
Xinstall 15天會員特權
Xinstall是專業(yè)的數據分析服務商,幫企業(yè)追蹤渠道安裝來源、裂變拉新統(tǒng)計、廣告流量指導等,廣泛應用于廣告效果統(tǒng)計、APP地推與CPS/CPA歸屬統(tǒng)計等方面。
20羽毛
立即兌換
一書一課30天會員體驗卡
領30天VIP會員,110+門職場大課,250+本精讀好書免費學!助你提升職場力!
20羽毛
立即兌換
順豐同城急送全國通用20元優(yōu)惠券
順豐同城急送是順豐推出的平均1小時送全城的即時快送服務,專業(yè)安全,準時送達!
30羽毛
立即兌換
大數據架構師
大數據架構師
發(fā)表文章270
歷任多家公司大數據總監(jiān)、大數據架構師,專注于數字化轉型領域。
確認要消耗 羽毛購買
什么是數據、元數據、主數據和參考數據?嗎?
考慮一下
很遺憾,羽毛不足
我知道了

我們致力于提供一個高質量內容的交流平臺。為落實國家互聯(lián)網信息辦公室“依法管網、依法辦網、依法上網”的要求,為完善跟帖評論自律管理,為了保護用戶創(chuàng)造的內容、維護開放、真實、專業(yè)的平臺氛圍,我們團隊將依據本公約中的條款對注冊用戶和發(fā)布在本平臺的內容進行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質內容,同時也將采取必要措施管理違法、侵權或有其他不良影響的網絡信息。


一、根據《網絡信息內容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進行處理。
1. 違反法律法規(guī)的信息,主要表現為:
    1)反對憲法所確定的基本原則;
    2)危害國家安全,泄露國家秘密,顛覆國家政權,破壞國家統(tǒng)一,損害國家榮譽和利益;
    3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
    4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
    5)煽動民族仇恨、民族歧視,破壞民族團結;
    6)破壞國家宗教政策,宣揚邪教和封建迷信;
    7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
    8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
    9)煽動非法集會、結社、游行、示威、聚眾擾亂社會秩序;
    10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權益;
    11)通過網絡以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進行網絡欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法規(guī)禁止的其他內容;


2. 不友善:不尊重用戶及其所貢獻內容的信息或行為。主要表現為:
    1)輕蔑:貶低、輕視他人及其勞動成果;
    2)誹謗:捏造、散布虛假事實,損害他人名譽;
    3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進行揭露或描述,以此來激怒他人;
    4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應,蓄意制造事端;
    5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
    6)謾罵:以不文明的語言對他人進行負面評價;
    7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
    8)威脅:許諾以不良的后果來迫使他人服從自己的意志;


3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網站秩序的內容,或進行相關行為。主要表現為:
    1)多次發(fā)布包含售賣產品、提供服務、宣傳推廣內容的垃圾廣告。包括但不限于以下幾種形式:
    2)單個帳號多次發(fā)布包含垃圾廣告的內容;
    3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內容;
    4)多次發(fā)布包含欺騙性外鏈的內容,如未注明的淘寶客鏈接、跳轉網站等,誘騙用戶點擊鏈接
    5)發(fā)布大量包含推廣鏈接、產品、品牌等內容獲取搜索引擎中的不正當曝光;
    6)購買或出售帳號之間虛假地互動,發(fā)布干擾網站秩序的推廣內容及相關交易。
    7)發(fā)布包含欺騙性的惡意營銷內容,如通過偽造經歷、冒充他人等方式進行惡意營銷;
    8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內容審核的廣告內容。


4. 色情低俗信息,主要表現為:
    1)包含自己或他人性經驗的細節(jié)描述或露骨的感受描述;
    2)涉及色情段子、兩性笑話的低俗內容;
    3)配圖、頭圖中包含庸俗或挑逗性圖片的內容;
    4)帶有性暗示、性挑逗等易使人產生性聯(lián)想;
    5)展現血腥、驚悚、殘忍等致人身心不適;
    6)炒作緋聞、丑聞、劣跡等;
    7)宣揚低俗、庸俗、媚俗內容。


5. 不實信息,主要表現為:
    1)可能存在事實性錯誤或者造謠等內容;
    2)存在事實夸大、偽造虛假經歷等誤導他人的內容;
    3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機構或個人存在關聯(lián)。


6. 傳播封建迷信,主要表現為:
    1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治?。?br />    2)求推薦算命看相大師;
    3)針對具體風水等問題進行求助或咨詢;
    4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;


7. 文章標題黨,主要表現為:
    1)以各種夸張、獵奇、不合常理的表現手法等行為來誘導用戶;
    2)內容與標題之間存在嚴重不實或者原意扭曲;
    3)使用夸張標題,內容與標題嚴重不符的。


8.「飯圈」亂象行為,主要表現為:
    1)誘導未成年人應援集資、高額消費、投票打榜
    2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
    3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
    4)以號召粉絲、雇用網絡水軍、「養(yǎng)號」形式刷量控評等行為
    5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序


9. 其他危害行為或內容,主要表現為:
    1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導未成年人不良嗜好影響未成年人身心健康的;
    2)不當評述自然災害、重大事故等災難的;
    3)美化、粉飾侵略戰(zhàn)爭行為的;
    4)法律、行政法規(guī)禁止,或可能對網絡生態(tài)造成不良影響的其他內容。


二、違規(guī)處罰
本網站通過主動發(fā)現和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內容質量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當一個用戶發(fā)布違規(guī)內容時,本網站將依據相關用戶違規(guī)情節(jié)嚴重程度,對帳號進行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內容時,本網站將加重處罰。


三、申訴
隨著平臺管理經驗的不斷豐富,本網站出于維護本網站氛圍和秩序的目的,將不斷完善本公約。
如果本網站用戶對本網站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網站進行反饋。
(規(guī)則的最終解釋權歸屬本網站所有)

我知道了
恭喜你~答對了
+5羽毛
下一次認真讀哦
成功推薦給其他人
+ 10羽毛
評論成功且進入審核!審核通過后,您將獲得10羽毛的獎勵。分享本文章給好友閱讀最高再得15羽毛~
(羽毛可至 "羽毛精選" 兌換禮品)
好友微信掃一掃
復制鏈接