很可惜 T 。T 您現(xiàn)在還不是作者身份,不能自主發(fā)稿哦~
如有投稿需求,請把文章發(fā)送到郵箱tougao@appcpx.com,一經錄用會有專人和您聯(lián)系
咨詢如何成為春羽作者請聯(lián)系:鳥哥筆記小羽毛(ngbjxym)
在大數(shù)據(jù)時代,基于大數(shù)據(jù)技術的職位更有錢途,因此成為很多人的職業(yè)首選。在大數(shù)據(jù)技術中,大家常常聽到 Hadoop,很多剛開始接觸的人會問,什么是 Hadoop?它有什么作用?下面筆者就跟大家嘮叨嘮叨。
大數(shù)據(jù)(BigData):指無法在一定時間內用常規(guī)軟件工具對其進行獲取、存儲、管理和處理的數(shù)據(jù)集合。換句話說,大數(shù)據(jù)所包含的數(shù)據(jù)集合的大小,普通軟件沒有辦法在一個可以容忍的時間范圍內完成大數(shù)據(jù)的捕獲和處理。
按順序給出數(shù)據(jù)存儲單位,如下圖。
目前,大家普遍認為的大數(shù)據(jù)是具有 “4V”,即 Volume、Velocity、Variety、Veracity 特征的數(shù)據(jù)集合。如下圖,分別對每個特征作簡要描述。
1)Volume:生成和存儲的數(shù)據(jù)量巨大
隨著技術的發(fā)展,數(shù)據(jù)集合的規(guī)模不斷擴大,已經從 GB 級增加到 TB 級再增加到 PB 級,近年來,數(shù)據(jù)量甚至開始以 EB 級和 ZB 級來計量。比如,百度每日處理的數(shù)據(jù)量達上百 PB,總的數(shù)據(jù)量規(guī)模已經達到 EB 級。
2)Velocity:數(shù)據(jù)產生和處理速度快
加速的原因是數(shù)據(jù)創(chuàng)建的實時性特點,以及將流數(shù)據(jù)結合到業(yè)務流程和決策過程中的需求。數(shù)據(jù)處理速度快,處理模式已經開始從批處理轉向流處理。比如,2020 天貓 “雙十一” 當天,訂單創(chuàng)建峰值達 58.3 萬筆/秒。
3)Variety:數(shù)據(jù)源和數(shù)據(jù)種類多樣
現(xiàn)在要處理的數(shù)據(jù)來源不只是格式化數(shù)據(jù),更多的是半結構化或結構化數(shù)據(jù)。比如關系數(shù)據(jù)庫、NoSQL、即時消息、圖片、音視頻流等,而且每天都會產生新的數(shù)據(jù)格式和數(shù)據(jù)源。
4)Veracity:數(shù)據(jù)的價值密度低
由于大數(shù)據(jù)總體量不斷加大,單位數(shù)據(jù)的價值密度逐漸降低,然而數(shù)據(jù)的整體價值不斷提高。比如,在城市的道路上增設信號燈,在 24 小時內的監(jiān)控中,有用的數(shù)據(jù)可能僅僅只有幾分鐘,但是卻降低了 50% 以上的交通事故率。
大數(shù)據(jù)無處不在,大數(shù)據(jù)應用于各個行業(yè),包括旅游、金融和零售等在內的社會各行各業(yè)都已經融入了大數(shù)據(jù)的軌跡。
1)旅游
深度結合大數(shù)據(jù)能力與旅游行業(yè)需求,共建旅游產業(yè)智慧管理、智慧服務和智慧營銷的未來。
2)金融
多維度體系用戶特征,幫助金融機構推薦優(yōu)質客戶,防范欺詐風險。
其中,欺詐風險的防控,本質上也是通過對歷史欺詐行為的分析,不斷梳理完善風險特征庫,比如異地登錄、非常用設備登錄等行為,都是一種風險信號,建立一系列的風險規(guī)則判定集,預測用戶行為背后的欺詐概率。
3)零售
嘗試多維度給用戶推薦可能喜歡的商品。如下圖,筆者輸入 “松達” 關鍵字,立刻推薦了 7 組關鍵字,太了解我了,么么噠!
大數(shù)據(jù)的價值,遠遠不止于此,大數(shù)據(jù)對各行各業(yè)的滲透,大大推動了社會生產和生活,未來必將產生重大而深遠的影響。
Hadoop 是一個由 Apache 軟件基金會所開發(fā)的分布式系統(tǒng)基礎架構,具有高容錯、高可靠性、高擴展性等特點。特別適合寫一次,讀多次的場景。
Hadoop 的核心架構
Hadoop 以分布式文件系統(tǒng) HDFS 和分布式運算框架 MapReduce 為核心,為用戶提供系統(tǒng)底層細節(jié)透明的分布式基礎架構。其中,HDFS 的高容錯性、高伸縮性等優(yōu)點允許用戶將 Hadoop 部署在低廉的硬件上,形成分布式文件系統(tǒng);MapReduce 允許用戶在不了解分布式系統(tǒng)底層細節(jié)的情況下開發(fā)并行應用程序。所以,Hadoop 具有高容錯、高可靠性、高擴展性等特點。
Hadoop 目前版本(2.0 版)含有以下模塊(如下圖):
1)HDFS:是支持應用數(shù)據(jù)高吞吐量訪問的分布式文件系統(tǒng);
2)YARN:是用于作業(yè)調度和集群資源管理的框架;
3)MapReduce:基于 YARN 的大數(shù)據(jù)并行處理系統(tǒng);
4)Others:支持其他 Hadoop 模塊的通用工具集。
Hadoop 2.0 比起 Hadoop 1.0 來說,在 HDFS 之上,增加了 YARN(分布式資源管理)層。它是一個資源管理模塊,為各類應用程序提供資源管理和調度。
此外,Hadoop 2.0 版本還提升了系統(tǒng)的穩(wěn)定性。所以,現(xiàn)在企業(yè)里基本上都是使用 2.X 版本。
生態(tài)系統(tǒng),顧名思義就是很多組件組成的一個生態(tài)鏈,經過多年的發(fā)展,Hadoop 生態(tài)系統(tǒng)不斷完善和成熟。目前已經包括了多個部件,除了核心的 HDFS、YARN 和 MapReduce 以外,Hadoop 生態(tài)系統(tǒng)還包括 Zookeeper、HBase、Hive、Spark、Sqoop、Flume、Ambari 等功能組件。
在整個 Hadoop 架構中,計算框架(如 MapReduce、Tez 等)起到承上啟下的作用,一方面可以操作 HDFS 中的數(shù)據(jù),另一方面可以被封裝,以方便上層組件(如 Hive、Pig 等)調用。
下面筆者簡單介紹其中幾個比較常用的組件。
2.2.1 HDFS
HDFS 是一個高度容錯性的分布式文件系統(tǒng),適合部署在廉價的機器上。HDFS 能提供高吞吐量的數(shù)據(jù)訪問,非常適合大規(guī)模數(shù)據(jù)集上的應用。
HDFS 適應一次寫入,多次讀出的場景,且不支持文件的修改。由于不便修改、延遲大、網絡開銷大、成本高,適合用來做數(shù)據(jù)分析,不適合用來做網盤。
1)HDFS 架構
HDFS 采用 master/slave(主/從)架構。一個 HDFS 集群是由一個 NameNode 和若干數(shù)目的 DataNodes 組成,如下圖。
(1)NameNode
NameNode 是主節(jié)點,是一個中心服務器,負責管理文件系統(tǒng)的名字空間(Namespace)以及客戶端對文件的訪問。具體說的話,NameNode 執(zhí)行文件系統(tǒng)的名字空間操作,例如打開、關閉、重命名文件或目錄。它也負責確定數(shù)據(jù)塊到具體 DataNode 節(jié)點的映射。并且,在 NameNode 的統(tǒng)一調度下進行數(shù)據(jù)塊的創(chuàng)建、刪除和復制。
(2)Secondary NameNode
定時與 NameNode 進行同步(定期合并文件系統(tǒng)鏡像和編輯日志,然后把合并后的傳給 NameNode,替換其鏡像,并清空編輯日志),但 NameNode 失效后仍需要手工將其設置成主機。
(3)DataNode
集群中的 DataNode 一般是從節(jié)點,是文件存儲的最基本的單元。它將數(shù)據(jù)塊(Block)存儲在本地文件系統(tǒng)中,并保存了數(shù)據(jù)塊(Block)的元信息,同時周期性地向所有存儲該數(shù)據(jù)塊(Block)信息的 NameNode 發(fā)送信息。
(4)數(shù)據(jù)塊(Block)的概念
Block 是 HDFS 中的基本存儲單位,默認大小在 Hadoop2.x 版本中為 128MB,老版本中是 64MB;
一個大文件會被拆分成一個個的塊,然后存儲于不同的機器。如果一個文件少于 Block 大小,那么實際占用的空間為其文件的大??;
基本的讀寫單位,類似于磁盤的頁,每次都是讀寫一個塊。
2)HDFS 文件讀寫
(1)寫文件
Client 向 NameNode 發(fā)送數(shù)據(jù)寫操作請求,包括文件名和目錄路徑等部分數(shù)據(jù)信息;NameNode 告訴 Client 到哪個數(shù)據(jù)節(jié)點進行具體的數(shù)據(jù)寫入;Client 直接將文件數(shù)據(jù)傳輸給 DataNode,由 DataNode 的后臺程序負責將數(shù)據(jù)保存到服務器的本地文件系統(tǒng)之中。
(2)讀文件
Client 向 NameNode 發(fā)送數(shù)據(jù)讀操作請求,NameNode 向客戶端發(fā)送組成該文件的數(shù)據(jù)塊的位置列表(即每個數(shù)據(jù)塊存儲哪些 DataNode),Client 直接從這些 DataNode 讀取文件數(shù)據(jù)(在讀數(shù)據(jù)過程中,NameNode 不參與文件的傳輸),如下圖。
2.2.2 MapReduce
MapReduce 是一個分布式計算軟件框架,具有擴展性良好、高容錯性的特點,且支持處理 T 級別的數(shù)據(jù)離線處理。
在 MapReduce 中,一個準備提交執(zhí)行的應用程序稱為 “作業(yè)(job)”,而從一個作業(yè)劃分出的運行于各個計算節(jié)點的工作單元稱為 “任務(task)”。
一個 MapReduce1.0 作業(yè)(job)通常會把輸入的數(shù)據(jù)集切分為若干獨立的數(shù)據(jù)塊,由 map 以完全并行的方式處理任務(task)??蚣軙?map 的輸出先進行排序,然后把結果輸入給 reduce。通常作業(yè)的輸入和輸出都會被存儲在文件系統(tǒng)中。整個框架負責任務的調度和監(jiān)控,以及重新執(zhí)行已經失敗的任務。舉個官方提供的 WordCount 例子,如下圖。
在 WordCount 程序中,MapReduce 會對輸入的作業(yè)(job)先進性切分,這一步其實就是分治算法中 “分” 的過程。切分后不同部分就會讓不同的機器去執(zhí)行 Map 操作。而后便是 Shuffle(實質是歸并排序),這一階段會將相同的單詞加到一起,最后再進行 Reduce(規(guī)約),統(tǒng)計出結果并輸出到文件。
通常,MapReduce 由一個單獨的 Master JobTracker 和每個集群節(jié)點上一個 Slave TaskTracker 共同組成。Master 負責調度構成一個作業(yè)的所有任務,這些任務分布在不同的 Slave 上,Master 監(jiān)控它們的執(zhí)行,并且監(jiān)控重新執(zhí)行已經失敗的任務。而 Slave 僅負責執(zhí)行由 Master 指派的任務。
2.2.3 YARN
YARN 是 Hadoop2.0 中的資源管理系統(tǒng),它的引入為集群在利用率、資源統(tǒng)一管理和數(shù)據(jù)共享等方面帶來了巨大好處。
它的基本設計思想是將 MRv1 中的 JobTracker 拆分成了兩個獨立的服務:一個全局的資源調度器 ResourceManager 和每個應用程序特有的應用程序管理器 ApplicationMaster,該調度器是一個 “純調度器”,不再參與任何與具體應用程序邏輯相關的工作,而僅根據(jù)各個應用程序的資源需求進行分配,資源分配的單位用一個資源抽象概念 “Container” 來表示,Container 封裝了內存和 CPU。
此外,調度器是一個可插拔的組件,用戶可根據(jù)自己的需求設計新的調度器,YARN 自身提供了 Fair Scheduler 和 Capacity Scheduler。
應用程序管理器負責管理整個系統(tǒng)中所有應用程序,包括應用程序的提交、與調度器協(xié)商資源以啟動 ApplicationMaster、監(jiān)控 ApplicationMaster 運行狀態(tài)并在失敗時重新啟動等。
2.2.4 Hive
Hive 由 Facebook 實現(xiàn)并開源,是基于 Hadoop 的一個數(shù)據(jù)倉庫工具,可以將結構化的數(shù)據(jù)映射為一張數(shù)據(jù)庫表,并提供 HQL(Hive SQL)查詢功能。
其實,Hive 的本質就是將 SQL 語句轉換成 MapReduce 任務執(zhí)行,也就是說,使不熟悉 MapReduce 的用戶很方便地使用 HQL 處理和計算 HDFS 上的結構化的數(shù)據(jù),如下圖。
1)Hive的架構
(1)Hive的用戶接口層
CLI,即 Shell 終端命令行,采用交互形式使用 Hive 命令與 Hive 進行交互。
JDBC/ODBC,開發(fā)人員或運維人員通過 JDBC 提供的客戶端連接至 Hive server 服務。
Web UI,通過瀏覽器訪問 Hive。
(2)跨語言服務
Thrift server 提供了一種能力,用戶可以使用多種不同的語言(如Java、C++、Ruby等)來操作 Hive。
(3)底層的 Driver
Driver 組件完成 HQL 查詢語句從詞法分析、語法分析、編譯、優(yōu)化及生成邏輯執(zhí)行語句,生成的邏輯執(zhí)行語句存儲在 HDFS 中,接下來 MapReduce 調用執(zhí)行。
Hive 的核心是驅動引擎,它由四部分組成:解釋器、編譯器、優(yōu)化器、執(zhí)行器。
(4)元數(shù)據(jù)存儲系統(tǒng)
Hive 中的元數(shù)據(jù)一般包括:數(shù)據(jù)庫的基本信息、表的基本信息等。
元數(shù)據(jù)信息一般存儲在 Mysql 數(shù)據(jù)庫中。
2)Hive與RDBMS比較
Hive 與 RDBMS 應用場景完全不同,Hive 僅適合用來做海量數(shù)據(jù)離線統(tǒng)計分析,即數(shù)據(jù)倉庫。
2.2.5 Pig
Pig 是一種編程語言,它簡化了 Hadoop 常見的工作任務,Pig 為大型數(shù)據(jù)集處理提供了更高層次的抽象,與 MapReduce 相比,Pig 提供了更豐富的數(shù)據(jù)結構,一般都是多值和嵌套的數(shù)據(jù)結構。
2.2.6 HBase
HBase 是 Apache 的 Hadoop 項目的子項目,是 Hadoop Database 的簡稱。
HBase 是一個高可靠、高性能、面向列、可伸縮的分布式存儲系統(tǒng),利用 HBase 技術可在廉價 PC Server 上搭建大規(guī)模結構化存儲集群。
HBase 是一個分布式的、面向列族的開源數(shù)據(jù)庫,構建在 Apache Hadoop 和 Apache Zookeeper 之上。HBase 不同于一般的關系數(shù)據(jù)庫,它是一個適合于非結構化數(shù)據(jù)存儲的數(shù)據(jù)庫。另一個不同的是 HBase 基于列的而不是基于行的模式。
雖然 Hadoop 是一個高容錯、高延時的分布式文件系統(tǒng)和高并發(fā)的批處理系統(tǒng),但是它不適用于提供實時計算。
然而,HBase 是可以提供實時計算的分布式數(shù)據(jù)庫,數(shù)據(jù)保存在 HDFS 分布式文件系統(tǒng)上,由 HDFS 保證其高容錯性。HBase 內部使用哈希表和提供隨機接入,并且其存儲索引,可將在 HDFS 文件中的數(shù)據(jù)進行快速查找。
2.2.7 Zookeeper
Zookeeper 作為一個分布式服務框架,是 Apache Hadoop 的一個子項目,是基于 Fast Paxos 算法實現(xiàn),它主要用來解決分布式系統(tǒng)中的一些數(shù)據(jù)管理問題,如:統(tǒng)一命名服務、狀態(tài)同步服務、集群管理、分布式應用配置項的管理等。
一個典型的分布式數(shù)據(jù)一致性的解決方案,分布式應用程序可以基于它實現(xiàn)諸如數(shù)據(jù)發(fā)布/訂閱、負載均衡、命名服務、分布式協(xié)調/通知、集群管理、Master 選舉、分布式鎖和分布式隊列等功能。
2.2.8 Oozie
Apache Oozie 是一個開源的工作流和協(xié)作服務引擎,基于 Apache Hadoop 的數(shù)據(jù)處理任務。Oozie 是可擴展的、可伸縮的面向數(shù)據(jù)的服務,運行在 Hadoop 平臺上,用來調度與管理 Hadoop 任務,比如:MapReduce、Pig 等。
Oozie 的工作流必須是一個有向無環(huán)圖,實際上 Oozie 就相當于 Hadoop 的一個客戶端,當用戶需要執(zhí)行多個關聯(lián)的MR任務時,只需要將MR執(zhí)行順序寫入 workflow.xml,然后使用 Oozie 提交本次任務,Oozie 會托管此任務流。
在實際的業(yè)務中處理數(shù)據(jù)時一般包含多個 MR,這些 MR 可能是 Java 或 HDFS,甚至是 Shell 腳本。這時,使用 Oozie 可以輕松完成這種多樣的工作流。在使用 Oozie 時,若前一個任務執(zhí)行失敗,后一個任務將不會被調度。
2.2.9 Sqoop
Sqoop 是 SQL to Hadoop 的縮寫,是數(shù)據(jù)庫 ETL 工具。主要作用于結構化的數(shù)據(jù)存儲與 Hadoop 之間進行雙向交換。也就是說,Sqoop 可以將關系型數(shù)據(jù)庫的數(shù)據(jù)導入到 HDFS、Hive,也可以從 HDFS、Hive 導出到關系型數(shù)據(jù)庫中。
Sqoop 核心設計思想是利用 MapReduce 加快數(shù)據(jù)傳輸速度,也就是說 Sqoop 的導入和導出功能是通過 MapReduce 作業(yè)實現(xiàn)的,所以它是以批處理方式進行數(shù)據(jù)傳輸,難以實現(xiàn)實時數(shù)據(jù)的導入和導出。
2.2.10 Flume
Flume 是 Cloudera 提供的一個高可用、高可靠,分布式的海量日志采集、聚合和傳輸系統(tǒng),F(xiàn)lume 支持在日志系統(tǒng)中定制各類數(shù)據(jù)發(fā)送方,用于數(shù)據(jù)收集;同時 Flume 提供對數(shù)據(jù)進行簡單處理,并寫到各種數(shù)據(jù)接收方(比如HDFS、HBase等)的能力。
2.2.11 Kafka
Kafka 是由 Apache 軟件基金會開發(fā)的一個開源流處理平臺,由 Scala 和 Java 編寫。
Kafka 是一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng)。具有分布式、高可用的特性,在大數(shù)據(jù)系統(tǒng)里被廣泛使用,如果把大數(shù)據(jù)系統(tǒng)比作一臺機器,那么 Kafka 就是前端總線,它連接了平臺中的各個組件。
Kafka 的目的是通過 Hadoop 的并行加載機制來統(tǒng)一線上和離線的消息處理,也是為了通過集群來提供實時的消息。
看得有些暈了吧?可以看下面這張圖更直觀些。
從上面列舉的組件看出,Hadoop 擁有二十多種組件,同時,也說明了 Hadoop 的應用范圍非常廣泛,包括:日志采集、數(shù)據(jù)存儲、數(shù)據(jù)處理、數(shù)據(jù)分析等,都可以使用它順利實現(xiàn)。
-END-
本文為作者獨立觀點,不代表鳥哥筆記立場,未經允許不得轉載。
《鳥哥筆記版權及免責申明》 如對文章、圖片、字體等版權有疑問,請點擊 反饋舉報
我們致力于提供一個高質量內容的交流平臺。為落實國家互聯(lián)網信息辦公室“依法管網、依法辦網、依法上網”的要求,為完善跟帖評論自律管理,為了保護用戶創(chuàng)造的內容、維護開放、真實、專業(yè)的平臺氛圍,我們團隊將依據(jù)本公約中的條款對注冊用戶和發(fā)布在本平臺的內容進行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質內容,同時也將采取必要措施管理違法、侵權或有其他不良影響的網絡信息。
一、根據(jù)《網絡信息內容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
1)反對憲法所確定的基本原則;
2)危害國家安全,泄露國家秘密,顛覆國家政權,破壞國家統(tǒng)一,損害國家榮譽和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
5)煽動民族仇恨、民族歧視,破壞民族團結;
6)破壞國家宗教政策,宣揚邪教和封建迷信;
7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動非法集會、結社、游行、示威、聚眾擾亂社會秩序;
10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權益;
11)通過網絡以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進行網絡欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內容;
2. 不友善:不尊重用戶及其所貢獻內容的信息或行為。主要表現(xiàn)為:
1)輕蔑:貶低、輕視他人及其勞動成果;
2)誹謗:捏造、散布虛假事實,損害他人名譽;
3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進行揭露或描述,以此來激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應,蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
6)謾罵:以不文明的語言對他人進行負面評價;
7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網站秩序的內容,或進行相關行為。主要表現(xiàn)為:
1)多次發(fā)布包含售賣產品、提供服務、宣傳推廣內容的垃圾廣告。包括但不限于以下幾種形式:
2)單個帳號多次發(fā)布包含垃圾廣告的內容;
3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內容;
4)多次發(fā)布包含欺騙性外鏈的內容,如未注明的淘寶客鏈接、跳轉網站等,誘騙用戶點擊鏈接
5)發(fā)布大量包含推廣鏈接、產品、品牌等內容獲取搜索引擎中的不正當曝光;
6)購買或出售帳號之間虛假地互動,發(fā)布干擾網站秩序的推廣內容及相關交易。
7)發(fā)布包含欺騙性的惡意營銷內容,如通過偽造經歷、冒充他人等方式進行惡意營銷;
8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內容審核的廣告內容。
4. 色情低俗信息,主要表現(xiàn)為:
1)包含自己或他人性經驗的細節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內容;
4)帶有性暗示、性挑逗等易使人產生性聯(lián)想;
5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚低俗、庸俗、媚俗內容。
5. 不實信息,主要表現(xiàn)為:
1)可能存在事實性錯誤或者造謠等內容;
2)存在事實夸大、偽造虛假經歷等誤導他人的內容;
3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機構或個人存在關聯(lián)。
6. 傳播封建迷信,主要表現(xiàn)為:
1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治病;
2)求推薦算命看相大師;
3)針對具體風水等問題進行求助或咨詢;
4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;
7. 文章標題黨,主要表現(xiàn)為:
1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來誘導用戶;
2)內容與標題之間存在嚴重不實或者原意扭曲;
3)使用夸張標題,內容與標題嚴重不符的。
8.「飯圈」亂象行為,主要表現(xiàn)為:
1)誘導未成年人應援集資、高額消費、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
4)以號召粉絲、雇用網絡水軍、「養(yǎng)號」形式刷量控評等行為
5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內容,主要表現(xiàn)為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導未成年人不良嗜好影響未成年人身心健康的;
2)不當評述自然災害、重大事故等災難的;
3)美化、粉飾侵略戰(zhàn)爭行為的;
4)法律、行政法規(guī)禁止,或可能對網絡生態(tài)造成不良影響的其他內容。
二、違規(guī)處罰
本網站通過主動發(fā)現(xiàn)和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內容質量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當一個用戶發(fā)布違規(guī)內容時,本網站將依據(jù)相關用戶違規(guī)情節(jié)嚴重程度,對帳號進行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內容時,本網站將加重處罰。
三、申訴
隨著平臺管理經驗的不斷豐富,本網站出于維護本網站氛圍和秩序的目的,將不斷完善本公約。
如果本網站用戶對本網站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網站進行反饋。
(規(guī)則的最終解釋權歸屬本網站所有)