0人贊同了該回答
? 粗糙集理論是一種研究不精確、不確定性知識的數學工具。目前受到了KDD的廣泛重視,利用粗糙集理論對數據進行處理是一種十分有效的精簡數據維數的方法。我們所處理的數據一般存在信息的含糊性(Vagueness)問題。含糊性有三種:術語的模糊性,如高矮;數據的不確定性,如噪聲引起的;知識自身的不確定性,如規(guī)則的前后件間的依賴關系并不是完全可靠的。在KDD中,對不確定數據和噪聲干擾的處理是粗糙集方法的
在數據庫中,許多屬性都是可以進行數據歸類,各屬性值和概念依據抽象程度不同可以構成一個層次結構,概念的這種層次結構通常稱為概念樹。概念樹一般由領域專家提供,它將各個層次的概念按一般到特殊的順序排列。
特征知識和分類知識是普化知識的兩種主要形式,其算法基本上可以分為兩類:數據立方方法和面向屬性歸納方法。
普通的基于面向屬性歸納方法在歸納屬性的選擇上有一定的盲目性,在歸納過程中,當供選擇的可歸納屬性有多個時,通常是隨機選取一個進行歸納。事實上,不同的屬性歸納次序獲得的結果知識可能是不同的,根據信息論最大墑的概念,應該選用一個信息丟失最小的歸納次序。
我們可以采用統(tǒng)計分析中的一些算法來進行特征屬性的選取,比如主成分分析、逐步回歸分析、公共因素模型分析等。這些方法的共同特征是,用少量的特征元組去描述高維的原始知識基。
遺傳算法是一種基于生物進化論和分子遺傳學的全局隨機搜索算法。遺傳算法的基本思想是:將問題的可能解按某種形式進行編碼,形成染色體。隨機選取N個染色體構成初始種群。再根據預定的評價函數對每個染色體計算適應值。選擇適應值高的染色體進行復制,通過遺傳運算(選擇、交叉、變異)來產生一群新的更適應環(huán)境的染色體,形成新的種群。這樣一代一代不斷繁殖進化,最后收斂到一個最適合環(huán)境的個體上,從而求得問題的最優(yōu)解。遺傳算法應用的關鍵是適應度函數的建立和染色體的描述。在實際應用中,通常將它和神經網絡方法綜合使用。通過遺傳算法來搜尋出更重要的變量組合。
信息系統(tǒng)(Information system),是由計算機硬件、網絡和通信設備、計算機軟件、信息資源、信息用戶和規(guī)章制度組成的以處理信息流為目的的人機一體化系統(tǒng)。主要有五個基本功能,即對信息的輸入、存儲、處理、輸出和控制。信息系統(tǒng)經歷了簡單的數據處理信息系統(tǒng)、孤立的業(yè)務管理信息系統(tǒng)、集成的智能信息系統(tǒng)三個發(fā)展階段。
信息系統(tǒng),是指由計算機硬件、網絡和通訊設備、計算機軟件、信息資源、信息用戶和規(guī)章制度組成的以處理信息流為目的的人機一體化系統(tǒng)。簡單地說,信息系統(tǒng)就是輸入數據信息,通過加工處理產生信息的系統(tǒng)。
一般來說,信息系統(tǒng)具有如下幾個概念:
信息系統(tǒng)是任何組織中都有的一個子系統(tǒng),是為了生產和管理服務的。對于從事物質生產及具體工作的部門來說,它總是管理或控制系統(tǒng)中的一部分。 [2]
信息系統(tǒng)有別于其它子系統(tǒng),像人的神經系統(tǒng)分布于全身每一個器官一樣,信息系統(tǒng)也滲透到組織中的每一個部門當中。
信息系統(tǒng)的作用與其它系統(tǒng)有些不同,它不從事某一具體的實物性工作,而是關系全局的協(xié)調一致。因而組織越大,改進信息系統(tǒng)所帶來的經濟效益也就越大。信息系統(tǒng)的運轉情況與整個組織的效率密切相關。
發(fā)布于2023-07-13