基於粗糙集和相關係數分析的決策規則生成

2022-04-10 19:47:31 字數 901 閱讀 4167

摘要從不確定的資訊表中進行決策規則的生成是重要的研究課題。rough集(粗集)理論是一種處理不確定或模糊知識的重要工具,決策規則的相關係數分析能對決策規則的準確度和覆蓋度進行描述。本文介紹基於rough集方法對決策表進行屬性約簡和屬性值約簡,去除決策表中與決策無關的冗餘資訊。

在簡化後得出決策規則中再基於規則的相關係數分析來實現決策表的規則生成。文中給出了利用分明矩陣化簡決策表的演算法和衡量決策規則的相關係數,通過具體例項對規則生成進行了詳細說明。

關鍵詞 rough集;約簡;核;相關係數

**資助:江西省重點攻關專案(no. 20061b01002)

江西省教育廳科技計畫專案(贛教技字[2007]28號)

1引言rough set(粗糙集)理論是乙個處理含糊和不精確問題的數學工具[1],已經被廣泛應用在人工智慧、模式識別核新材料合成等領域[2-4]。rough集對資訊系統的約簡就是考察近似空間中每個等價關係是否都是必要的,能不能在保持原有的分類能力下盡可能地去刪除冗餘的資訊,而不影響其原有區分功能。本文首先運用rough集的方法將資訊系統中的決策表進行屬性及屬性值約簡得到決策規則,然後利用相關係數分析所得出的相關規則,並通過乙個例項加以說明。

規則的相關係數

(以下介紹中s代表資訊表s=(u,a,v,f))

(1)support用來表示在資訊表中,滿足規則ab的所有物件的數目。

supports(a,b)=card(s)

其中card 表示資訊表中含有規則ab的物件的數目

(2)certainty為準確度,用來表示在規則ab中 ,若條件a為真時,規則ab為真的概率。

certaintys(a,b)= card(s)/ card(s)

其中card(s)表示滿足條件a 的所有物件的數目 。

(3)coverage為覆蓋度,表示規則ab中,b為真時,規則ab為真的概率。

資料探勘與知識發現 講稿6粗糙集挖掘技術

第6章基於粗糙集 rough set 理論的資料探勘技術 粗糙集理論是由波蘭華沙理工大學數學家於1982年提出的一種資料分析理論,該理論在分類意義下定義了模糊性和不確定性兩個概念。是一種處理不完整資料 不精確知識的表達 學習 歸納等的一種新型數學工具。粗集理論的重要特點是 不需要任何附加資訊或先驗知...

基於問題學習和基於專案學習的案例和區別

基於專案學習案例 案例分析 人類活動對興凱湖自然環境的影響 人類活動對興凱湖自然環境的影響 是教育部 微軟 中國 攜手助學 資訊科技創新應用主題活動之一,是乙個典型的pbl教學案例。為了了解興凱湖地區自然資源和生態環境在60年間發生的變化,學生通過社會調查 專題訪談 實地考察 網路資訊搜尋 資料綜合...

基於DBSCAN和K MEANS聚類演算法

本文 腳印 網 在當前的資料探勘技術中,應用到入侵檢測系統的典型演算法主要有4種 頻繁情節規則挖掘演算法,關聯規則挖掘演算法,分類演算法,聚類演算法。其中前3種是基於有訓練指導的學習方法,要建立資料訓練模型。假如在訓練資料集中含有一些潛在的攻擊行為,則該演算法就不能正常檢測出入侵行為。而聚類演算法,...