資料探勘課程報告

2021-03-04 05:28:05 字數 1678 閱讀 5925

southwest university of science and technology

id3演算法

2023年12月

宣告 在辛苦的將這個**寫完之後,懷著忐忑的心情讓眾所周知的學霸大神指點看看有什麼不妥的地方,沒有想到還是出現了乙個bug。

因此在這裡作乙個宣告,以免引起不必要的誤會。

由於我選擇的課題id3演算法分析,早在86年,在資料探勘這個科目之前就已經有學者提出了,因此在分析上雖然經典但是早已有更新版本出現。在查詢百科的時候甚至有這樣說法:詳細請查詢改進版。

於是在找實驗用例的時候就難以尋找,由於筆者能力有限也無法編制乙個特別有針對性的用例,在苦思之後突然筆者靈光一閃,既然這個版本的用例很難尋找,那何不用改進版的例子進行實驗呢?於是就套用了實驗中的例子(考慮到這個例子很經典,並且很有針對性,有助於**理論的理解),請放心,用例是這樣的,但是方法完全是按照本文演算法進行計算的,沒有抄襲的可能。

在詢問了學霸兼大神之後,他說在這方面會有一些麻煩建議我換乙個例子,但是做乙個例子並完全畫出各種圖,只有做的人才明白這有多麼費勁。於是在此作一下宣告。

懷著忐忑的心情,獻上此宣告,並為此致以深深的歉意。

如有任何疑問,請撥打:

2023年12月3日

摘要 1

關鍵字 1

第一章緒論2

1.1 引言3

1.2 什麼是id3演算法3

1.3資訊熵4

1.4資訊增益4

1.5 id3演算法流程4

第二章id3演算法5

2.1 id3演算法5

2.2 公式5

2.2.1 公式一5

2.2.2 公式二5

2.2.3 公式三5

第三章實驗用例6

3.1 網球與天氣6

3.2 學生成績8

第四章id3演算法發展11

4.1 id3演算法11

4.2 id4演算法12

4.3 id5演算法12

第五章個人評價12

參考文獻13

致謝14

id3演算法

【摘要】

決策樹演算法是資料探勘領域的核心分類演算法之一,依據學習演算法可以建立能夠準確地**未知樣本類標號的模型。分類方法的例項包括:決策樹分類法、基於規則的分類法、神經網路、支援向量級、樸素貝葉斯分類方法等。

相對於其他幾種演算法而言,id3演算法理論清晰,演算法簡單,是很有實用價值的例項學習演算法,計算時間是例子個數、特徵屬性個數、節點個數屬性之積的線性函式,總**準確率較高,針對屬性選擇問題,是決策樹學習方法中最具影響和最為典型的演算法。id3演算法理論清晰、使用簡單、學習能力較強,且構造的決策樹平均深度較小,分類速度較快,特別適合處理大規模的學習問題,目前已經得到廣泛的應用。本文主要講述id3演算法的相關知識,對於id3演算法的分析,實驗結果分析,在對演算法的分析還有演算法實驗結果分析之後對id3演算法的總結還有展望。

【關鍵字】

id3演算法介紹 id3演算法分析 id3演算法例項 id3演算法實驗結果分析 id3演算法總結 id3演算法展望個人評價

第1章緒論

1.1 引言

接觸資料探勘還要得益於我的老師吳珏老師,之前我甚至沒有聽說過這一門知識,在知道這個詞之後,一瞬間發現原來這種技術早已經充溢在我們的周圍,這項技術早已經被廣泛應用,連我最喜愛的《紙牌屋》也是這一項技術的高科技結晶!於是我對這門課有了極大的興趣,並申請報了吳珏老師的《資料探勘技術》這門課,並簡單的了解這一門技術。

資料探勘實習報告

通過半年的實習,我在這裡得到了一次較全面的 系統的鍛鍊,也學到了許多書本上所學不到的知識和技能。以下是我這次的實習鑑定。經歷了實習,對社會也有了基本的實踐,讓我學到了書本以外的知識,實習期間,我努力盡量做到理論與實踐相結合,在實習期間能夠遵守工作紀律,不遲到 早退,認真完成領導交辦的工作。在實習鑑定...

資料倉儲與挖掘課程設計報告

設計課題 id3演算法與c4.5演算法的比較分析 專業班級 086081 01 學生姓名 李小龍 學生學號 20071003550 指導教師 蔣良孝 成績二 一 年十月二十日 1 背景知識 決策樹是對資料進行分類,以此達到 的目的。該決策樹方法先根據訓練集資料形成決策樹,如果該樹不能對所有物件給出正...

資料探勘實驗報告 關聯規則挖掘

關聯規則挖掘 姓名 李聖傑 班級 計算機1304 學號 1311610602 一 實驗目的 1.1.掌握關聯規則挖掘的apriori演算法 2.將apriori演算法用具體的程式語言實現。二 實驗裝置 pc一台,dev c 5.11 三 實驗內容 根據下列的apriori演算法進行程式設計 四 實驗...