《決策分析與決策樹算法優(yōu)化》針對(duì)決策技術(shù)中的決策樹算法進(jìn)行了深入分析和研究,與其他技術(shù)結(jié)合,提出了大量融合算法;創(chuàng)新性地借鑒了認(rèn)知物理學(xué)的研究思想,借鑒認(rèn)知物理的信息擴(kuò)散理論討論了參數(shù)波動(dòng)變化時(shí)規(guī)則的取舍;借鑒這樣的理論思想對(duì)傳統(tǒng)的ID3算法進(jìn)行了改進(jìn),在認(rèn)知物理原有的信息熵的概念上提出了信息補(bǔ)償,并在這種新的信息啟發(fā)下,提出了基于信息補(bǔ)償量的決策樹生成算法CID3算法,有效地解決了ID3取值偏向多值屬性的問題。
《決策分析與決策樹算法優(yōu)化》較完備地分析和整理了決策樹與粗糙集的理論及其方法。由于ID3算法不能較好地處理帶有不一致信息的數(shù)據(jù)集,這里選擇了基于信息熵的屬性約簡進(jìn)行數(shù)據(jù)預(yù)處理。由于經(jīng)典的基于信息熵的屬性約簡算法的時(shí)間復(fù)雜度不太理想,而結(jié)合差別矩陣的方法通俗易懂,所以《決策分析與決策樹算法優(yōu)化》提出了一個(gè)新的基于信息熵的屬性約簡的差別矩陣算法。該算法的時(shí)間復(fù)雜度較以前算法的時(shí)間復(fù)雜度要小,用新算法預(yù)處理數(shù)據(jù)集,可以預(yù)先去除一些不重要的屬性,從而可以生成簡單易懂的決策樹,提高決策樹的泛化能力和預(yù)測(cè)能力。
《決策分析與決策樹算法優(yōu)化》在對(duì)數(shù)據(jù)進(jìn)行預(yù)處理后,有效結(jié)合了決策樹和粗糙集理論各自的優(yōu)點(diǎn),提出了基于粗糙邊界的決策樹優(yōu)化算法。在該算法中,引入抑制因子,對(duì)即將擴(kuò)張的結(jié)點(diǎn),在常用的終止條件的基礎(chǔ)上加入一個(gè)新的終止條件,這樣不用通過剪枝就能生成一棵較合理的決策樹,從而避免了樹的過分細(xì)化而生成過于龐大的決策樹,便于用戶的理解,提高了決策樹的泛化能力和對(duì)未來數(shù)據(jù)的分類、預(yù)測(cè)能力。
引言
1 緒論
1.1 決策樹算法的概述
1.1.1 決策樹基本算法
1.1.2 ID3算法的起源及概述
1.1.3 改進(jìn)的ID3算法C4.5及決策樹算法的改進(jìn)
1.2 認(rèn)知物理學(xué)的研究
1.2.1 認(rèn)知論的發(fā)展和實(shí)踐意義
1.2.2 認(rèn)知物理學(xué)概述
1.2.3 借鑒物理學(xué)中的原子模型表示概念
1.2.4 借鑒物理學(xué)中的場(chǎng)描述客體間的相互作用
1.2.5 借鑒物理學(xué)中層次結(jié)構(gòu)描述知識(shí)發(fā)現(xiàn)狀態(tài)空間
1.3 粗糙集理論及其決策樹生成算法概述
1.3.1 基本知識(shí)
1.3.2 屬性約簡及其規(guī)則獲取
1.3.3 基于粗糙集的決策樹生成算法
1.4 結(jié)語
2 基于認(rèn)知物理學(xué)的決策樹優(yōu)化算法
2.1 基于語言場(chǎng)的知識(shí)表示方法
2.1.1 認(rèn)知物理學(xué)的云理論
2.1.2 認(rèn)知物理學(xué)的數(shù)據(jù)場(chǎng)思想
2.1.3 語言場(chǎng)與語言值結(jié)構(gòu)
2.1.4 知識(shí)表示方法
2.2 借鑒信息擴(kuò)散理論研究數(shù)據(jù)挖掘的后處理
2.2.1 認(rèn)知物理中的信息擴(kuò)散理論
2.2.2 信息擴(kuò)散理論用于研究數(shù)據(jù)挖掘的后處理
2.3 借鑒信息擴(kuò)散理論討論參數(shù)波動(dòng)變化時(shí)規(guī)則的取舍
2.3.1 參數(shù)演化規(guī)律的研究
2.3.2 參數(shù)波動(dòng)變化時(shí)規(guī)則的取舍
2.4 基于信息補(bǔ)償量的CID3算法
2.4.1 基于信息補(bǔ)償量的分類器的構(gòu)造
2.4.2 基于信息補(bǔ)償量的CID3算法
2.4.3CID3算法與ID3算法的分析與比較
2.4.4 實(shí)例分析
2.5 結(jié)語
3 基于信息熵的屬性約簡算法的研究
3.1 基于粗糙集理論的屬性約簡算法
3.1.1 粗糙集理論的基本思想
3.1.2 常見的三種屬性約簡算法
3.2 理論分析與設(shè)計(jì)
3.2.1 基本知識(shí)
3.2.2 求簡化決策表的算法
3.2.3 信息熵屬性約簡的差別矩陣方法
3.2.4 基于信息熵的差別矩陣的屬性約簡算法
3.3 結(jié)語
4 基于粗糙邊界的決策樹優(yōu)化算法
4.1 傳統(tǒng)決策樹算法的不足
4.1.1 傳統(tǒng)決策樹剪枝的原因
4.1.2 構(gòu)造多變量決策樹的原因
4.1.3 基于粗糙集理論的決策樹構(gòu)造算法及其不足
4.1.4 基于可變精度的ID3改進(jìn)算法
4.2 基于粗糙邊界的決策樹生成算法
4.2.1 基于粗糙邊界的決策樹生成算法概述
4.2.2 基于粗糙邊界的決策樹生成算法的不足
4.3 改進(jìn)的基于粗糙邊界的決策樹優(yōu)化算法
4.3.1 改進(jìn)算法概述
4.3.2 實(shí)例分析
4.4 結(jié)語
5 改進(jìn)基于正區(qū)域的決策樹優(yōu)化算法
5.1 基于正區(qū)域的決策樹生成算法
5.1.1 基于正區(qū)域的決策樹生成算法概述
5.1.2 基于正區(qū)域的決策樹生成算法的不足
5.2 基于依賴度的決策樹生成算法
5.2.1 基于依賴度的決策樹生成算法概述
5.2.2 基于依賴度的決策樹生成算法的不足
5.3 基于粗糙集的決策樹生成算法比較
5.3.1 幾種生成算法的相關(guān)分析
5.3.2 等價(jià)證明
5.3.3 基于正區(qū)域的決策樹生成算法的詳細(xì)分析
5.4 基于正區(qū)域的決策樹優(yōu)化算法
5.4.1 改進(jìn)算法概述
5.4.2 實(shí)例分析
5.5 結(jié)語
6 基于關(guān)聯(lián)規(guī)則的決策樹優(yōu)化算法
6.1 關(guān)聯(lián)規(guī)則挖掘
6.1.1 關(guān)聯(lián)規(guī)則挖掘概述
6.1.2 關(guān)聯(lián)規(guī)則挖掘算法
6.1.3 關(guān)聯(lián)規(guī)則挖掘研究現(xiàn)狀
6.1.4 關(guān)聯(lián)規(guī)則挖掘與其他領(lǐng)域的關(guān)系
6.1.5 關(guān)聯(lián)規(guī)則挖掘工作的其他方向
6.2 基于關(guān)聯(lián)規(guī)則的決策樹的構(gòu)造
6.2.1 新屬性的生成
6.2.2 新屬性的評(píng)價(jià)
6.2.3 基于關(guān)聯(lián)規(guī)則的決策樹優(yōu)化算法
6.2.4 與相關(guān)分類方法的比較
6.2.5 實(shí)驗(yàn)驗(yàn)證
6.3 結(jié)語
結(jié)論與展望
參考文獻(xiàn)