數(shù)據(jù)挖掘算法與R語(yǔ)言實(shí)現(xiàn)
定 價(jià):45 元
- 作者:肖海軍
- 出版時(shí)間:2018/11/1
- ISBN:9787121339370
- 出 版 社:電子工業(yè)出版社
- 中圖法分類(lèi):TP274;TP312
- 頁(yè)碼:180
- 紙張:
- 版次:01
- 開(kāi)本:16K
本書(shū)在介紹R軟件基本功能的基礎(chǔ)上,介紹了數(shù)據(jù)挖掘十大經(jīng)典算法的基本原理及相應(yīng)的R語(yǔ)言實(shí)現(xiàn)范例,旨在使讀者能夠仿照范例快速掌握大數(shù)據(jù)分析的方法,從高維海量數(shù)據(jù)中挖掘有用的信息,使用合適的數(shù)據(jù)挖掘算法,解決實(shí)際問(wèn)題。全書(shū)內(nèi)容共12章,分別介紹R軟件的使用方法、C4.5算法、k-means算法、CART算法、Apriori算法、EM算法、PageRank算法、AdaBoost算法、kNN算法、Naive Bayes算法、SVM算法及各算法的案例分析。本書(shū)理論部分簡(jiǎn)單明了,所有程序均經(jīng)過(guò)R軟件實(shí)際運(yùn)行。本書(shū)各章自成體系,讀者既可從頭逐章學(xué)習(xí),也可隨意挑選自己需要的章節(jié)學(xué)習(xí)。讀者可登錄華信教育資源網(wǎng)www.hxedu.com.cn免費(fèi)下載算法實(shí)例代碼。本書(shū)既可作為高年級(jí)本科生、研究生相關(guān)課程的教材,也可作為不同領(lǐng)域數(shù)據(jù)分析人員的工具書(shū),還可作為零基礎(chǔ)讀者的自學(xué)教材。
肖海軍,中國(guó)地質(zhì)大學(xué)(武漢)數(shù)學(xué)與物理學(xué)院教授,中國(guó)數(shù)學(xué)學(xué)會(huì)會(huì)員,中國(guó)計(jì)算機(jī)學(xué)會(huì)高級(jí)會(huì)員,中國(guó)電子學(xué)會(huì)高級(jí)會(huì)員。
目 錄
第1章 R軟件的使用方法 1
1.1 R軟件介紹和安裝 1
1.1.1 R軟件介紹 1
1.1.2 R軟件的安裝 1
1.1.3 R studio的安裝 2
1.2 R語(yǔ)言基本運(yùn)算 3
1.2.1 R語(yǔ)言的數(shù)值運(yùn)算 3
1.2.2 R語(yǔ)言的向量 5
1.2.3 R語(yǔ)言的向量運(yùn)算 6
1.3 R語(yǔ)言缺失數(shù)據(jù) 7
1.3.1 R語(yǔ)言缺失數(shù)據(jù)類(lèi)型 7
1.3.2 R語(yǔ)言缺失數(shù)據(jù)識(shí)別 7
1.3.3 R語(yǔ)言缺失數(shù)據(jù)處理 8
1.4 矩陣的運(yùn)算 8
1.4.1 矩陣建立 8
1.4.2 矩陣計(jì)算 10
1.4.3 矩陣分解 11
1.5 列表和數(shù)據(jù)框 12
1.5.1 列表介紹 12
1.5.2 數(shù)據(jù)框介紹 13
1.6 R軟件的數(shù)據(jù)讀/寫(xiě) 14
1.7 R軟件包介紹 15
1.7.1 包的基礎(chǔ)知識(shí) 15
1.7.2 自動(dòng)安裝包 15
1.7.3 通過(guò)硬盤(pán)加載包 16
1.7.4 常見(jiàn)包介紹 16
1.8 R語(yǔ)言的函數(shù) 16
1.8.1 循環(huán)結(jié)構(gòu) 16
1.8.2 條件執(zhí)行結(jié)構(gòu) 17
1.8.3 自定義函數(shù) 18
1.9 R軟件繪圖功能介紹 19
1.9.1 高級(jí)繪圖函數(shù) 20
1.9.2 低級(jí)繪圖函數(shù) 22
1.9.3 用ggplot2包進(jìn)行繪圖 25
第2章 C4.5算法 30
2.1 算法簡(jiǎn)介 30
2.2 算法基本原理 30
2.3 算法的R語(yǔ)言實(shí)現(xiàn) 33
2.3.1 ctree函數(shù)介紹 33
2.3.2 C4.5決策樹(shù)的R語(yǔ)言實(shí)例 33
2.4 小結(jié) 35
參考文獻(xiàn) 36
第3章 k-means算法 37
3.1 算法簡(jiǎn)介 37
3.2 算法基本原理 37
3.3 算法的R語(yǔ)言實(shí)現(xiàn) 39
3.3.1 kmeans函數(shù)介紹 39
3.3.2 k-means聚類(lèi)的R語(yǔ)言實(shí)例 39
3.4 小結(jié) 41
參考文獻(xiàn) 42
第4章 CART算法 44
4.1 算法簡(jiǎn)介 44
4.2 算法基本原理 44
4.2.1 CART算法的建樹(shù) 44
4.2.2 CART算法的剪枝 45
4.2.3 算法過(guò)程實(shí)例 46
4.3 算法的R語(yǔ)言實(shí)現(xiàn) 48
4.3.1 rpart函數(shù)介紹 48
4.3.2 CART決策樹(shù)的R語(yǔ)言實(shí)例 48
4.3.3 rpart函數(shù)的補(bǔ)充說(shuō)明 50
4.4 小結(jié) 52
參考文獻(xiàn) 52
第5章 Apriori算法 53
5.1 算法簡(jiǎn)介 53
5.2 算法基本原理 53
5.2.1 挖掘頻繁模式和關(guān)聯(lián)規(guī)則 53
5.2.2 Apriori算法 55
5.2.3 AprioriTid算法 61
5.2.4 挖掘順序模式 64
5.2.5 Apriori算法的一種改進(jìn)算法 65
5.3 算法的R語(yǔ)言實(shí)現(xiàn)算法 66
5.3.1 apriori函數(shù)介紹 66
5.3.2 Apriori模型 66
5.4 小結(jié) 68
參考文獻(xiàn) 68
第6章 EM算法 70
6.1 算法簡(jiǎn)介 70
6.2 算法基本原理 71
6.2.1 基礎(chǔ)理論 71
6.2.2 算法過(guò)程實(shí)例 71
6.3 算法的R語(yǔ)言實(shí)現(xiàn) 76
6.3.1 mclust函數(shù)介紹 76
6.3.2 EM標(biāo)準(zhǔn)模型的R語(yǔ)言實(shí)現(xiàn) 77
6.3.3 存在噪聲的EM算法的R語(yǔ)言實(shí)現(xiàn) 79
6.3.4 EM算法應(yīng)用于高斯混合模型(GMM) 81
6.3.5 EM算法應(yīng)用于Iris數(shù)據(jù)集 84
6.4 小結(jié) 84
參考文獻(xiàn) 85
第7章 PageRank算法 86
7.1 算法簡(jiǎn)介 86
7.2 算法基本原理 86
7.3 算法的R語(yǔ)言實(shí)現(xiàn) 89
7.3.1 page.rank函數(shù)介紹 89
7.3.2 igraph包實(shí)現(xiàn)PageRank算法 89
7.3.3 自定義PageRank算法的R語(yǔ)言實(shí)現(xiàn) 90
7.3.4 補(bǔ)充實(shí)例 91
7.4 小結(jié) 95
參考文獻(xiàn) 96
第8章 AdaBoost算法 97
8.1 算法簡(jiǎn)介 97
8.2 算法基本原理 97
8.2.1 Boosting算法 97
8.2.2 AdaBoost算法 98
8.2.3 算法過(guò)程實(shí)例 101
8.3 算法的R語(yǔ)言實(shí)現(xiàn) 102
8.3.1 boosting函數(shù)介紹 102
8.3.2 R語(yǔ)言實(shí)例 102
8.4 小結(jié) 104
參考文獻(xiàn) 104
第9章 kNN算法 105
9.1 算法簡(jiǎn)介 105
9.2 算法基本原理 105
9.2.1 算法描述 105
9.2.2 算法流程 107
9.3 算法的R語(yǔ)言實(shí)現(xiàn) 108
9.3.1 knn函數(shù)介紹 108
9.3.2 利用class包中的knn函數(shù)建立模型 108
9.3.3 kNN算法應(yīng)用于Iris數(shù)據(jù)集 109
9.3.4 kNN算法應(yīng)用于Breast數(shù)據(jù)集 111
9.4 小結(jié) 113
參考文獻(xiàn) 114
第10章 Naive Bayes算法 115
10.1 算法簡(jiǎn)介 115
10.2 算法基本原理 115
10.2.1 基礎(chǔ)理論 115
10.2.2 算法過(guò)程實(shí)例 118
10.3 算法的R語(yǔ)言實(shí)現(xiàn) 120
10.3.1 naiveBayes函數(shù)介紹 120
10.3.2 利用e1071包中的naiveBayes函數(shù)建立模型 120
10.3.3 算法拓展——其他改進(jìn)的Naive Bayes算法 121
10.4 小結(jié) 123
參考文獻(xiàn) 123
第11章 SVM算法 125
11.1 算法簡(jiǎn)介 125
11.2 算法基本原理 125
11.2.1 基礎(chǔ)理論 125
11.2.2 軟間隔優(yōu)化 127
11.2.3 核映射 129
11.2.4 SVM算法的過(guò)程 130
11.2.5 SVC算法過(guò)程實(shí)例 130
11.3 算法的R語(yǔ)言實(shí)現(xiàn) 132
11.3.1 svm函數(shù)介紹 132
11.3.2 標(biāo)準(zhǔn)分類(lèi)模型 133
11.3.3 多分類(lèi)模型 133
11.3.4 SVM回歸 134
11.3.5 SVM拓展包(kernlab包) 135
11.3.6 SVM算法應(yīng)用于Iris數(shù)據(jù)集(e1071包) 135
11.3.7 SVM算法應(yīng)用于Iris數(shù)據(jù)集(kernlab包) 136
11.4 小結(jié) 137
參考文獻(xiàn) 138
第12章 案例分析 139
12.1 關(guān)聯(lián)規(guī)則案例分析 139
12.1.1 問(wèn)題描述 139
12.1.2 R語(yǔ)言實(shí)現(xiàn)過(guò)程 139
12.1.3 不同參數(shù)的Apriori模型 141
12.1.4 小結(jié) 145
12.2 kNN算法案例分析 145
12.2.1 問(wèn)題描述 145
12.2.2 R語(yǔ)言實(shí)現(xiàn)過(guò)程 145
12.2.3 小結(jié) 148
12.3 Naive Bayes算法案例分析 149
12.3.1 問(wèn)題描述 149
12.3.2 R語(yǔ)言實(shí)現(xiàn)過(guò)程 149
12.3.3 小結(jié) 152
12.4 CART算法案例分析 152
12.4.1 問(wèn)題描述 152
12.4.2 R語(yǔ)言實(shí)現(xiàn)過(guò)程 152
12.4.3 小結(jié) 159
12.5 AdaBoost算法案例分析 159
12.5.1 問(wèn)題描述 159
12.5.2 R語(yǔ)言實(shí)現(xiàn)過(guò)程 159
12.5.3 小結(jié) 161
12.6 SVM算法案例分析 162
12.6.1 問(wèn)題描述 162
12.6.2 R語(yǔ)言實(shí)現(xiàn)過(guò)程 162
12.6.3 小結(jié) 167