Python機器學習:基礎、算法與實戰(zhàn)
定 價:99 元
當前圖書已被 55 所學校薦購過!
查看明細
- 作者:孫玉林 編著
- 出版時間:2023/10/1
- ISBN:9787122435347
- 出 版 社:化學工業(yè)出版社
- 中圖法分類:TP311.561
- 頁碼:312
- 紙張:
- 版次:01
- 開本:小16開
本書基于Python語言,結合實際的數據集,介紹了機器學習算法以及數據分析方法的應用。本書主要包含兩部分內容,第一部分為Python機器學習入門知識:主要介紹了Python的基礎內容、Numpy與Pandas庫數據操作、Matplotlib與Seaborn庫數據可視化、Sklearn庫機器學習,以及與機器學習相關的基礎知識;第二部分為Python機器學習算法應用:主要介紹了數據的回歸預測分析、時間序列預測,數據無監(jiān)督學習中的聚類、降維以及關聯(lián)規(guī)則,數據分類模型的應用以及針對文本數據與網絡圖數據的機器學習算法應用。
本書適合對機器學習、數據分析感興趣的初學者學習,也可作為Python機器學習、數據分析、數據可視化的入門及進階的教材。
第1章 Python機器學習快速入門 1
1.1 Python安裝 1
1.1.1 安裝Anaconda 1
1.1.2 安裝Python庫 5
1.2 Python常用數據類型 5
1.2.1 列表 5
1.2.2 元組 8
1.2.3 字典 9
1.2.4 集合 10
1.2.5 字符串 11
1.3 Python條件、循環(huán)與函數 13
1.3.1 條件判斷語句 13
1.3.2 循環(huán)語句 14
1.3.3 函數 16
1.4 機器學習簡介 17
1.4.1 無監(jiān)督學習 18
1.4.2 有監(jiān)督學習 20
1.4.3 半監(jiān)督學習 21
1.4.4 常用機器學習算法 22
1.5 本章小結 22
第2章 Python中的常用庫 23
2.1 Numpy庫 23
2.1.1 Numpy數組生成 24
2.1.2 Numpy數組運算 27
2.1.3 Numpy數組操作 28
2.1.4 Numpy常用函數 33
2.2 Pandas庫 36
2.2.1 Pandas數據生成和讀取 37
2.2.2 Pandas數據操作 39
2.2.3 Pandas數據可視化 44
2.3 Matplotlib庫 47
2.3.1 Matplotlib可視化基礎 47
2.3.2 Matplotlib數據可視化實戰(zhàn) 53
2.4 Seaborn庫 60
2.4.1 Seaborn庫功能簡介 60
2.4.2 Seaborn庫數據可視化實戰(zhàn) 61
2.5 Sklearn庫 65
2.5.1 Sklearn庫功能簡介 65
2.5.2 Sklearn庫應用實戰(zhàn) 66
2.6 本章小結 70
第3章 機器學習流程 71
3.1 數據預處理與探索 72
3.1.1 缺失值處理 73
3.1.2 數據可視化探索 74
3.1.3 數據標準化與變換 78
3.2 無監(jiān)督問題應用 81
3.2.1 數據降維 81
3.2.2 數據聚類 84
3.3 有監(jiān)督分類問題應用 87
3.4 有監(jiān)督回歸問題應用 91
3.5 半監(jiān)督學習應用 94
3.6 本章小結 96
第4章 模型的選擇與評估 98
4.1 模型的選擇 98
4.1.1 模型擬合情況 98
4.1.2 避免欠擬合和過擬合的方式 100
4.1.3 模型的方差與偏差 101
4.2 模型訓練技巧 101
4.2.1 相關方法 102
4.2.2 實戰(zhàn)案例:K折交叉驗證 103
4.2.3 實戰(zhàn)案例:參數網格搜索 104
4.3 模型評價指標 106
4.3.1 分類效果評價 106
4.3.2 回歸效果評價 106
4.3.3 聚類效果評價 107
4.4 本章小結 108
第5章 回歸模型 109
5.1 一元線性回歸 111
5.1.1 模型介紹 111
5.1.2 實戰(zhàn)案例:一元線性回歸建模 111
5.2 多元線性回歸 116
5.2.1 模型簡介 116
5.2.2 實戰(zhàn)案例:房屋價格預測 116
5.3 正則化Lasso回歸 127
5.3.1 模型簡介 127
5.3.2 實戰(zhàn)案例:Lasso回歸預測房屋價格 128
5.4 時間序列ARIMA模型 133
5.4.1 模型簡介 133
5.4.2 實戰(zhàn)案例:ARIMA模型預測未來啤酒消耗量 134
5.5 時間序列SARIMA模型 145
5.5.1 模型簡介 145
5.5.2 實戰(zhàn)案例:SARIMA模型預測未來啤酒消耗量 146
5.6 本章小結 149
第6章 無監(jiān)督模型 150
6.1 常用降維算法 151
6.1.1 主成分分析 151
6.1.2 因子分析 152
6.1.3 流形學習——等距映射 152
6.1.4 局部線性嵌入LLE 153
6.1.5 多維尺度變換MSD 153
6.1.6 t-SNE 153
6.2 數據降維案例實戰(zhàn) 154
6.2.1 主成分分析數據降維 156
6.2.2 因子分析數據降維 159
6.2.3 流形學習——等距嵌入數據降維 160
6.2.4 局部線性嵌入數據降維 161
6.2.5 MDS數據降維 162
6.2.6 t-SNE數據降維 163
6.3 常用聚類算法 164
6.3.1 K均值聚類 165
6.3.2 密度聚類 165
6.3.3 系統(tǒng)聚類 166
6.3.4 模糊聚類 167
6.4 數據聚類案例實戰(zhàn) 168
6.4.1 K均值聚類實戰(zhàn) 169
6.4.2 密度聚類實戰(zhàn) 173
6.4.3 系統(tǒng)聚類實戰(zhàn) 175
6.4.4 模糊聚類實戰(zhàn) 178
6.5 關聯(lián)規(guī)則挖掘 179
6.5.1 模型簡介 180
6.5.2 實戰(zhàn)案例:購物籃分析 181
6.6 本章小結 188
第7章 分類模型 189
7.1 決策樹算法 193
7.1.1 算法簡介 193
7.1.2 實戰(zhàn)案例:決策樹算法實戰(zhàn) 195
7.2 隨機森林算法 203
7.2.1 算法介紹 203
7.2.2 實戰(zhàn)案例:隨機森林算法實戰(zhàn) 203
7.3 Logistic回歸算法 208
7.3.1 算法簡介 208
7.3.2 實戰(zhàn)案例:Logistic回歸算法實戰(zhàn) 209
7.4 支持向量機算法 211
7.4.1 算法簡介 211
7.4.2 實戰(zhàn)案例:支持向量機算法實戰(zhàn) 213
7.5 人工神經網絡算法 219
7.5.1 算法簡介 219
7.5.2 人工神經網絡算法實戰(zhàn) 221
7.6 本章小結 225
第8章 高級數據回歸算法 226
8.1 高級數據回歸算法模型實戰(zhàn) 227
8.1.1 數據探索與可視化 227
8.1.2 隨機森林回歸預測實戰(zhàn) 232
8.1.3 GBDT回歸預測實戰(zhàn) 234
8.1.4 支持向量機回歸預測實戰(zhàn) 236
8.1.5 人工神經網絡回歸預測實戰(zhàn) 237
8.2 復雜時間序列預測模型 239
8.2.1 Prophet時序回歸 239
8.2.2 多元時序回歸 240
8.3 時間序列回歸模型實戰(zhàn) 240
8.3.1 時序數據導入與可視化探索 240
8.3.2 Prophet算法預測用戶數量 242
8.3.3 Prophet算法預測流量 245
8.3.4 VAR多變量時間序列的建模與預測 247
8.3.5 VARMA多變量時間序列的建模與預測 250
8.4 本章小結 253
第9章 非結構數據機器學習 254
9.1 非結構數據分析簡介 255
9.1.1 文本數據分析簡介 255
9.1.2 網絡圖數據分析簡介 256
9.2 文本數據分析實戰(zhàn) 257
9.2.1 文本數據預處理 257
9.2.2 文本獲取TF-IDF特征 263
9.2.3 文本數據K均值聚類 265
9.2.4 文本數據LDA主題模型 266
9.2.5 文本數據樸素貝葉斯分類 267
9.3 網絡圖數據分析實戰(zhàn) 272
9.3.1 網絡圖可視化 272
9.3.2 網絡圖聚類分割 277
9.4 本章小結 281
第10章 綜合實戰(zhàn)案例:中藥材鑒別 282
10.1 無監(jiān)督學習——鑒別藥材種類 284
10.1.1 數據特征可視化探索 285
10.1.2 使用原始特征進行聚類分析 287
10.1.3 使用降維后的特征進行聚類 291
10.2 有監(jiān)督學習——藥材產地鑒別 295
10.2.1 數據特征可視化探索分析 296
10.2.2 利用選擇的特征進行分類 297
10.3 半監(jiān)督學習——藥材類別鑒別 303
10.3.1 數據預處理和可視化探索 304
10.3.2 數據主成分分析降維 306
10.3.3 半監(jiān)督學習分類——標簽傳播算法 308
10.4 本章小結 311
參考文獻 312