環(huán)境數(shù)據(jù)分析(第二版)
定 價:86 元
叢書名:科學出版社“十四五”普通高等教育本科規(guī)劃教材浙江省普通本科“十四五”重點教材
- 作者:莊樹林
- 出版時間:2023/11/1
- ISBN:9787030769053
- 出 版 社:科學出版社
- 中圖法分類:X32
- 頁碼:324
- 紙張:
- 版次:31
- 開本:16
本書是面向新工科建設(shè)的新形態(tài)教材,介紹了數(shù)理統(tǒng)計分析及機器學習、深度學習的基礎(chǔ)理論和軟件操作,加強了統(tǒng)計分析和數(shù)據(jù)科學的融合。全書共12章,內(nèi)容包括數(shù)據(jù)描述性分析及探索性分析、科學繪圖、環(huán)境數(shù)據(jù)分布與假設(shè)檢驗、參數(shù)及非參數(shù)檢驗、方差分析、相關(guān)分析、回歸分析、生存分析、降維分析、聚類分析、分類分析及機器學習、深度學習,特別設(shè)置了知識拓展、思考題、逸聞趣事等。本書重視實戰(zhàn)操作訓練,演示了Excel、SPSS、Python及GPT-4的分析過程,對軟件操作及界面進行了詳細介紹,完整展現(xiàn)了數(shù)據(jù)分析的思路和過程。所有習題、例題數(shù)據(jù)及解題方法均配套電子文件。
更多科學出版社服務(wù),請掃碼獲取。
目錄
第二版前言
第一版序
第一版前言
第1章 數(shù)據(jù)統(tǒng)計描述與圖形化 1
1.1 數(shù)據(jù)統(tǒng)計概述 1
1.2 數(shù)據(jù)分析過程 3
1.3 數(shù)據(jù)基本類型 3
1.4 數(shù)據(jù)分析軟件 4
1.4.1 使用軟件 4
1.4.2 軟件安裝、運行 5
1.5 數(shù)據(jù)探索性分析 7
1.5.1 數(shù)據(jù)管理 7
1.5.2 數(shù)據(jù)轉(zhuǎn)換 8
1.5.3 異常值及缺失值處理 8
1.6 數(shù)據(jù)描述性分析 9
1.6.1 集中趨勢描述 10
1.6.2 離散趨勢描述 10
1.6.3 頻率分析 12
1.7 數(shù)據(jù)圖形化形式 14
1.7.1 散點圖 14
1.7.2 線圖 16
1.7.3 面積圖 17
1.7.4 餅圖 18
1.7.5 條形圖 21
1.7.6 直方圖 23
1.7.7 誤差條圖 25
1.7.8 箱形圖 27
1.7.9 小提琴圖 29
1.7.10 森林圖 29
1.7.11 熱圖 31
習題 33
第2章 環(huán)境數(shù)據(jù)分布與假設(shè)檢驗 35
2.1 總體與樣本 35
2.1.1 總體與樣本概述 35
2.1.2 樣本統(tǒng)計量與總體參數(shù) 35
2.1.3 抽樣 35
2.1.4 抽樣誤差 38
2.1.5 樣本量計算 38
2.1.6 統(tǒng)計功效 40
2.2 抽樣分布 40
2.2.1 抽樣分布概述 40
2.2.2 概率密度函數(shù) 41
2.2.3 正態(tài)分布 42
2.2.4 正態(tài)分布檢驗 42
2.2.5 t分布 45
2.2.6 ??2分布 46
2.2.7 F分布 47
2.2.8 二項分布 48
2.3 參數(shù)估計 48
2.3.1 參數(shù)估計概念 48
2.3.2 點估計 48
2.3.3 置信區(qū)間估計 49
2.4 統(tǒng)計假設(shè)檢驗基本思想 50
2.4.1 統(tǒng)計假設(shè)檢驗概述 50
2.4.2 統(tǒng)計假設(shè)檢驗基本步驟 50
2.4.3 統(tǒng)計假設(shè)檢驗兩類錯誤 51
2.4.4 單側(cè)檢驗與雙側(cè)檢驗 51
2.5 典型分布類型檢驗 52
2.5.1 Z檢驗 53
2.5.2 比率檢驗 54
習題 56
第3章 環(huán)境數(shù)據(jù)t檢驗 57
3.1 t檢驗概述 57
3.1.1 t檢驗定義 57
3.1.2 t檢驗分類 57
3.1.3 t檢驗適用條件 58
3.1.4 t檢驗的分析流程 58
3.2 樣本t檢驗 58
3.2.1 單樣本t檢驗 58
3.2.2 獨立樣本t檢驗 60
3.2.3 配對樣本t檢驗 63
習題 66
第4章 環(huán)境數(shù)據(jù)方差分析 67
4.1 方差分析概述 67
4.1.1 方差分析定義 67
4.1.2 方差分析分類 67
4.1.3 方差分析基本術(shù)語 67
4.1.4 方差分析適用條件 68
4.1.5 方差分析基本流程 68
4.1.6 方差分析基本思想 68
4.1.7 多重比較 69
4.2 單因素方差分析 70
4.2.1 單因素方差分析概述 70
4.2.2 單因素方差分析基本步驟 70
4.2.3 方差分析趨勢檢驗 74
4.3 雙因素方差分析 74
4.3.1 雙因素方差分析概述 74
4.3.2 有交互作用的雙因素方差分析 75
4.3.3 無交互作用的雙因素方差分析 80
4.4 多因素方差分析 83
4.4.1 多因素方差分析概述 83
4.4.2 多因素方差分析適用情形 83
4.5 重復測量方差分析 84
4.5.1 重復測量方差分析概述 84
4.5.2 重復測量方差分析適用條件 85
4.5.3 重復測量方差分析流程 86
4.6 協(xié)方差分析 88
4.6.1 協(xié)方差分析概述 88
4.6.2 協(xié)方差分析基本原理 88
4.6.3 協(xié)方差分析條件 88
4.7 Hotelling T 2檢驗 89
4.7.1 Hotelling T?2檢驗概述 89
4.7.2 Hotelling T 2數(shù)學模型 90
4.7.3 Hotelling T?2檢驗適用條件 90
4.8 多元方差分析 92
4.8.1 多元方差分析概述 92
4.8.2 多元方差分析適用條件 93
4.9 常用試驗設(shè)計方差分析 95
4.9.1 試驗設(shè)計基本原則 95
4.9.2 完全隨機設(shè)計 95
4.9.3 隨機區(qū)組設(shè)計 95
4.9.4 配對設(shè)計 97
4.9.5 析因設(shè)計 97
4.9.6 正交設(shè)計 99
習題 100
第5章 環(huán)境數(shù)據(jù)非參數(shù)檢驗 101
5.1 非參數(shù)檢驗 101
5.1.1 非參數(shù)檢驗概述 101
5.1.2 非參數(shù)檢驗分類 101
5.1.3 非參數(shù)檢驗的適用范圍 101
5.1.4 非參數(shù)檢驗的特點 102
5.1.5 方法比較 102
5.2 單樣本非參數(shù)檢驗 102
5.2.1 二項分布檢驗 102
5.2.2 單樣本卡方檢驗 104
5.2.3 K-S檢驗 106
5.2.4 S-W檢驗 107
5.3 兩配對樣本非參數(shù)檢驗 108
5.3.1 兩配對樣本卡方檢驗 108
5.3.2 符號檢驗 112
5.3.3 Wilcoxon符號秩檢驗 112
5.4 兩獨立樣本的非參數(shù)檢驗 113
5.4.1 兩獨立樣本卡方檢驗 116
5.4.2 分層卡方檢驗 118
5.4.3 Mann-Whitney U檢驗 119
5.4.4 兩獨立樣本K-S檢驗 120
5.4.5 莫斯極端反應檢驗 121
5.5 多相關(guān)樣本非參數(shù)檢驗 122
5.6 多獨立樣本非參數(shù)檢驗 125
習題 127
第6章 環(huán)境數(shù)據(jù)相關(guān)分析 128
6.1 相關(guān)分析概述 128
6.1.1 相關(guān)分析定義 128
6.1.2 相關(guān)關(guān)系分類 128
6.1.3 相關(guān)分析類別 128
6.1.4 相關(guān)分析數(shù)據(jù)基本要求 129
6.1.5 相關(guān)分析樣本量計算 129
6.1.6 相關(guān)分析注意事項 129
6.2 相關(guān)系數(shù) 130
6.2.1 相關(guān)系數(shù)定義 130
6.2.2 相關(guān)程度 130
6.2.3 相關(guān)系數(shù)分類 130
6.2.4 相關(guān)系數(shù)熱力圖 131
6.3 Pearson相關(guān)分析 132
6.3.1 Pearson相關(guān)分析概念 132
6.3.2 Pearson相關(guān)系數(shù)公式 132
6.3.3 Pearson相關(guān)分析要求 132
6.4 Spearman等級相關(guān)分析 135
6.4.1 Spearman等級相關(guān)分析概念 135
6.4.2 Spearman等級相關(guān)系數(shù)公式 135
6.4.3 Spearman等級相關(guān)分析要求 135
6.5 Kendall等級相關(guān)分析 136
6.5.1 Kendall等級相關(guān)分析概念 136
6.5.2 Kendall’s tau-b相關(guān)系數(shù)公式 136
6.5.3 Kendall’s tau-b相關(guān)分析要求 137
6.6 偏相關(guān)分析 138
6.6.1 偏相關(guān)分析概述 138
6.6.2 偏相關(guān)系數(shù)公式 138
6.6.3 偏相關(guān)分析案例 139
習題 140
第7章 環(huán)境數(shù)據(jù)回歸分析 141
7.1 回歸分析概述 141
7.1.1 回歸分析定義 141
7.1.2 回歸分析分類 141
7.1.3 回歸分析基本術(shù)語 142
7.1.4 回歸分析基本步驟 142
7.1.5 回歸分析樣本量計算 143
7.1.6 回歸分析注意事項 143
7.2 線性回歸分析 144
7.2.1 線性回歸概念 144
7.2.2 線性回歸適用條件 144
7.2.3 線性回歸評價指標 144
7.2.4 一元線性回歸 145
7.2.5 多元線性回歸 148
7.3 非線性回歸分析 152
7.3.1 非線性回歸概念 152
7.3.2 非線性回歸分類 153
7.4 多項式回歸分析 155
7.4.1 多項式回歸概述 155
7.4.2 一元n次多項式回歸 155
7.4.3 多元二次多項式回歸 158
7.5 Probit回歸 159
7.5.1 Probit回歸概念 159
7.5.2 二分類Probit回歸 159
7.6 Logistic回歸分析 161
7.6.1 Logistic回歸概念 161
7.6.2 Logistic回歸類型 162
7.6.3 Logistic回歸基本原理 162
7.6.4 Logistic回歸模型的假設(shè)檢驗 163
7.6.5 Logistic回歸適用范圍 163
7.6.6 二元Logistic回歸 163
7.6.7 多元Logistic回歸 167
7.7 曲線擬合 169
7.7.1 曲線擬合概念 169
7.7.2 Logistic曲線擬合 170
7.7.3 環(huán)境庫茲涅茨曲線(EKC)擬合 172
7.8 貝葉斯核函數(shù)回歸 175
7.8.1 貝葉斯核函數(shù)回歸定義 175
7.8.2 貝葉斯核函數(shù)回歸應用 175
習題 178
第8章 環(huán)境數(shù)據(jù)生存分析 179
8.1 生存分析 179
8.1.1 生存分析概述 179
8.1.2 生存分析組成 179
8.1.3 生存函數(shù) 180
8.1.4 生存曲線 180
8.1.5 生存分析種類 180
8.2 壽命表 181
8.2.1 壽命表概述 181
8.2.2 壽命表原理 181
8.3 Kaplan-Meier法 183
8.3.1 Kaplan-Meier法概述 183
8.3.2 Kaplan-Meier法與壽命表法比較 183
8.4 Cox回歸法 187
8.5 ROC曲線 192
8.5.1 ROC曲線概述 192
8.5.2 ROC空間 192
8.5.3 ROC曲線定義 193
8.5.4 AUC值 194
8.5.5 ROC曲線作用 194
8.5.6 ROC曲線可視化 195
習題 197
第9章 環(huán)境數(shù)據(jù)降維分析 198
9.1 數(shù)據(jù)降維 198
9.1.1 數(shù)據(jù)降維定義 198
9.1.2 數(shù)據(jù)降維作用 198
9.1.3 數(shù)據(jù)降維方法 198
9.2 因子分析 199
9.2.1 因子分析概述 199
9.2.2 因子分析算法 199
9.3 主成分分析 205
9.3.1 主成分分析概述 205
9.3.2 主成分分析算法 205
9.4 對應分析 209
9.4.1 對應分析概述 209
9.4.2 對應分析算法 210
9.5 最優(yōu)尺度分析 213
9.5.1 最優(yōu)尺度分析概述 213
9.5.2 分類主成分分析 213
9.5.3 多重對應分析 217
9.5.4 非線性典型相關(guān)分析 219
9.6 多維尺度分析 221
9.6.1 多維尺度分析概述 221
9.6.2 多維尺度分析原理 221
9.6.3 多維尺度分析類型 222
9.6.4 經(jīng)典多維尺度分析 222
9.6.5 標準化多維尺度分析 223
9.6.6 考慮個體差異的多維尺度分析 225
9.6.7 多維鄰近尺度分析 227
習題 228
第10章 環(huán)境數(shù)據(jù)聚類分析 229
10.1 聚類分析概述 229
10.1.1 聚類分析概念 229
10.1.2 聚類分析算法 230
10.1.3 聚類分析步驟 230
10.1.4 聚類統(tǒng)計量 232
10.1.5 聚類分析評估指標 235
10.2 主要聚類算法 236
10.2.1 K-均值聚類 236
10.2.2 BIRCH層次聚類 241
10.2.3 兩步聚類 243
10.2.4 高斯混合聚類 245
10.2.5 DBSCAN聚類 247
10.2.6 CLIQUE聚類 248
習題 250
第11章 環(huán)境數(shù)據(jù)分類分析 252
11.1 分類分析概述 252
11.1.1 分類分析定義 252
11.1.2 分類分析類別 252
11.1.3 特征與標簽 253
11.1.4 分類分析基本流程 253
11.1.5 常用分類算法 254
11.1.6 分類算法選擇 254
11.2 K最近鄰分類器 255
11.2.1 K最近鄰分類概述 255
11.2.2 Python中的KNN分類器 256
11.3 決策樹分類器 257
11.3.1 決策樹概述 257
11.3.2 Python中的決策樹 258
11.4 隨機森林分類器 259
11.4.1 隨機森林概述 259
11.4.2 Python中的隨機森林 260
11.5 支持向量機分類器 263
11.5.1 支持向量機概述 263
11.5.2 支持向量機基本思想 263
11.6 樸素貝葉斯分類器 264
11.6.1 樸素貝葉斯概述 264
11.6.2 Python中的樸素貝葉斯 265
11.7 集成學習分類器 266
11.7.1 AdaBoost算法 266
11.7.2 Python中的AdaBoost算法 267
習題 269
第12章 環(huán)境數(shù)據(jù)機器學習 270
12.1 機器學習概述 270
12.1.1 機器學習定義 270
12.1.2 機器學習分類 271
12.1.3 機器學習流程 271
12.2 數(shù)據(jù)收集與預處理 273
12.2.1 數(shù)據(jù)來源 273
12.2.2 數(shù)據(jù)預處理 274
12.3 特征工程 276
12.3.1 特征工程定義 276
12.3.2 特征工程步驟 276
12.3.3 特征選擇 276
12.3.4 特征提取 278
12.4 模型構(gòu)建 280
12.4.1 數(shù)據(jù)分割 280
12.4.2 模型訓練 281
12.5 模型評估 283
12.5.1 預測誤差評估 283
12.5.2 擬合程度評估 286
12.6 機器學習基本框架 287
12.6.1 機器學習模板 287
12.6.2 機器學習案例分析 289
12.7 深度學習 293
12.7.1 深度學習定義 293
12.7.2 深度學習主流算法 294
12.7.3 深度學習框架 296
12.7.4 深度學習流程 297
12.7.5 基于Keras的深度學習模板 298
12.7.6 深度學習案例分析 300
習題 303
參考文獻 304