定 價:39 元
叢書名:高等院校數(shù)據(jù)科學與大數(shù)據(jù)專業(yè)"互聯(lián)網(wǎng)+"創(chuàng)新規(guī)劃教材
- 作者:王道平,宋雨情
- 出版時間:2022/8/1
- ISBN:9787301328507
- 出 版 社:北京大學出版社
- 中圖法分類:TP274
- 頁碼:216
- 紙張:
- 版次:1
- 開本:16開
本書以大數(shù)據(jù)分析的相關(guān)理論和方法為主線,首先介紹了大數(shù)據(jù)分析所需的預(yù)備知識和常用的降維方法,然后介紹了數(shù)據(jù)挖掘、時間序列分析、人工神經(jīng)網(wǎng)絡(luò)等大數(shù)據(jù)分析方法,最后介紹了大數(shù)據(jù)分析和大數(shù)據(jù)可視化的常用工具,并講解了其相應(yīng)的操作。
本書既可以作為高等院校和高職院校數(shù)據(jù)科學與大數(shù)據(jù)、大數(shù)據(jù)管理與應(yīng)用、軟件工程及相關(guān)專業(yè)的教材,也可以供系統(tǒng)分析師、系統(tǒng)架構(gòu)師、軟件開發(fā)工程師和項目經(jīng)理以及其他學習大數(shù)據(jù)技術(shù)的讀者閱讀和參考。
王道平,博士,教授,博士生導師,北京科技大學經(jīng)濟管理學院管理科學與工程系,研究方向為供應(yīng)鏈與物流管理、大數(shù)據(jù)技術(shù)與應(yīng)用、智能管理系統(tǒng)等,主講大數(shù)據(jù)概論、數(shù)據(jù)組織與分析技術(shù)、供應(yīng)鏈與物流管理等課程,承擔多項國家自然科學基金課題和省部級課題,主編出版《現(xiàn)代物流信息技術(shù)》、《現(xiàn)代物流管理》、《供應(yīng)鏈管理》、《大數(shù)據(jù)導論》、《大數(shù)據(jù)處理》、《智能制造概論》等多部教材,其中1部教材被評為北京高校優(yōu)質(zhì)本科教材,2部教材被評為北京市高等教育精品教材。
宋雨情,博士,畢業(yè)于北京科技大學經(jīng)管學院管理科學與工程專業(yè),研究方向為供應(yīng)鏈與物流管理、大數(shù)據(jù)技術(shù)與應(yīng)用等,現(xiàn)就職于中信銀行股份有限公司總行軟件開發(fā)中心,從事客戶經(jīng)營平臺項目需求開發(fā)和設(shè)計編碼工作。
第1章 大數(shù)據(jù)分析概論 1
1.1 大數(shù)據(jù)分析的產(chǎn)生背景與
基礎(chǔ) 5
1.1.1 大數(shù)據(jù)分析的產(chǎn)生背景 5
1.1.2 大數(shù)據(jù)分析的基礎(chǔ) 6
1.2 大數(shù)據(jù)分析的概念與
基本原理 7
1.2.1 大數(shù)據(jù)分析的概念 7
1.2.2 大數(shù)據(jù)分析的基本原理 8
1.3 大數(shù)據(jù)分析的對象、過程和
價值 10
1.3.1 大數(shù)據(jù)分析的對象 10
1.3.2 大數(shù)據(jù)分析的過程 13
1.3.3 大數(shù)據(jù)分析的價值 15
本章小結(jié) 18
習題 18
第2章 大數(shù)據(jù)分析預(yù)備知識 20
2.1 模型評估與選擇 21
2.1.1 經(jīng)驗誤差與過擬合 21
2.1.2 評估方法 22
2.1.3 性能度量 25
2.2 假設(shè)檢驗 26
2.2.1 假設(shè)檢驗的基本概念 26
2.2.2 正態(tài)總體參數(shù)的假設(shè)檢驗 30
2.3 方差分析 34
2.3.1 問題的提出 34
2.3.2 單因子方差分析統(tǒng)計模型 35
2.3.3 平方和分解 36
2.3.4 檢驗方法 38
本章小結(jié) 41
習題 41
第3章 大數(shù)據(jù)分析常用降維方法 43
3.1 線性判別分析 44
3.1.1 線性判別分析概述 44
3.1.2 線性判別分析的計算過程 45
3.1.3 線性判別分析的優(yōu)點和
缺點 46
3.1.4 線性判別分析的應(yīng)用 47
3.2 主成分分析 47
3.2.1 主成分分析概述 48
3.2.2 主成分分析的計算過程 49
3.2.3 主成分分析的提取標準 51
3.2.4 主成分分析的應(yīng)用 52
3.3 因子分析 55
3.3.1 因子分析概述 55
3.3.2 因子分析的模型 57
3.3.3 因子分析的計算過程 58
3.3.4 因子分析的應(yīng)用 60
本章小結(jié) 65
習題 65
第4章 大數(shù)據(jù)分析常用方法 67
4.1 關(guān)聯(lián)分析 68
4.1.1 關(guān)聯(lián)分析的概念 68
4.1.2 Apriori算法 70
4.1.3 FP-Growth算法 72
4.1.4 關(guān)聯(lián)規(guī)則的評估 75
4.2 分類分析 80
4.2.1 分類分析的概念 80
4.2.2 樸素貝葉斯分類 81
4.2.3 決策樹 83
4.2.4 支持向量機 87
4.2.5 分類模型的評估 88
4.3 聚類分析 89
4.3.1 聚類分析的概念 89
4.3.2 k-means算法 92
4.3.3 k-medoids算法 93
4.3.4 DBSCAN算法 94
4.3.5 聚類結(jié)果的評估 95
本章小結(jié) 97
習題 97
第5章 時間序列分析 99
5.1 時間序列分析法概述 100
5.1.1 時間序列的概念 100
5.1.2 時間序列的分類 103
5.1.3 時間序列分析法的分類 105
5.2 確定性時間序列分析法 106
5.2.1 移動平均法 106
5.2.2 指數(shù)平滑法 110
5.2.3 季節(jié)指數(shù)法 114
5.3 隨機性時間序列分析法 118
5.3.1 平穩(wěn)性時間序列分析 118
5.3.2 非平穩(wěn)性時間序列分析 120
5.3.3 異方差時間序列分析 123
本章小結(jié) 124
習題 125
第6章 人工神經(jīng)網(wǎng)絡(luò) 127
6.1 人工神經(jīng)網(wǎng)絡(luò)概述 129
6.1.1 人工神經(jīng)網(wǎng)絡(luò)簡介 130
6.1.2 人工神經(jīng)網(wǎng)絡(luò)在大數(shù)據(jù)中的
應(yīng)用 132
6.2 人工神經(jīng)網(wǎng)絡(luò)模型 132
6.2.1 多層感知器 133
6.2.2 徑向基函數(shù)神經(jīng)網(wǎng)絡(luò) 134
6.2.3 Kohonen網(wǎng)絡(luò) 135
6.3 學習規(guī)則 137
6.3.1 Hebb學習規(guī)則 138
6.3.2 Perceptron學習規(guī)則 139
6.3.3 ?學習規(guī)則 139
6.3.4 LMS學習規(guī)則 140
6.3.5 Correlation學習規(guī)則 140
6.3.6 Winner-Take-All學習
規(guī)則 140
6.4 神經(jīng)網(wǎng)絡(luò)訓練算法 141
6.4.1 梯度下降算法 141
6.4.2 演化算法 142
6.4.3 遺傳算法 143
本章小結(jié) 146
習題 146
第7章 大數(shù)據(jù)分析工具 148
7.1 數(shù)據(jù)透視表 150
7.1.1 數(shù)據(jù)透視表的功能 150
7.1.2 數(shù)據(jù)透視表的相關(guān)操作 151
7.1.3 數(shù)據(jù)透視表分析 156
7.2 Python數(shù)據(jù)分析庫 158
7.2.1 Python的安裝和設(shè)置 158
7.2.2 常用的Python數(shù)據(jù)
分析庫 159
7.2.3 Python在大數(shù)據(jù)分析中的
應(yīng)用 161
7.3 Tableau 163
7.3.1 Tableau的系列產(chǎn)品 163
7.3.2 Tableau的應(yīng)用優(yōu)勢 164
7.3.3 Tableau的數(shù)據(jù)連接 166
7.3.4 Tableau在網(wǎng)站內(nèi)容評估中的
應(yīng)用 168
本章小結(jié) 173
習題 173
第8章 大數(shù)據(jù)可視化 175
8.1 大數(shù)據(jù)可視化概述 176
8.1.1 大數(shù)據(jù)可視化的概念 176
8.1.2 大數(shù)據(jù)可視化的作用 177
8.1.3 大數(shù)據(jù)可視化的應(yīng)用 178
8.2 大數(shù)據(jù)可視化的基礎(chǔ)和
表現(xiàn)形式 183
8.2.1 大數(shù)據(jù)可視化的原則和
步驟 184
8.2.2 統(tǒng)計圖表可視化方法 186
8.2.3 不同類型數(shù)據(jù)和圖形的
展示 187
8.3 大數(shù)據(jù)可視化工具 194
8.3.1 Tableau的可視化功能 194
8.3.2 ECharts工具簡介 199
本章小結(jié) 202
習題 203
參考文獻 204