定 價:39 元
叢書名:高等職業(yè)教育大數(shù)據(jù)技術(shù)與應(yīng)用系列規(guī)劃教材
- 作者:陳清華
- 出版時間:2020/3/1
- ISBN:9787121381768
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP311.561;TP181
- 頁碼:200
- 紙張:
- 版次:01
- 開本:16開
使用機器學(xué)習(xí)技術(shù)的產(chǎn)品或服務(wù)在我們的生活當(dāng)中不斷普及,被應(yīng)用于大數(shù)據(jù)分析、智能駕駛、計算機視覺等領(lǐng)域,并迅速改變生活。本書以掌握一定的Python語言基礎(chǔ)為前提,從具體的十一個精簡案例切入,由淺入深、循序漸近展開學(xué)習(xí)機器學(xué)習(xí)在不同業(yè)務(wù)領(lǐng)域中的應(yīng)用,內(nèi)容上注重實用性和可操作性。具體涵蓋了機器學(xué)習(xí)流程、有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、數(shù)據(jù)分析與人工智能應(yīng)用等需要掌握的基本知識和相應(yīng)技能。
陳清華,女,1983年生,碩士上海交通大學(xué)計算機軟件與理論碩士畢業(yè),浙江工業(yè)大學(xué)物聯(lián)網(wǎng)方向博士在讀,溫州職業(yè)技術(shù)學(xué)院計算機系大數(shù)據(jù)專業(yè)專任教師。
項目1 電影數(shù)據(jù)統(tǒng)計 1
1.1 數(shù)據(jù)獲取 1
1.2 數(shù)據(jù)解析 4
1.3 數(shù)據(jù)分析 8
1.4 數(shù)據(jù)可視化 10
1.5 課堂實訓(xùn):工資數(shù)據(jù)統(tǒng)計 16
1.6 練習(xí)題 19
項目2 電影數(shù)據(jù)分析(回歸) 21
2.1 背景知識 21
2.2 使用一元線性回歸分析電影票房數(shù)據(jù) 22
2.2.1 一元線性回歸 22
2.2.2 范圍縮放 25
2.2.3 數(shù)據(jù)集的切分 26
2.3 使用多項式回歸分析電影票房數(shù)據(jù) 29
2.4 使用多元線性回歸分析電影票房數(shù)據(jù) 31
2.5 理解回歸分析方法 34
2.6 課堂實訓(xùn):工齡與工資相關(guān)性分析 36
2.7 練習(xí)題 39
項目3 數(shù)據(jù)的爬取 41
3.1 背景知識 41
3.2 電影數(shù)據(jù)的爬取 42
3.2.1 網(wǎng)絡(luò)數(shù)據(jù)一次爬取 42
3.2.2 網(wǎng)絡(luò)數(shù)據(jù)定時爬取 48
3.2.3 正則表達式 49
3.3 房屋租賃數(shù)據(jù)的爬取 51
3.4 房屋租賃數(shù)據(jù)的統(tǒng)計 54
3.5 課堂實訓(xùn):二手房數(shù)據(jù)的爬取與統(tǒng)計 58
3.6 練習(xí)題 59
項目4 房屋租賃數(shù)據(jù)的分析與可視化 62
4.1 背景知識 62
4.2 使用箱形圖可視化租賃價格分布特征 63
4.3 使用散點圖可視化房屋面積與租賃價格的關(guān)系 65
4.4 使用餅圖可視化不同行政區(qū)的可租賃房源占比 69
4.5 使用折線圖可視化房間數(shù)與租賃價格的關(guān)系 71
4.6 使用熱力圖可視化地理位置與租賃價格的關(guān)系 72
4.7 課堂實訓(xùn):二手房數(shù)據(jù)的分析與可視化 75
4.8 練習(xí)題 78
項目5 身高與體重數(shù)據(jù)分析(分類器) 80
5.1 背景知識 80
5.1.1 機器學(xué)習(xí) 80
5.1.2 監(jiān)督學(xué)習(xí) 80
5.1.3 分類器 82
5.2 使用分類方法進行性別分類 82
5.2.1 邏輯回歸 82
5.2.2 樸素貝葉斯 88
5.2.3 決策樹 91
5.2.4 支持向量機 95
5.3 使用支持向量機進行肥胖程度分類 97
5.4 課堂實訓(xùn):肥胖分析1 101
5.5 練習(xí)題 102
項目6 鳶尾花分類 104
6.1 背景知識 104
6.2 使用K近鄰對鳶尾花進行分類 105
6.3 使用隨機森林對鳶尾花進行分類 108
6.4 使用神經(jīng)網(wǎng)絡(luò)對鳶尾花進行分類 111
6.5 課堂實訓(xùn):肥胖分析2 114
6.6 練習(xí)題 115
項目7 電影評分數(shù)據(jù)分析(聚類) 117
7.1 背景知識 117
7.1.1 無監(jiān)督學(xué)習(xí) 117
7.1.2 聚類 118
7.1.3 K-Means 119
7.2 使用DBSCAN確定質(zhì)心個數(shù) 119
7.3 使用K-Means對觀影用戶進行聚類 123
7.4 課堂實訓(xùn):根據(jù)身高、體重和性別對用戶進行分類 127
7.5 練習(xí)題 130
項目8 人臉檢測與人臉識別 132
8.1 背景知識 132
8.1.1 人工智能 132
8.1.2 計算機視覺 133
8.1.3 OpenCV計算機視覺包 134
8.2 圖像中的人臉檢測 135
8.3 視頻中的人臉檢測 137
8.4 圖像中的人臉識別 140
8.5 視頻中的人臉識別 143
8.6 課堂實訓(xùn):眼睛與笑臉檢測 145
8.7 練習(xí)題 146
項目9 手寫數(shù)字識別應(yīng)用 148
9.1 背景知識 148
9.2 圖像數(shù)據(jù)集準備 149
9.2.1 MNIST數(shù)據(jù)集格式 149
9.2.2 獲取MNIST數(shù)據(jù)集中的圖像 150
9.3 使用支持向量機識別手寫數(shù)字 150
9.4 使用神經(jīng)網(wǎng)絡(luò)識別手寫數(shù)字 154
9.5 課堂實訓(xùn):使用不同的方法識別手寫數(shù)字 155
9.6 練習(xí)題 156
項目10 深度學(xué)習(xí)在行為識別中的應(yīng)用 157
10.1 背景知識 157
10.1.1 卷積神經(jīng)網(wǎng)絡(luò)(CNN) 157
10.1.2 循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN) 159
10.1.3 深度學(xué)習(xí)的應(yīng)用 160
10.2 使用卷積神經(jīng)網(wǎng)絡(luò)識別行為 161
10.2.1 環(huán)境準備 161
10.2.2 數(shù)據(jù)的獲取與解析 161
10.2.3 數(shù)據(jù)集分析 162
10.2.4 卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用 162
10.3 使用循環(huán)神經(jīng)網(wǎng)絡(luò)識別行為 164
10.4 課堂實訓(xùn):電影評論數(shù)據(jù)分析 166
10.5 練習(xí)題 168
項目11 TensorFlow與神經(jīng)網(wǎng)絡(luò) 169
11.1 背景知識 169
11.2 設(shè)計單層神經(jīng)網(wǎng)絡(luò)預(yù)測花瓣寬度 171
11.3 設(shè)計多層神經(jīng)網(wǎng)絡(luò)實現(xiàn)鳶尾花分類 174
11.4 課堂實訓(xùn):卷積神經(jīng)網(wǎng)絡(luò)的實現(xiàn)與應(yīng)用 177
11.5 練習(xí)題 178
項目12 項目綜合實訓(xùn) 180
12.1 確定數(shù)據(jù)采集目標(biāo) 181
12.2 數(shù)據(jù)采集與預(yù)處理 182
12.3 數(shù)據(jù)統(tǒng)計與分析 183
12.3.1 票房分析 183
12.3.2 上座率分析 185
12.3.3 票價分布情況分析 186
12.3.4 評分數(shù)據(jù)分析 186
12.4 數(shù)據(jù)分析與預(yù)測 187
12.4.1 總場次與票房之間的關(guān)系分析 187
12.4.2 評分相關(guān)因素分析與預(yù)測 187
12.5 數(shù)據(jù)分類應(yīng)用 188
12.6 課外拓展實訓(xùn):二手車數(shù)據(jù)的獲取與市場分析 189
附錄A 環(huán)境準備 191
附錄B 本書使用的工具包 194
參考文獻 195