定 價:69.8 元
叢書名:數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)系列規(guī)劃教材
- 作者:王仁武
- 出版時間:2021/11/1
- ISBN:9787115556097
- 出 版 社:人民郵電出版社
- 中圖法分類:TP311.561
- 頁碼:
- 紙張:
- 版次:
- 開本:
本書使用數(shù)據(jù)科學領域中流行的編程語言之一——Python 來進行數(shù)據(jù)的基本處理與可視化、數(shù)據(jù)獲取、數(shù)據(jù)分析、數(shù)據(jù)挖掘、文本挖掘和深度學習,旨在幫助讀者掌握從事數(shù)據(jù)科學工作的技能。
全書共 9 章,主要內容包括數(shù)據(jù)科學概述、Python 基礎知識、Python 數(shù)據(jù)科學常用庫、Python 數(shù)據(jù)獲取、Python 數(shù)據(jù)分析、Python 數(shù)據(jù)挖掘、Python 文本挖掘、深度學習基礎和深度學習應用。
本書可作為普通高等院校數(shù)據(jù)科學與大數(shù)據(jù)技術、大數(shù)據(jù)應用與管理等專業(yè)相關課程的教材,也可作為數(shù)據(jù)分析從業(yè)人員的參考書。
針對 Python 零基礎讀者,系統(tǒng)講述使用 Python 進行數(shù)據(jù)分析、數(shù)據(jù)挖掘及深度學習的相關知識
基于數(shù)據(jù)分析流程,結合案例解析,提高讀者的數(shù)據(jù)分析、數(shù)據(jù)挖掘及數(shù)據(jù)可視化等能力
配備豐富的教學資源,包括 PPT 課件、教學大綱、數(shù)據(jù)源、代碼、習題與參考答案等
王仁武,男,工科博士、副教授,現(xiàn)華東師范大學信息學系教師,主要研究方向數(shù)據(jù)分析、數(shù)據(jù)挖掘與文本挖掘、機器學習與深度學習等。
第 1章 數(shù)據(jù)科學概述1
1.1 什么是數(shù)據(jù)科學 1
1.2 如何學習數(shù)據(jù)科學 2
1.3 什么是數(shù)據(jù)科學家 2
1.4 數(shù)據(jù)科學家需要掌握的技能 3
1.5 Python與數(shù)據(jù)科學 3
1.6 數(shù)據(jù)科學領域常用的Python包 4
1.7 時代寵兒—深度學習 6
習題 6
第 2章 Python基礎知識 7
2.1 Python介紹 7
2.1.1 Jupyter Notebook的簡介及使用 8
2.1.2 Python基礎概念 10
2.1.3輸入和輸出 14
2.1.4運算符 15
2.2 常見數(shù)據(jù)結構和基本語句 17
2.2.1序列 17
2.2.2字典 23
2.2.3集合 27
2.2.4基本語句 29
2.3 函數(shù)和模塊 32
2.3.1函數(shù) 32
2.3.2模塊 38
2.4 異常處理 43
2.4.1什么是異!43
2.4.2常見異常錯誤 43
2.4.3捕捉異!44
2.4.4觸發(fā)異常 45
2.5 文件讀寫 45
2.5.1編碼 45
2.5.2讀取文本文件 46
2.5.3 Word文件與Excel文件讀取 51
2.6 Pythonic 51
2.6.1解析式 52
2.6.2三元表達式 53
2.6.3花樣傳參:zip與星號操作 54
本章小結 56
習題 56
第3章 Python數(shù)據(jù)科學常用庫 58
3.1 Python數(shù)據(jù)分析概述 58
3.2 Numpy數(shù)值計算 59
3.2.1 Numpy基礎簡介 59
3.2.2 Numpy基礎用法簡介 60
3.2.3 Numpy數(shù)據(jù)分析常用函數(shù)簡介 73
3.3 Pandas基礎知識 76
3.3.1 Series介紹及其基本操作 76
3.3.2 DataFrame介紹及其基本操作 79
3.4 Pandas數(shù)據(jù)預處理 82
3.4.1數(shù)據(jù)合并 82
3.4.2 數(shù)據(jù)清洗 86
3.4.3 數(shù)據(jù)標準化 88
3.4.4 數(shù)據(jù)轉換 89
3.5 Pandas數(shù)據(jù)分析基礎 92
3.5.1 分層索引 92
3.5.2 Pandas常用函數(shù)介紹 97
3.5.3 分組 98
3.5.4 整形和旋轉 100
3.5.5 數(shù)據(jù)透視表和交叉表 104
3.6 Matplotlib數(shù)據(jù)可視化 108
3.6.1 Matplotlib簡介 108
3.6.2 Matplotlib繪圖基礎簡介 109
3.6.3 常用統(tǒng)計圖繪制簡介 113
本章小結 116
習題 116
第4章 Python數(shù)據(jù)獲取 118
4.1 數(shù)據(jù)及其類型 119
4.1.1 屬性與屬性類型 119
4.1.2 數(shù)據(jù)類型 120
4.1.3 數(shù)據(jù)集的類型 121
4.2 數(shù)據(jù)獲取方法 124
4.2.1 從文件中獲取數(shù)據(jù) 124
4.2.2 從數(shù)據(jù)庫中獲取數(shù)據(jù) 130
4.2.3 從網(wǎng)絡接口獲取數(shù)據(jù) 133
4.2.4 從網(wǎng)頁抓取數(shù)據(jù) 135
4.3 網(wǎng)絡爬蟲 135
4.3.1 爬蟲簡介及爬蟲流程 135
4.3.2 發(fā)起請求 136
4.3.3 獲取響應內容 138
4.3.4 解析內容 139
4.3.5 Selenium 144
本章小結 147
習題 147
第5章 Python數(shù)據(jù)分析 149
5.1數(shù)據(jù)分析基礎 150
5.1.1 對比分析 151
5.1.2 分組分析 152
5.1.3 結構分析 153
5.1.4 分布分析 153
5.1.5 交叉分析 155
5.2 描述性統(tǒng)計分析 156
5.2.1 數(shù)據(jù)集中趨勢分析 156
5.2.2 數(shù)據(jù)的離散程度分析 157
5.2.3 數(shù)據(jù)的分布形態(tài)分析 159
5.2.4 相關分析 160
5.2.5 基于Seaborn的數(shù)據(jù)可視化分析 161
5.3 主成分分析 164
5.3.1 主成分分析原理介紹 164
5.3.2 主成分分析基本流程 165
5.3.3 Python實現(xiàn)主成分分析 166
5.4 回歸分析 171
5.4.1 簡單線性回歸分析 172
5.4.2 多元線性回歸分析 177
本章小結 181
習題 181
第6章 Python數(shù)據(jù)挖掘 183
6.1 Python數(shù)據(jù)挖掘概述 183
6.1.1 數(shù)據(jù)挖掘分類及常用方法 184
6.1.2 使用Scikit-learn構建數(shù)據(jù)挖掘模型 186
6.2 分類預測:決策樹算法 193
6.2.1 分類算法概述 193
6.2.2 決策樹算法 194
6.2.3 決策樹分枝 195
6.2.4 決策樹剪枝 198
6.2.5 分類算法評估 199
6.2.6 決策樹的Python實現(xiàn) 200
6.3樸素貝葉斯(Naive Bayesian) 202
6.3.1 貝葉斯簡介 202
6.3.2 構建樸素貝葉斯模型 203
6.3.3 樸素貝葉斯的Python實現(xiàn) 204
6.4 人工神經(jīng)網(wǎng)絡 205
6.4.1 人工神經(jīng)網(wǎng)絡簡介 205
6.4.2 神經(jīng)元與激活函數(shù) 207
6.4.3 前饋神經(jīng)網(wǎng)絡 211
6.4.4 反向傳播機制 212
6.4.5 神經(jīng)網(wǎng)絡的Python實現(xiàn) 215
6.5集成學習 220
6.5.1 集成學習簡介 220
6.5.2 裝袋法的代表——隨機森林 223
6.5.3 boosting的代表——xgboost 230
6.6 關聯(lián)分析(Association analysis) 232
6.6.1 關聯(lián)分析概述 232
6.6.2 Apriori算法 235
6.6.3 FP-Growth算法 238
6.6.4 關聯(lián)規(guī)則的Python實現(xiàn) 239
6.7 聚類分析 242
6.7.1 聚類分析概述 242
6.7.2 常用聚類算法 243
6.7.3 聚類算法Python實現(xiàn) 249
本章小結 252
習題 252
第7章 文本挖掘 254
7.1 文本挖掘概述 254
7.1.1 文本挖掘的定義 254
7.1.2 Python中的文本挖掘包 255
7.1.3 文本挖掘的過程 255
7.1.4 文本挖掘的應用 256
7.2 Python文本特征提取 256
7.2.1 中文分詞與詞云 256
7.2.2 特征詞量化與文本特征提取 260
7.2.3 文本表示 262
7.3文本分類 268
7.3.1 文本分類概述 268
7.3.2文本分類的Python實現(xiàn) 269
7.4文本情感分析 271
7.4.1 情感分析概述 271
7.4.2 情感分析的具體應用及示例 273
7.5 LDA主題模型 275
7.5.1主題模型簡介 276
7.5.2主題模型在文本語義挖掘的應用 280
本章小結 282
習題 283
第8章 深度學習基礎 284
8.1 深度學習概述 284
8.1.1機器學習與深度學習 284
8.1.2 深度學習的發(fā)展 285
8.1.3 深度學習框架 286
8.2 PyTorch介紹與安裝 287
8.2.1 PyTorch介紹 287
8.2.2 PyTorch安裝 287
8.3 PyTorch基礎 288
8.3.1 Tensor張量 288
8.3.2 Variable變量 289
8.3.3 優(yōu)化器 290
8.3.4 PyTorch與Numpy 290
8.4 卷積神經(jīng)網(wǎng)絡 292
8.4.1卷積神經(jīng)網(wǎng)絡簡介 292
8.4.2 二維卷積運算的運算基礎 293
8.4.3 二維卷積運算的填充與步長 295
8.4.4 三維卷積運算 296
8.4.5 其他卷積神經(jīng)網(wǎng)絡組件 298
8.5 循環(huán)神經(jīng)網(wǎng)絡 301
8.5.1 RNN的結構 301
8.5.2 RNN存在的問題 304
8.5.3 LSTM 304
8.5.4 GRU 305
8.6 CNN與RNN的PyTorch實現(xiàn) 306
8.6.1 卷積層 306
8.6.2 池化層 307
8.6.3 全連接層 308
8.6.4 RNN 308
8.6.5 LSTM 309
8.6.6 GRU 310
本章小結 310
習題 310
第9章 深度學習應用 313
9.1 圖片分類與遷移學習 313
9.1.1 遷移學習與傳統(tǒng)模型 313
9.1.2 圖片分類的經(jīng)典案例 315
9.1.3 PyTorch實現(xiàn)DenseNet 317
9.2 命名實體識別 321
9.2.1 命名實體識別基礎 321
9.2.2 PyTorch實現(xiàn)命名實體識別 325
本章小結 330
習題 331
參考文獻 332