跟著迪哥學Python數(shù)據(jù)分析與機器學習實戰(zhàn)
定 價:89 元
叢書名:Python
- 作者:唐宇迪
- 出版時間:2019/9/1
- ISBN:9787115512444
- 出 版 社:人民郵電出版社
- 中圖法分類:TP311.561
- 頁碼:449
- 紙張:
- 版次:01
- 開本:16開
本書結合了機器學習、數(shù)據(jù)分析和Python語言,通過案例以通俗易懂的方式講解了如何將算法應用到實際任務。
全書共20章,大致分為4個部分。第一部分介紹了Python的工具包,包括科學計算庫Numpy、數(shù)據(jù)分析庫Pandas、可視化庫Matplotlib;第2部分講解了機器學習中的經(jīng)典算法,例如回歸算法、決策樹、集成算法、支持向量機、聚類算法等;第3部分介紹了深度學習中的常用算法,包括神經(jīng)網(wǎng)絡、卷積神經(jīng)網(wǎng)絡、遞歸神經(jīng)網(wǎng)絡;第4部分是項目實戰(zhàn),基于真實數(shù)據(jù)集,將算法模型應用到實際業(yè)務中。
本書適合對人工智能、機器學習、數(shù)據(jù)分析等方向感興趣的初學者和愛好者。
·網(wǎng)易云課堂、51CTO、CSDN人氣培訓講師迪哥唐宇迪老師多年實戰(zhàn)經(jīng)驗匯總
·30萬學員共同的選擇
·面向零基礎,沉浸式學習體驗,打通從算法原理、數(shù)學推導到實例操作的疑難點,快速入門人工智能領域。
1. 通俗易懂,快速入門
對機器學習經(jīng)典算法結合數(shù)學推導進行形象解釋,實例演示。
2. Python主導,實用高效
使用數(shù)據(jù)領域主流語言Python及其分析與建模庫作為課程核心工具。
3. 案例為師,實戰(zhàn)護航
基于真實數(shù)據(jù)集,從零開始結合Python工具與機器學習算法完成整個案例實戰(zhàn)。
唐宇迪,計算機專業(yè)博士,網(wǎng)易云課堂人工智能認證行家,51CTO學院講師,CSDN博客專家、講師。擁有多年人工智能領域培訓經(jīng)驗,帶領課程研發(fā)團隊累計開發(fā)AI課程60余門,覆蓋當下人工智能熱門領域。豐富的教學講解經(jīng)驗,通俗易懂的授課風格,用接地氣的方式幫助同學們進軍人工智能領域。
第 1章 人工智能入學指南
1.1 AI時代首選Python
1.1.1 Python的特點
1.1.2 Python該怎么學
1.2 人工智能的核心——機器學習
1.2.1 什么是機器學習
1.2.2 機器學習的流程
1.2.3 機器學習該怎么學
1.3 環(huán)境配置
1.3.1 Anaconda大禮包
1.3.2 Jupyter Notebook
1.3.3 上哪找資源
本章總結
第 2章 科學計算庫(Numpy)
2.1 Numpy的基本操作
2.1.1 Array數(shù)組
2.1.2 數(shù)組特性
2.1.3 數(shù)組屬性操作
2.2 索引與切片
2.2.1 數(shù)值索引
2.2.2 bool索引
2.3 數(shù)據(jù)類型與數(shù)值計算
2.3.1 數(shù)據(jù)類型
2.3.2 復制與賦值
2.3.3 數(shù)值運算
2.3.4 矩陣乘法
2.4 常用功能模塊
2.4.1 排序操作
2.4.2 數(shù)組形狀操作
2.4.3 數(shù)組的拼接
2.4.4 創(chuàng)建數(shù)組函數(shù)
2.4.5 隨機模塊
2.4.6 文件讀寫
本章總結
第3章 數(shù)據(jù)分析處理庫(Pandas)
3.1 數(shù)據(jù)預處理
3.1.1 數(shù)據(jù)讀取
3.1.2 DataFrame結構
3.1.3 數(shù)據(jù)索引
3.1.4 創(chuàng)建DataFrame
3.1.5 Series操作
3.2 數(shù)據(jù)分析
3.2.1 統(tǒng)計分析
3.2.2 pivot數(shù)據(jù)透視表
3.2.3 groupby操作
3.3 常用函數(shù)操作
3.3.1 Merge操作
3.3.2 排序操作
3.3.3 缺失值處理
3.3.4 apply自定義函數(shù)
3.3.5 時間操作
3.3.6 繪圖操作
3.4 大數(shù)據(jù)處理技巧
3.4.1 數(shù)值類型轉(zhuǎn)換
3.4.2 屬性類型轉(zhuǎn)換
本章總結
第4章 數(shù)據(jù)可視化庫(Matplotlib)
4.1 常規(guī)繪圖方法
4.1.1 細節(jié)設置
4.1.2 子圖與標注
4.1.3 風格設置
4.2 常用圖表繪制
4.2.1條形圖
4.2.2 盒圖
4.2.3 直方圖與散點圖
4.2.4 3D圖
4.2.5 布局設置
本章總結
第5章 回歸算法
5.1 線性回歸算法
5.1.1 線性回歸方程
5.1.2 誤差項分析
5.1.3 似然函數(shù)求解
5.1.4 線性回歸求解
5.2 梯度下降算法
5.2.1 下山方向選擇
5.2.2 梯度下降優(yōu)化
5.2.3 梯度下降策略對比
5.2.4 學習率對結果的影響
5.3 邏輯回歸算法
5.3.1 原理推導
5.3.2 邏輯回歸求解
本章總結
第6章 邏輯回歸項目實戰(zhàn)——信用卡欺詐檢測
6.1 數(shù)據(jù)分析與預處理
6.1.1 數(shù)據(jù)讀取與分析
6.1.2 樣本不均衡解決方案
6.1.3 特征標準化
6.2 下采樣方案
6.2.1 交叉驗證
6.2.2 模型評估方法
6.2.3 正則化懲罰
6.3 邏輯回歸模型
6.3.1 參數(shù)對結果的影響
6.3.2 混淆矩陣
6.3.3 分類閾值對結果的影響
6.4 過采樣方案
6.4.1 SMOTE數(shù)據(jù)生成策略
6.4.2 過采樣應用效果
項目總結
第7章 決策樹
7.1 決策樹原理
7.1.1 決策樹的基本概念
7.1.2 衡量標準
7.1.3 信息增益
7.1.4 決策樹構造實例
7.1.5 連續(xù)值問題
7.1.6 信息增益率
7.1.7 回歸問題求解
7.2 決策樹剪枝策略
7.2.1 剪枝策略
7.2.2 決策樹算法涉及參數(shù)
本章總結
第8章 集成算法
8.1 bagging算法
8.1.1 并行的集成
8.1.2 隨機森林
8.2 boosting算法
8.2.1 串行的集成
8.2.2 Adaboost算法
8.3 stacking模型
本章總結
第9章 隨機森林項目實戰(zhàn)——氣溫預測
9.1 隨機森林建模
9.1.1 特征可視化與預處理
9.1.2 隨機森林回歸模型
9.1.3 樹模型可視化方法
9.1.4 特征重要性
9.2 數(shù)據(jù)與特征對結果影響分析
9.2.1 特征工程
9.2.2 數(shù)據(jù)量對結果影響分析
9.2.2 特征數(shù)量對結果影響分析
9.3 模型調(diào)參
9.3.1 隨機參數(shù)選擇
9.3.2 網(wǎng)絡參數(shù)搜索
項目總結
第 10章 特征工程
10.1 數(shù)值特征
10.1.1 字符串編碼
10.1.2 二值與多項式特征
10.1.3 連續(xù)值離散化
10.1.4 對數(shù)與時間變換
10.2 文本特征
10.2.1 詞袋模型
10.2.2 常用文本特征構造方法
10.3 論文與benchmark
本章總結
第 11章: 貝葉斯算法項目實戰(zhàn)——新聞分類
11.1 貝葉斯算法
11.1.1 貝葉斯公式
11.1.2 拼寫糾錯實例
11.1.3 垃圾郵件分類
11.2 新聞分類任務
11.2.1 數(shù)據(jù)清洗
11.2.1 TF-IDF關鍵詞提取
項目總結
第 12章 支持向量機
12.1 支持向量機工作原理
12.1.1 支持向量機要解決的問題
12.1.2 距離與標簽定義
12.1.3 目標函數(shù)
12.1.4 拉格朗日乘子法
12.2 支持向量的作用
12.2.1 支持向量機求解
12.2.2 支持向量的作用
12.3 支持向量機涉及參數(shù)
12.3.1 軟間隔參數(shù)選擇
12.3.2 核函數(shù)的作用
12.4 案例:參數(shù)對結果的影響
12.4.1 SVM基本模型
12.4.2 核函數(shù)變換
12.4.3 SVM參數(shù)選擇
12.4.4 SVM人臉識別實例
本章總結
第 13章 推薦系統(tǒng)
13.1 推薦系統(tǒng)的應用
13.2 協(xié)同過濾算法
13.2.1 基于用戶的協(xié)同過濾
13.2.1 基于商品的協(xié)同過濾
13.3 隱語義模型
13.3.1 矩陣分解思想
13.3.2 隱語義模型求解
13.3.3 評估方法
本章總結
第 14章 推薦系統(tǒng)項目實戰(zhàn)——打造音樂推薦系統(tǒng)
14.1 數(shù)據(jù)集清洗
14.1.1 統(tǒng)計分析
14.1.2 數(shù)據(jù)集整合
14.2 基于相似度的推薦
14.2.1 排行榜推薦
14.2.2 基于歌曲相似度的推薦
14.3 基于矩陣分解的推薦
14.3.1 奇異值分解
14.3.2 使用SVD算法進行音樂推薦
項目總結
第 15章 降維算法
15.1 線性判別分析
15.1.1 降維原理概述
15.1.2 優(yōu)化的目標
15.1.3 線性判別分析求解
15.1.4 Python實現(xiàn)線性判別分析降維
15.2 主成分分析
15.2.1 PCA降維基本知識點
15.2.2 PCA優(yōu)化目標求解
15.2.3 Python實現(xiàn)PCA降維
本章總結
第 16章 聚類算法
16.1 K-means算法
16.1.1 聚類的基本特性
16.1.2 K-means算法原理
16.1.2 K-means涉及參數(shù)
16.1.3 K-means聚類效果與優(yōu)缺點
16.2 DBSCAN聚類算法
16.2.1 DBSCAN算法概述
10.2.2 DBSCAN工作流程
16.2.3 半徑對結果的影響
16.3 聚類實例
本章總結
第 17章 神經(jīng)網(wǎng)絡
17.1 神經(jīng)網(wǎng)絡必備基礎
17.1.1 神經(jīng)網(wǎng)絡概述
17.1.2 計算機眼中的圖像
17.1.3 得分函數(shù)
17.1.4 損失函數(shù)
17.1.5 反向傳播
17.2 神經(jīng)網(wǎng)絡整體架構
11.2.1 整體框架
17.2.2 神經(jīng)元的作用
17.2.3 正則化
17.2.4 激活函數(shù)
17.3 網(wǎng)絡調(diào)優(yōu)細節(jié)
17.3.1 數(shù)據(jù)預處理
17.3.2 Drop-Out
17.3.3 數(shù)據(jù)增強
17.3.4 網(wǎng)絡結構設計
本章總結
第 18章 TensorFlow實戰(zhàn)
18.1 TensorFlow基本操作
18.1.1 Tensorflow特性
18.1.2 Tensorflow基本操作
18.1.3 Tensorflow實現(xiàn)回歸任務
18.2 搭建神經(jīng)網(wǎng)絡進行手寫字體識別
本章總結
第 19章 卷積神經(jīng)網(wǎng)絡
19.1 卷積操作原理
19.1.1 卷積神經(jīng)網(wǎng)絡應用
19.1.2 卷積操作流程
19.1.3 卷積計算方法
19.1.4 卷積涉及參數(shù)
19.1.5 池化層
19.2 經(jīng)典網(wǎng)絡架構
19.2.1 卷積神經(jīng)網(wǎng)絡整體架構
19.2.2 AlexNet網(wǎng)絡
19.2.3 VGG網(wǎng)絡
19.2.4 ResNet網(wǎng)絡
19.3 TensorFlow實戰(zhàn)卷積神經(jīng)網(wǎng)絡
本章總結
第 20章 神經(jīng)網(wǎng)絡項目實戰(zhàn)——影評情感分析
20.1 遞歸神經(jīng)網(wǎng)絡
20.1.1 RNN網(wǎng)絡架構
20.1.2 LSTM網(wǎng)絡
20.2 影評數(shù)據(jù)特征工程
20.2.1 詞向量
20.2.2 數(shù)據(jù)特征制作
20.3 構建RNN模型
項目總結