本書通過正在學習機器學習的程序員綾乃和她朋友美緒的對話,結合回歸和分類的具體問題,逐步講解了機器學習中實用的數(shù)學基礎知識。其中,重點講解了容易成為學習絆腳石的數(shù)學公式和符號。同時,還通過實際的Python 編程講解了數(shù)學公式的應用,進而加深讀者對相關數(shù)學知識的理解。
一本書掌握機器學習的基礎數(shù)學。
1.步步引導,對話形式好理解
結合回歸和分類的具體問題,逐步講解機器學習中實用的基礎數(shù)學知識
2.層層拆解,復雜公式看得懂
把數(shù)學表達式拆開看,一部分一部分地去理解就好懂了
3.用Python實現(xiàn)分類和回歸算法
通過實際的Python編程講解數(shù)學公式的應用,加深讀者對數(shù)學知識的理解。書中的Python代碼均可下載。
立石賢吾(作者)
SmartNews公司的機器學習工程師。從日本佐賀大學畢業(yè)后曾就職于數(shù)家開發(fā)公司,并于2014年入職LINE Fukuoka,在該公司于日本福岡市成立的數(shù)據(jù)分析和機器學習團隊中,負責利用機器學習開發(fā)推薦系統(tǒng)、文本分類等產(chǎn)品,并擔任團隊負責人。2019年入職SmartNews公司,擔任現(xiàn)職。
鄭明智(譯者)
智慧醫(yī)療工程師。主要研究方向為醫(yī)療與前沿ICT技術的結合及其應用,密切關注人工智能、5G、量子計算等領域。譯有《松本行弘:編程語言的設計與實現(xiàn)》《深度學習基礎與實踐》《詳解深度學習:基于TensorFlow和Keras學習RNN》。
第 1章 開始二人之旅 1
1.1 對機器學習的興趣 2
1.2 機器學習的重要性 4
1.3 機器學習的算法 7
1.4 數(shù)學與編程 12
第 2章 學習回歸——基于廣告費預測點擊量 15
2.1 設置問題 16
2.2 定義模型 19
2.3 最小二乘法 22
2.4 多項式回歸 41
2.5 多重回歸 45
2.6 隨機梯度下降法 52
第3章 學習分類——基于圖像大小進行分類 59
3.1 設置問題 60
3.2 內(nèi)積 64
3.3 感知機 69
3.3.1 訓練數(shù)據(jù)的準備 71
3.3.2 權重向量的更新表達式 74
3.4 線性可分 80
3.5 邏輯回歸 82
3.5.1 sigmoid函數(shù) 83
3.5.2 決策邊界 86
3.6 似然函數(shù) 91
3.7 對數(shù)似然函數(shù) 96
3.8 線性不可分 104
第4章 評估——評估已建立的模型 109
4.1 模型評估 110
4.2 交叉驗證 112
4.2.1 回歸問題的驗證 112
4.2.2 分類問題的驗證 117
4.2.3 精確率和召回率 121
4.2.4 F值 125
4.3 正則化 130
4.3.1 過擬合 130
4.3.2 正則化的方法 131
4.3.3 正則化的效果 132
4.3.4 分類的正則化 139
4.3.5 包含正則化項的表達式的微分 140
4.4 學習曲線 144
4.4.1 欠擬合 144
4.4.2 區(qū)分過擬合與欠擬合 146
第5章 實現(xiàn)——使用Python編程 153
5.1 使用Python實現(xiàn) 154
5.2 回歸 155
5.2.1 確認訓練數(shù)據(jù) 155
5.2.2 作為一次函數(shù)實現(xiàn) 158
5.2.3 驗證 164
5.2.4 多項式回歸的實現(xiàn) 168
5.2.5 隨機梯度下降法的實現(xiàn) 176
5.3 分類——感知機 179
5.3.1 確認訓練數(shù)據(jù) 179
5.3.2 感知機的實現(xiàn) 182
5.3.3 驗證 185
5.4 分類——邏輯回歸 188
5.4.1 確認訓練數(shù)據(jù) 188
5.4.2 邏輯回歸的實現(xiàn) 189
5.4.3 驗證 194
5.4.4 線性不可分分類的實現(xiàn) 197
5.4.5 隨機梯度下降法的實現(xiàn) 204
5.5 正則化 206
5.5.1 確認訓練數(shù)據(jù) 206
5.5.2 不應用正則化的實現(xiàn) 210
5.5.3 應用了正則化的實現(xiàn) 212
5.6 后話 215
附錄
A.1 求和符號、求積符號 218
A.2 微分 220
A.3 偏微分 224
A.4 復合函數(shù) 227
A.5 向量和矩陣 229
A.6 幾何向量 233
A.7 指數(shù)與對數(shù) 237
A.8 Python環(huán)境搭建 241
A.9 Python基礎知識 244
A.10 NumPy基礎知識 254