統(tǒng)計學習要素:機器學習中的數據挖掘、推斷與預測(第2版)
定 價:159 元
- 作者:[美] 特雷弗·哈斯蒂,[美] 羅伯特·提布施拉 著
- 出版時間:2020/12/1
- ISBN:9787302557395
- 出 版 社:清華大學出版社
- 中圖法分類:TP181
- 頁碼:576
- 紙張:膠版紙
- 版次:1
- 開本:16
《統(tǒng)計學習要素:機器學習中的數據挖掘、推斷與預測(第2版)》在一個通用的概念框架中描述通用于數據挖掘、機器學習和生物信息學等領域的重要思想和概念。這些統(tǒng)計學范疇下的概念是人工智能與機器學習的基礎。全書共18 章,主題包括監(jiān)督學習、回歸的線性方法、分類的線性方法、基展開和正則化、核光滑方法、模型評估和選擇、模型推斷和平均、加性模型、樹和相關方法、Boosting 和加性樹、神經網絡、支持向量機和柔性判斷、原型方法和最近鄰、非監(jiān)督學習、隨機森林、集成學習、無向圖模型和高維問題等。
《統(tǒng)計學習要素:機器學習中的數據挖掘、推斷與預測(第2版)》主題全面,是一本經典的統(tǒng)計學習教材,適合本科高年級學生和研究生使用和參考。
第2版前言
“我們信靠上帝,其他的只信數據!”
— 威廉·愛德華·戴明(William Edwards Deming, 1900—1993) ①②
本書第1 版受到了廣大讀者的肯定和歡迎,讓我們備受鼓舞。同時,自此書出版以來,統(tǒng)計學習領域的研究步伐也日新月異。這些促使我們將本書更新至第2 版。
我們增加了4 章新的內容,并更新了已有章節(jié)的部分內容。考慮到許多讀者對第1 版的布局比較熟悉,我們嘗試了盡量少改動本書的結構。下表總結一些主要的變化。
章 新增內容
1. 概述
2. 監(jiān)督學習綜述
3. 回歸的線性方法 最小角度回歸(Least Angle Regression,LAR)
算法和Lasso 的推廣
4. 分類的線性方法 用于邏輯斯特回歸(logistic)的Lasso 路徑
5. 基展開與正則化 增加了對重建核希爾伯特空間(RKHS)的描述
6. 核平滑方法
7. 模型的評估和選擇 交叉驗證的優(yōu)勢和陷阱
8. 模型的推斷和平均
9. 加性模型、樹和相關方法
10. Boosting 和加性樹 一個生態(tài)學的新示例, 一些內容被轉到第16章
11. 神經網絡 貝葉斯神經網和NIPS 2003 挑戰(zhàn)
12. 支持向量機和柔性判別分析 支持向量機(SVM)分類器的路徑算法
13. 原型方法與最近鄰
14. 非監(jiān)督學習 譜聚類,核主成分分析(PCA),稀疏PCA,非
負矩陣分解中的典型分析,非線性維數約簡,谷
歌的頁面排名(Page Rank)算法,一個實現獨
立分量分析(ICA)的直接方法
15. 隨機森林 新
16. 集成學習 新
17. 無向圖模型 新
18. 高維問題:?? ? ?? 新
① 在網絡上,這一引語曾經廣泛認為是戴明(Deming)和海登(Robert W. Hayden)提出的。
然而,海登教授告訴我們,他從未說過此話。比較搞笑的是,我們也沒有找到“數據”來證實戴
明實際上說過這句話。
② 中文版編注:在NASA 有一間會議室的墻上,有這樣一句原話:“In God we trust, all others
bring data.”
其他說明如下。
? 第1 版對色盲讀者不是太友好,特別是我們偏好采用會引起麻煩的紅/綠對比。在新版中,我們對顏色配置進行了較大的改進,用橙色/藍色對比來代替原來的紅/綠對比。
? 我們將第6章的標題從“核方法”改成“核平滑方法”,以免與第12章中的支持向量機部分以及第5章和第14章、在機器學習框架下廣泛討論的核方法混淆。
? 在第1 版中,因為沒有明確區(qū)分條件誤差率(以訓練集為條件)和無條件誤差率,所以第7 章關于誤差率估計的討論有些湊合。在新版中,我們已經修正這一問題。
? 第15章和第16章是從第10章自然發(fā)展而來的,讀者最好能按這個順序來閱讀。
? 在第17章,我們沒有試圖涵蓋圖模型的全部內容,而是只討論了無向圖模型以及估計它們的一些新方法。具體來說,由于篇幅限制,我們在本書中忽略了與有向圖模型相關的內容。
? 第18章探索了高維特征空間學習中的?? ? ?? 問題。這一問題在很多領域(如基因組、蛋白質組和文本分類)中都廣泛存在。
我們感謝在第1 版中發(fā)現(大量)錯誤的眾多讀者。在新版本里,我們?yōu)槟切╁e誤表示歉意,并盡我們最大的努力來避免錯誤再次發(fā)生。我們感謝馬克(Mark Segal)、巴拉(Bala Rajaratnam)和拉瑞(Larry Wasserman)對新增各章的內容提出建議,也感謝斯坦福的許多研究生和博士后提出的建議,尤其是默罕默德(Mohammed AlQuraishi)、約翰(John Boik)、霍爾格(Holger Hoefling)、阿瑞(Arian Maleki)、多拉爾(Donal McMahon)、撒哈榮(Saharon Rosset)、巴巴克(Babak Shababa)、丹尼爾拉(DanielaWitten)、朱奇(Ji Zhu)和鄒輝(Hui Zou)。我們感謝約翰(John Kimmel),因為他耐心指導我們完成了新的版本。羅伯特(Robert Tibshirani)將此書獻給安娜(Anna McPhee)。
特雷弗·哈斯蒂(Trevor Hastie)
羅伯特·提布施拉尼(Robert Tibshirani)
杰羅姆·弗雷曼(Jerome Friedman)
加州,斯坦福大學
2008 年8 月
斯坦福大學統(tǒng)計學教授。三人是該領域的杰出研究人員。哈斯蒂在新澤西州的AT&T貝爾實驗室以技術人員身份工作9年之后,于1994年8月加入斯坦福大學任教。哈斯蒂用S-PLUS寫了許多統(tǒng)計建模軟件,并發(fā)明了主要曲線和曲面。他和提布施拉尼共同開發(fā)了廣義加性模型并寫了這一主題的熱門書。提布施拉尼提出了Lasso,參與創(chuàng)作了《Bootstrap概論》,這本書取得了相當大的成功。弗雷曼是許多數據挖掘工具的共同發(fā)明人,包括CART、MARS、投影追蹤和梯度Boosting。
譯者簡介
張軍平
復旦大學計算機科學技術學院教授,博導,主要研究方向是人工智能、機器學習、生物認證和智能交通。曾經主持多個國j級項目。他是人工智能著名期刊 IEEE Intelligent Systems 編委,擔任《軟件學報》和《自動化學報》等國內權威期刊責任編輯。他是中國自動化學會混合智能專業(yè)委員會副主任。他在人工智能及相關專業(yè)領域發(fā)表了100余篇論文,包括 IEEE TPAMI,TNNLS,ToC,TAC和TITS等期刊以及ICML, AAAI和 ECCV等國際會議上。他的人工智能科普暢銷書《愛犯錯的智能體》榮獲了2019年中國自動化學會科普獎。2020年中國科普作家協(xié)會第六屆優(yōu)秀作品獎(中國科普創(chuàng)作領域z高獎)金獎以及2020年第十屆吳文俊人工智能科技進步獎(科普項目)。