基于R的統(tǒng)計(jì)分析與數(shù)據(jù)挖掘
定 價(jià):48 元
叢書名:統(tǒng)計(jì)數(shù)據(jù)分析與應(yīng)用叢書
- 作者:薛薇
- 出版時(shí)間:2014/5/1
- ISBN:9787300190747
- 出 版 社:中國人民大學(xué)出版社
- 中圖法分類:C819
- 頁碼:
- 紙張:膠版紙
- 版次:1
- 開本:16開
薛薇博士編著的這本《基于R的統(tǒng)計(jì)分析與數(shù)據(jù) 挖掘》聚焦當(dāng)今備受國內(nèi)外數(shù)據(jù)分析師和數(shù)據(jù)應(yīng)用者 關(guān)注的R語言,關(guān)注如何借助R實(shí)現(xiàn)統(tǒng)計(jì)分析和數(shù)據(jù)挖 掘。它既不是僅側(cè)重理論講解的統(tǒng)計(jì)分析和數(shù)據(jù)挖掘 教科書,也不是僅側(cè)重R編程操作的使用手冊(cè),而是 以數(shù)據(jù)分析貫穿全書的兩者的有機(jī)結(jié)合。
本書特色在于:以數(shù)據(jù)模擬的直觀方式論述方法 原理的同時(shí),通過案例強(qiáng)化R的操作實(shí)踐性;在以解 決應(yīng)用問題為目標(biāo)討論R操作的同時(shí),通過原理論述 強(qiáng)化模型結(jié)果的解讀理解。
《基于R的統(tǒng)計(jì)分析與數(shù)據(jù)挖掘》定位于統(tǒng)計(jì)分 析和數(shù)據(jù)挖掘的學(xué)習(xí)者、實(shí)踐者和研究者,旨在使讀 者理解統(tǒng)計(jì)分析原理,熟練操控R軟件,拓展數(shù)據(jù)應(yīng) 用,提升研究水平。
本書配套數(shù)據(jù)文件 前往中國人民大學(xué)出版社 http://www.crup.com.cn/Item/123831.aspx 進(jìn)行注冊(cè)下載(本資源為開放資源,網(wǎng)站注冊(cè)會(huì)員即可下載)薛薇博士編著的這本《基于R的統(tǒng)計(jì)分析與數(shù)據(jù)挖掘》聚焦當(dāng)今備受國內(nèi)外數(shù)據(jù)分析師和數(shù)據(jù)應(yīng)用者關(guān)注的R語言,企圖借助R實(shí)現(xiàn)統(tǒng)計(jì)分析和數(shù)據(jù)挖掘。理由很簡單:R不僅囊括了幾乎所有的經(jīng)典統(tǒng)計(jì)方法,而且擁有眾多前沿的現(xiàn)代統(tǒng)計(jì)模型、數(shù)據(jù)挖掘算法以及頂尖的繪圖功能;不僅可以解決數(shù)據(jù)分析的共性問題,而且能夠服務(wù)于電商、金融、醫(yī)學(xué)、生物、地理、環(huán)境、傳媒等領(lǐng)域的特色數(shù)據(jù)應(yīng)用;不僅適合統(tǒng)計(jì)分析的學(xué)習(xí)者、學(xué)術(shù)研究的探索者,而且適合致力數(shù)據(jù)應(yīng)用開發(fā)的實(shí)踐者和掘金者。
薛薇,工學(xué)碩士、經(jīng)濟(jì)學(xué)博士,中國人民大學(xué)統(tǒng)計(jì)學(xué)院副教授,教育部人文社會(huì)科學(xué)重點(diǎn)研究基地:中國人民大學(xué)應(yīng)用統(tǒng)計(jì)學(xué)科研究中心副主任。關(guān)注數(shù)據(jù)挖掘及統(tǒng)計(jì)分析方法,統(tǒng)計(jì)和數(shù)據(jù)挖掘軟件應(yīng)用,統(tǒng)計(jì)數(shù)據(jù)庫系統(tǒng)研發(fā)等方面,涉足網(wǎng)絡(luò)新媒體傳播和互動(dòng)模式建模、政府和官方微博分析、學(xué)科學(xué)術(shù)熱點(diǎn)跟蹤等文本挖掘和統(tǒng)計(jì)應(yīng)用領(lǐng)域,以及以數(shù)據(jù)挖掘?yàn)橐劳械目蛻絷P(guān)系管理等。主要代表作:《SPSS統(tǒng)計(jì)分析方法及應(yīng)用》、《Clementine數(shù)據(jù)挖掘方法及應(yīng)用》、《基于信息技術(shù)的統(tǒng)計(jì)信息系統(tǒng)》。
第1章 關(guān)于R 1.1 為什么選擇R 1.2 如何學(xué)習(xí)R 1.3 R入門必備 1.4 小結(jié)第2章 R的數(shù)據(jù)組織 2.1 R的數(shù)據(jù)對(duì)象 2.2 創(chuàng)建和訪問R的數(shù)據(jù)對(duì)象 2.3 從文 第1章 關(guān)于R 1.1 為什么選擇R 1.2 如何學(xué)習(xí)R 1.3 R入門必備 1.4 小結(jié)第2章 R的數(shù)據(jù)組織 2.1 R的數(shù)據(jù)對(duì)象 2.2 創(chuàng)建和訪問R的數(shù)據(jù)對(duì)象 2.3 從文本文件讀數(shù)據(jù) 2.4 外部數(shù)據(jù)的導(dǎo)入 2.5 R數(shù)據(jù)組織的其他問題 2.6 小結(jié)第3章 R的數(shù)據(jù)管理 3.1 數(shù)據(jù)合并 3.2 數(shù)據(jù)排序 3.3 缺失數(shù)據(jù)報(bào)告 3.4 變量計(jì)算 3.5 變量值的重編碼 3.6 數(shù)據(jù)篩選 3.7 數(shù)據(jù)保存 3.8 數(shù)據(jù)管理中控制流程 3.9 小結(jié)第4章 R的基本數(shù)據(jù)分析:描述和相關(guān) 4.1 數(shù)值型單變量的描述 4.2 分類型單變量的描述 4.3 兩數(shù)值型變量相關(guān)性的分析 4.4 兩分類型變量相關(guān)性的分析 4.5 小結(jié)第5章 R的基本數(shù)據(jù)分析:可視化 5.1 繪圖基礎(chǔ) 5.2 數(shù)值型單變量分布的可視化 5.3 分類型變量分布和相關(guān)性的可視化 5.4 兩數(shù)值型變量相關(guān)性的可視化 5.5 lattice繪圖 5.6 小結(jié)第6章 R的兩均值比較檢驗(yàn) 6.1 兩獨(dú)立樣本的均值檢驗(yàn) 6.2 兩配對(duì)樣本的均值檢驗(yàn) 6.3 樣本均值檢驗(yàn)的功效分析 6.4 兩總體分布差異的非參數(shù)檢驗(yàn) 6.5 兩樣本均值差的置換檢驗(yàn) 6.6 兩樣本均值差的自舉法檢驗(yàn) 6.7 小結(jié)第7章 R的方差分析 7.1 單因素方差分析 7.2 單因素協(xié)方差分析 7.3 多因素方差分析 7.4 小結(jié)第8章 R的回歸分析:一般線性模型 8.1 回歸分析概述 8.2 建立線性回歸模型 8.3 線性回歸方程的檢驗(yàn) 8.4 回歸診斷:誤差項(xiàng)是否滿足高斯馬爾科夫假定 8.5 回歸診斷:診斷數(shù)據(jù)中的異常觀測(cè)點(diǎn) 8.6 回歸診斷:多重共線性的診斷 8.7 回歸建模策略 8.8 回歸模型驗(yàn)證 8.9 帶虛擬變量的線性回歸分析 8.10 小結(jié)第9章 R的回歸分析:廣義線性模型 9.1 廣義線性模型概述 9.2 logistic回歸分析:連接函數(shù)和參數(shù)估計(jì) 9.3 logistic回歸分析:解讀模型和模型檢驗(yàn) 9.4 logistic回歸分析:R函數(shù)和示例 9.5 logistic回歸分析:回歸診斷 9.6 泊松回歸分析 9.7 廣義線性模型的交叉驗(yàn)證 9.8 小結(jié)第10章 R的聚類分析 10.1 聚類分析概述 10.2 K-Means聚類 10.3 層次聚類 10.4 兩步聚類 10.5 小結(jié)第11章 R的因子分析:變量降維 11.1 因子分析概述 11.2 構(gòu)造因子變量:基于主成分分析法 11.3 構(gòu)造因子變量:基于主軸因子法 11.4 因子變量的命名 11.5 計(jì)算因子得分 11.6 小結(jié)第12章 R的線性判別分析:分類模型 12.1 距離判別 12.2 Fisher判別 12.3 小結(jié)第13章 R的決策樹:預(yù)測(cè)模型 13.1 決策樹算法概述 13.2 分類回歸樹的生長過程 13.3 分類回歸樹的剪枝 13.4 建立分類回歸樹的R函數(shù)和示例 13.5 建立分類回歸樹的組合預(yù)測(cè)模型 13.6 隨機(jī)森林 13.7 小結(jié)第14章 R的人工神經(jīng)網(wǎng)絡(luò):預(yù)測(cè)和聚類 14.1 人工神經(jīng)網(wǎng)絡(luò)概述 14.2 B-P反向傳播網(wǎng)絡(luò) 14.3 B-P反向傳播網(wǎng)絡(luò)的R函數(shù)和示例 14.4 SOM自組織映射網(wǎng)絡(luò) 14.5 小結(jié)