《R語言統(tǒng)計入門(第2版)》以最恰當(dāng)?shù)姆绞较虺鯇W(xué)者介紹了R語言的全貌,內(nèi)容涵蓋基本的R編程方法、基本數(shù)據(jù)處理和一些高級數(shù)據(jù)操作的技巧,有助于讀者理解R向量化編程的特點。此外,作者在《R語言統(tǒng)計入門(第2版)》中還詳細(xì)描述了包含回歸分析、假設(shè)檢驗、廣義線性模型、非線性擬合等常用統(tǒng)計方法的原理。雖然《R語言統(tǒng)計入門(第2版》以實際案例解析居多,但是并非不重視理論,作者恰當(dāng)而到位地描述了理論方面的內(nèi)容,既不晦澀,也非淺薄,而是向讀者打開了一扇窗。作者希望這 《R語言統(tǒng)計入門(第2版)》可以作為一道“開胃菜”引導(dǎo)更多的人投入到對統(tǒng)計和R的研究之中。
本書適合數(shù)據(jù)分析,數(shù)據(jù)統(tǒng)計人員及R用戶學(xué)習(xí)參考。
目前,使用R語言進(jìn)行教學(xué)和科研已經(jīng)具備一定的規(guī)模。然而,并沒有一本特別實用的R語言和統(tǒng)計學(xué)相結(jié)合的著作。這本書每一章都會簡單介紹相關(guān)話題的統(tǒng)計學(xué)理論,更多的提供實際數(shù)據(jù)的分析代碼,以及作者的編程經(jīng)驗。學(xué)習(xí)本書將令初學(xué)者少走許多彎路。此外,本書每一章末還配有適量的練習(xí)題,可供練習(xí)或者教學(xué)使用。
業(yè)界對R語言的重視程度也逐年提升。而這本書對于在企業(yè)中處理實際數(shù)據(jù)的分析人員和建模人員來說,應(yīng)該是更為趁手的一本工具書。深入淺出的理論介紹,可重復(fù)的分析流程,寶貴的編程經(jīng)驗,這些恰恰是業(yè)界所需要的。
本書配套有相關(guān)的R包ISwR,提供了本書中所使用的實際數(shù)據(jù),方便讀者練習(xí)使用。
PeterDalgaard是哥本哈根大學(xué)生物統(tǒng)計系的教授。1997年便成為R語言核心團(tuán)隊成員。具有豐富的R語言統(tǒng)計分析的實戰(zhàn)和教學(xué)經(jīng)驗。
郝智恒,蘭州人,南開大學(xué)數(shù)理統(tǒng)計專業(yè)畢業(yè),目前在淘寶做數(shù)據(jù)挖掘工程師。推崇開源,認(rèn)為唯有共享和交流才能讓這個世界變好,固執(zhí)的認(rèn)為一切技術(shù)上的封閉和試圖壟斷都是紙老虎。
何通,生長于桂林,求學(xué)于廣州,喜統(tǒng)計,好編程,結(jié)交眾友,不亦樂乎。
鄧一碩,畢業(yè)于中央財經(jīng)大學(xué)統(tǒng)計學(xué)院統(tǒng)計專業(yè),現(xiàn)效力于首鋼總公司計財部。國內(nèi)最大的統(tǒng)計學(xué)專業(yè)社區(qū)“統(tǒng)計之都”理事人員,感興趣的領(lǐng)域是時間序列分析及數(shù)據(jù)挖掘技術(shù)在金融投資分析中的應(yīng)用。
劉旭華,現(xiàn)為中國農(nóng)業(yè)大學(xué)理學(xué)院應(yīng)用數(shù)學(xué)系副教授,北京理工大學(xué)博士,美國北卡萊羅納大學(xué)教堂山分校(UniversityofNorthCarolinaatChapelHill)訪問學(xué)者,主要從事數(shù)理統(tǒng)計方向的研究工作。主持和參與多項國家自然科學(xué)基金及其他科研基金項目,發(fā)表科研論文多篇。
目 錄
第1章 基礎(chǔ)知識 1
1.1 初始步驟 1
1.1.1 大型計算器 2
1.1.2 賦值 3
1.1.3 向量運(yùn)算 4
1.1.4 標(biāo)準(zhǔn)過程 5
1.1.5 作圖 6
1.2 R語言基礎(chǔ) 8
1.2.1 表達(dá)式和對象 8
1.2.2 函數(shù)和參數(shù) 9
1.2.3 向量 10
1.2.4 引用和轉(zhuǎn)義序列 10
1.2.5 缺失值 11
1.2.6 生成向量的函數(shù) 11
1.2.7 矩陣和數(shù)組 13
1.2.8 因子 15
1.2.9 列表 16
1.2.10 數(shù)據(jù)框 17
1.2.11 索引 17
1.2.12 條件選擇 18
1.2.13 數(shù)據(jù)框的索引 19
1.2.14 分組數(shù)據(jù)和數(shù)據(jù)框 20
1.2.15 隱式循環(huán) 21
1.2.16 排序 23
1.3 練習(xí)題 24
第2章 R語言環(huán)境 25
2.1 會話管理 25
2.1.1 工作空間窗口 25
2.1.2 文本輸出 26
2.1.3 腳本 27
2.1.4 獲取幫助 27
2.1.5 包 28
2.1.6 內(nèi)置數(shù)據(jù) 29
2.1.7 attach和detach 29
2.1.8 subset,transform和within 31
2.2 作圖系統(tǒng) 32
2.2.1 圖形布局 32
2.2.2 利用部分構(gòu)造圖形 33
2.2.3 par的使用 34
2.2.4 組合圖形 35
2.3 R編程 36
2.3.1 流程控制 37
2.3.2 類和類函數(shù) 37
2.4 數(shù)據(jù)輸入 38
2.4.1 讀取文本文件 39
2.4.2 read.table的進(jìn)一步討論 41
2.4.3 數(shù)據(jù)編輯器 42
2.4.4 其他程序的接口 43
2.5 練習(xí)題 44
第3章 概率和分布 45
3.1 隨機(jī)抽樣 45
3.2 概率計算和排列組合 46
3.3 離散分布 47
3.4 連續(xù)分布 47
3.5 R中的內(nèi)置分布 48
3.5.1 密度 48
3.5.2 累積分布函數(shù) 50
3.5.3 分位數(shù) 51
3.5.4 隨機(jī)數(shù)字 52
3.6 練習(xí)題 53
第4章 描述性統(tǒng)計和圖形 54
4.1 單組的匯總統(tǒng)計量 54
4.2 分布的圖形展示 58
4.2.1 直方圖 58
4.2.2 經(jīng)驗累積分布 59
4.2.3 Q-Q圖 59
4.2.4 箱式圖 60
4.3 分組數(shù)據(jù)的匯總統(tǒng)計量 61
4.4 分組數(shù)據(jù)作圖 64
4.4.1 直方圖 64
4.4.2 并聯(lián)箱式圖 65
4.4.3 帶狀圖 66
4.5 表格 68
4.5.1 生成表格 68
4.5.2 邊際表格和相對頻數(shù) 71
4.6 表格的圖形顯示 72
4.6.1 條形圖 72
4.6.2 點圖 74
4.6.3 餅圖 75
4.7 練習(xí)題 76
第5章 單樣本與雙樣本檢驗 77
5.1 單樣本t檢驗 77
5.2 Wilcoxon符號秩檢驗 80
5.3 兩樣本t檢驗 82
5.4 比較方差 83
5.5 兩樣本W(wǎng)ilcoxon檢驗 84
5.6 配對t檢驗 85
5.7 配對Wilcoxon檢驗 86
5.8 練習(xí)題 87
第6章 回歸與相關(guān)性 88
6.1 簡單線性回歸 88
6.2 殘差與回歸值 92
6.3 預(yù)測與置信帶 95
6.4 相關(guān)性 98
6.4.1 皮爾遜相關(guān)系數(shù) 98
6.4.2 斯皮爾曼相關(guān)系數(shù) 99
6.4.3 肯德爾等級相關(guān)系數(shù)t 100
6.5 練習(xí)題 100
第7章 方差分析與Kruskal-Wallis檢驗 102
7.1 單因素方差分析 102
7.1.1 成對比較和多重檢驗 106
7.1.2 放寬對方差的假設(shè) 107
7.1.3 圖像表示 108
7.1.4 Bartlett檢驗 109
7.2 Kruskal-Wallis檢驗 110
7.3 雙因素方差分析 110
7.4 Friedman檢驗 114
7.5 回歸分析中的方差分析表 114
7.6 練習(xí)題 115
第8章 表格數(shù)據(jù) 117
8.1 單比例 117
8.2 兩個獨(dú)立的比例 118
8.3 k比例,檢驗趨勢 120
8.4 r ′ c表格 122
8.5 練習(xí)題 124
第9章 功效與樣本容量的計算 126
9.1 功效計算原則 126
9.1.1 單樣本t及配對樣本t檢驗的功效 127
9.1.2 兩樣本t檢驗的功效 128
9.1.3 近似方法 128
9.1.4 比較比例的功效 129
9.2 兩樣本問題 129
9.3 單樣本問題及配對樣本檢驗 131
9.4 比例的比較 131
9.5 練習(xí)題 132
第10章 數(shù)據(jù)處理的高級技術(shù) 133
10.1 變量的重編碼 133
10.1.1 cut函數(shù) 133
10.1.2 處理因子 135
10.1.3 日期的使用 136
10.1.4 多變量重編碼 139
10.2 條件計算 140
10.3 合并與重構(gòu)數(shù)據(jù)框 141
10.3.1 追加數(shù)據(jù)框 141
10.3.2 合并數(shù)據(jù)框 142
10.3.3 重塑數(shù)據(jù)框 144
10.4 數(shù)據(jù)的分組及分案例操作 146
10.5 時間分割 148
10.6 練習(xí)題 152
第11章 多元回歸 153
11.1 多維數(shù)據(jù)繪圖 153
11.2 模型設(shè)定和模型輸出 155
11.3 模型篩選 157
11.4 練習(xí)題 161
第12章 線性模型 162
12.1 多項式回歸 163
12.2 過原點的回歸分析 165
12.3 設(shè)計矩陣與虛擬變量 166
12.4 組間的共線性 168
12.5 交互效應(yīng) 172
12.6 可重復(fù)的雙因素方差分析 172
12.7 協(xié)方差分析 173
12.7.1 圖形描述 174
12.7.2 比較回歸線 177
12.8 模型診斷 183
12.9 練習(xí)題 187
第13章 邏輯回歸 189
13.1 廣義線性模型 190
13.2 表格化數(shù)據(jù)的邏輯回歸 190
13.2.1 偏差表分析 195
13.2.2 與趨勢檢驗之間的關(guān)聯(lián) 196
13.3 似然剖面分析 197
13.4 讓步比估計的表達(dá) 199
13.5 原始數(shù)據(jù)的邏輯回歸 199
13.6 預(yù)測 201
13.7 模型檢查 202
13.8 練習(xí)題 206
第14章 生存分析 208
14.1 重要概念 208
14.2 生存對象 209
14.3 Kaplan-Meier估計 210
14.4 對數(shù)秩檢驗 213
14.5 Cox比例風(fēng)險模型 214
14.6 練習(xí)題 216
第15章 比率和泊松回歸 217
15.1 基本思想 217
15.1.1 泊松分布 217
15.1.2 帶有常數(shù)風(fēng)險的生存分析 218
15.2 泊松模型的擬合 219
15.3 計算比率 223
15.4 帶有常數(shù)強(qiáng)度的模型 226
15.5 練習(xí)題 230
第16章 非線性曲線擬合 231
16.1 基本用法 232
16.2 尋找初值 233
16.3 自啟動模型 238
16.4 剖面分析 240
16.5 更好地控制擬合算法 241
16.6 練習(xí)題 242
附錄A 獲取并安裝R以及ISwR包 243
附錄B ISwR中的數(shù)據(jù)集 246
附錄C 摘要 272
附錄D 練習(xí)題答案 283