應(yīng)用統(tǒng)計分析是一門關(guān)于如何獲取、整理數(shù)據(jù)和分析客觀現(xiàn)象數(shù)量規(guī)律的方法論的學(xué)科。本書共10章,主要介紹應(yīng)用統(tǒng)計分析的基本理論和方法,內(nèi)容包括隨機變量、隨機向量及其統(tǒng)計特性,抽樣調(diào)查與抽樣分布,參數(shù)估計,假設(shè)檢驗,方差分析,回歸分析,判別分析,聚類分析,主成分分析,因子分析等。本書各章均配有習(xí)題,方便學(xué)生鞏固所學(xué)知識。
本書可作為高等院校經(jīng)濟管理類專業(yè)的研究生教材,也可供從事應(yīng)用統(tǒng)計分析的實際工作者參考。
書中列舉了大量的例題和實際案例的分析,并配有習(xí)題和數(shù)據(jù)方便學(xué)生練習(xí)和鞏固相應(yīng)的知識。 本書可作為高等院校統(tǒng)計、經(jīng)管專業(yè)的本科生和研究生教材,也可供從事統(tǒng)計分析的實際工作者參考。
隨著計算機和信息技術(shù)的迅猛發(fā)展,人類社會進入了信息爆炸的大數(shù)據(jù)時代,過去無法想象的海量數(shù)據(jù)正以數(shù)字形式聚集。早期獲取數(shù)據(jù)艱難,只能通過少量數(shù)據(jù)來推斷事物規(guī)律,如今要從海量繁雜的數(shù)據(jù)信息中挖掘出有用信息并進行合理估計同樣困難,甚至更為復(fù)雜。因此,海量數(shù)據(jù)密集型科學(xué)可能會成為未來科學(xué)發(fā)展新的趨勢,進而帶動未來科研方式的革命性變革。隨著計算機和統(tǒng)計軟件的廣泛應(yīng)用,統(tǒng)計學(xué)中的一個分支——多元統(tǒng)計分析迅速發(fā)展起來,它能夠從多維度分析實際問題,使得解決問題的途徑更加豐富,其應(yīng)用范圍也向更加廣泛的社會科學(xué)和自然科學(xué)領(lǐng)域擴展。應(yīng)用統(tǒng)計分析已成為大數(shù)據(jù)時代發(fā)現(xiàn)問題、分析問題和解決問題不可或缺的理論方法及重要工具。
2003年我們出版了《應(yīng)用統(tǒng)計學(xué)教程》(西安電子科技大學(xué)出版社出版,2004年被教育部推薦為研究生教材)。該教材作為研究生教學(xué)用書使用了近20年。其間我們對書中內(nèi)容進行了多次完善。本書是在此教材的基礎(chǔ)上綜合了多方意見編寫而成的。本書不僅強調(diào)應(yīng)用,而且盡可能從數(shù)學(xué)理論上加以推導(dǎo)證明。作為應(yīng)用統(tǒng)計分析課程的研究生教材,本書力求幫助學(xué)生從實際應(yīng)用中理解數(shù)理統(tǒng)計中的理論依據(jù),培養(yǎng)他們發(fā)現(xiàn)問題、分析問題和解決問題的能力。
全書共10章。第1~6章介紹數(shù)理統(tǒng)計的基礎(chǔ)理論及應(yīng)用,內(nèi)容包括隨機變量、隨機向量及其統(tǒng)計特性,抽樣調(diào)查與抽樣分布,參數(shù)估計,假設(shè)檢驗,方差分析,回歸分析等。第7~10章介紹多元統(tǒng)計分析的理論與方法,內(nèi)容包括判別分析、聚類分析、主成分分析以及因子分析等。多元統(tǒng)計分析部分配有案例分析,較為復(fù)雜的案例分析采用SAS和SPSS統(tǒng)計軟件來實現(xiàn)。全書各章均配有習(xí)題,方便學(xué)生鞏固所學(xué)知識。
本書第3、5、7、9、10章由溫小霓編寫,第2、4、6章由劉云編寫,第1、8章由徐揚編寫。本書的編寫得到了西安電子科技大學(xué)研究生院領(lǐng)導(dǎo)以及趙瑋教授的大力支持,西安電子科技大學(xué)出版社的戚文艷、王瑛、閻彬編輯對本書的出版付出了辛勤的勞動,在此一并表
示衷心的感謝。
雖然我們付出了很多艱辛的努力,且花費了很長的時間編寫本書,但書中難免有疏漏之處,敬請各位讀者批評指正,以便今后進一步修改、完善。
溫小霓
2021年9月于西安
第1章 隨機變量、隨機向量及其統(tǒng)計特性 1
1.1 隨機變量的分布與數(shù)字特征參數(shù) 1
1.1.1 分布函數(shù)與密度函數(shù) 1
1.1.2 隨機變量的常用分布 2
1.1.3 隨機變量的數(shù)字特征 16
1.2 概率母函數(shù)、特征函數(shù)與矩母函數(shù) 27
1.2.1 概率母函數(shù) 27
1.2.2 特征函數(shù) 31
1.2.3 矩母函數(shù) 33
1.3 隨機向量及其變換 35
1.3.1 分布函數(shù)、密度函數(shù)與獨立性 36
1.3.2 隨機向量的數(shù)字特征參數(shù) 43
1.3.3 隨機變量與隨機向量的變換 45
1.3.4 n元正態(tài)向量及其線性變換 50
1.3.5 大數(shù)定律與中心極限定理 52
1.4 條件數(shù)學(xué)期望與條件方差 53
1.4.1 條件數(shù)學(xué)期望 54
1.4.2 條件方差 56
1.5 常用分布表 57
習(xí)題 62
第2章 抽樣調(diào)查與抽樣分布 63
2.1 總體、樣本、統(tǒng)計量及其統(tǒng)計特性 64
2.1.1 總體、樣本、統(tǒng)計量與抽樣概型 64
2.1.2 樣本總值、樣本均值與樣本k階原點矩的統(tǒng)計特性 66
2.1.3 總體總值、總體均值與總體比例的估計及誤差 70
2.1.4 順序統(tǒng)計量 73
2.2 抽樣調(diào)查設(shè)計 79
2.2.1 抽樣目標、指標體系與誤差設(shè)計 79
2.2.2 抽樣組織方式 80
2.2.3 抽樣算法 84
2.2.4 樣本容量的確定 86
2.2.5 統(tǒng)計調(diào)查表與問卷設(shè)計 92
2.3 統(tǒng)計數(shù)據(jù)的加工、描述與信息提煉 97
2.3.1 統(tǒng)計數(shù)據(jù)的加工 98
2.3.2 統(tǒng)計數(shù)據(jù)的描述 100
2.3.3 統(tǒng)計信息的提煉 105
習(xí)題 113
第3章 參數(shù)估計 115
3.1 估計量及其比較準則 115
3.2 總體參數(shù)的估計 118
3.2.1 矩估計 118
3.2.2 極大似然估計 120
3.2.3 區(qū)間估計 122
3.2.4 廣義極大似然估計與貝葉斯(Bayes)估計 128
3.3 總體均值、總體總值與總體比例的估計 132
3.3.1 分層抽樣下三指標的估計 132
3.3.2 整群抽樣下三指標的估計 138
3.3.3 系統(tǒng)抽樣下三指標的估計 142
習(xí)題 142
第4章 假設(shè)檢驗 144
4.1 假設(shè)檢驗的基本思路與方法 144
4.1.1 小概率事件的實際推斷原理 144
4.1.2 假設(shè)檢驗的實施步驟 145
4.1.3 假設(shè)檢驗的分類與方法 147
4.2 參數(shù)假設(shè)檢驗 147
4.2.1 單個正態(tài)總體參數(shù)的假設(shè)檢驗 148
4.2.2 兩個正態(tài)總體參數(shù)的一致性檢驗 151
4.2.3 非正態(tài)總體參數(shù)的假設(shè)檢驗 156
4.3 非參數(shù)假設(shè)檢驗 157
4.3.1 χ2檢驗法 157
4.3.2 符號檢驗法 166
4.3.3 秩和檢驗法 171
習(xí)題 181
第5章 方差分析 184
5.1 單因素方差分析 184
5.2 雙因素方差分析 195
5.2.1 有重復(fù)試驗的雙因素方差分析 195
5.2.2 無重復(fù)試驗的雙因素方差分析 202
習(xí)題 204
第6章 回歸分析 207
6.1 相關(guān)分析 207
6.1.1 變量之間的關(guān)系 207
6.1.2 相關(guān)關(guān)系的測定 208
6.1.3 樣本相關(guān)系數(shù)r的統(tǒng)計分布 210
6.1.4 總體相關(guān)系數(shù)ρ的統(tǒng)計檢驗 211
6.1.5 相關(guān)分析中應(yīng)注意的問題 213
6.2 一元線性回歸分析 213
6.2.1 一元線性回歸模型 214
6.2.2 一元線性回歸模型參數(shù)a和b的估計 214
6.2.3 一元線性回歸方程及有關(guān)估計量的性質(zhì) 215
6.2.4 一元線性回歸模型的檢驗 219
6.2.5 一元線性回歸預(yù)測與控制 223
6.2.6 曲線回歸的線性化處理 227
6.3 多元線性回歸分析 228
6.3.1 多元線性回歸模型 228
6.3.2 復(fù)相關(guān)系數(shù)與偏相關(guān)系數(shù) 233
6.3.3 多元線性回歸模型的檢驗 236
6.3.4 多元線性回歸預(yù)測 239
6.3.5 多元線性回歸分析中的多重共線性 239
6.3.6 多元線性回歸分析中的序列相關(guān) 242
6.3.7 多元線性回歸分析中的異方差性 247
習(xí)題 252
第7章 判別分析 256
7.1 變量測度與數(shù)據(jù)的變換處理 257
7.1.1 變量測度 257
7.1.2 數(shù)據(jù)的變換處理 258
7.2 距離判別 259
7.3 貝葉斯(Bayes)判別 267
7.4 費歇判別 273
習(xí)題 278
第8章 聚類分析 282
8.1 概述 282
8.2 相似性度量 283
8.3 系統(tǒng)聚類法 285
8.4 變量聚類法 289
8.5 動態(tài)聚類法 290
習(xí)題 291
第9章 主成分分析 293
9.1 概述 293
9.2 總體的主成分及其特性 295
9.3 用相關(guān)矩陣確定主成分 300
9.4 樣本主成分 303
9.5 主成分回歸 306
習(xí)題 310
第10章 因子分析 312
10.1 因子分析的基本概念 312
10.2 因子分析模型 313
10.2.1 因子分析模型的性質(zhì) 314
10.2.2 因子載荷矩陣中的幾個統(tǒng)計特性 315
10.2.3 因子載荷矩陣的估計 316
10.3 因子旋轉(zhuǎn)(正交變換) 320
10.3.1 旋轉(zhuǎn)變換后的性質(zhì) 320
10.3.2 因子旋轉(zhuǎn)方法 321
10.4 因子得分 325
10.4.1 因子得分函數(shù) 325
10.4.2 因子得分的應(yīng)用案例 326
習(xí)題 332
附表 335
附表1 標準正態(tài)分布N(0, 1)表 335
附表2 χ2分布表 336
附表3 t分布表 337
附表4 F分布表 338
附表5 符號檢驗表 341
附表6 Wilcoxon符號秩和檢驗的T臨界值 342
附表7 秩和檢驗表 343
附表8 曼〖CD*2]惠特尼U檢驗(MWU的臨界值) 344
附表9 方差齊性的Hartley檢驗表和Cochran檢驗表 345
附表10 累積泊松分布cd=0λdd!e-λ數(shù)值表 347
附表11 檢驗相關(guān)系數(shù)ρ=0的臨界值(rα)表 349
附表12 DW統(tǒng)計量臨界值表 350
參考文獻 351