《統(tǒng)計學(基本概念和方法)》回避了純數(shù)學式的描述,以風趣的語言、清晰直觀和容易理解的實例闡述了統(tǒng)計學的基本概念和統(tǒng)計學在包括健康、婚姻、教育、體育、科學、經(jīng)濟活動等各方面扮演的重要角色,幫助學生克服了學習統(tǒng)計學的障礙(不強調(diào)公式,較難或較難理解的內(nèi)容放在章末),使用計算機和統(tǒng)計軟件使學生從煩瑣的計算中解脫出來,讓他們把精力集中在對統(tǒng)計過程和概念的理解上。每一道習題提供了統(tǒng)計結果中可能的主題,在書末給出了奇數(shù)號習題答案和各種統(tǒng)計表。
學生希望從統(tǒng)計課中學到什么呢?不是公式、技巧或推理,而是一些基本概念和方法,并能把這些基本概念和方法應用到他們的專業(yè)以及日常生活之中!督y(tǒng)計學(基本概念和方法)》就是基于以上準則的一本創(chuàng)新的統(tǒng)計學教材,只要有中學文化的讀者都能讀懂。從數(shù)據(jù)入手:
如何評估統(tǒng)計的有效性?
變量是如何定義的?
用了什么樣的統(tǒng)計方法?
什么是“統(tǒng)計顯著”的結果?
研究這些問題將使我們進入統(tǒng)計學的中心,《統(tǒng)計學(基本概念和方法)》將引導學生提出并回答這些問題,教會學生如何看待研究結果、調(diào)查、選舉投票、廣告宣傳,以及其它的隱藏于數(shù)據(jù)中的統(tǒng)計結果。
《統(tǒng)計學(基本概念和方法)》精練而又豐富的教材經(jīng)過了千錘百煉,很受學生歡迎。它不僅可作為理工科、文科、金融管理各專業(yè)學生的統(tǒng)計教材,也可作為各行各業(yè)實驗工作者和各級領導的統(tǒng)計“啟蒙”或“掃盲”之用。
這本統(tǒng)計學教材在設計和寫作上都相當獨特。該書是為了滿足當代學生對統(tǒng)計日益增長而又尚未滿足的需求,使他們能夠熟練地掌握統(tǒng)計信息的特性。對于希望他們的學生能懂點統(tǒng)計知識的教師們來說,這本書很有裨益。然而,僅憑這一本書,是不可能使學生們變成統(tǒng)計學家的。
在過去幾年里,統(tǒng)計信息已經(jīng)從政府機構積滿灰塵的檔案中和學術計算中心里解放出來了。從國家關于健康改革和國防的政策到對于預期壽命、婚姻、墮胎、教育和體育的態(tài)度,統(tǒng)計信息在很多方面扮演了重要角色。統(tǒng)計信息經(jīng)常在報紙、雜志、廣播和電視節(jié)目中出現(xiàn),它們甚至偶爾會在MTV和卡通片中做點綴。統(tǒng)計也滲透到了我們的教育課程中。在小學教室里和博士生討論班中,統(tǒng)計信息已成為教育的基本特征。
盡管統(tǒng)計有這么多的應用,但是我們很難說大家對于統(tǒng)計信息不僅接受而且有了較多的了解。當人們看到一個研究結果時,他們?nèi)绾闻袛嘟Y論是否正確?他們是否會問:這個研究中的變量是如何定義的?用了什么樣的統(tǒng)計方法?什么是“統(tǒng)計顯著”的結果?所報告的結果有什么樣的不足?這些問題正是我們在本書中討論的一部分內(nèi)容。顯然,理解了統(tǒng)計學的主要概念以后,大家才能夠明白那些專門鼓搗數(shù)字的人們都干了些什么,并對他們結果進行評價。
這本書脫胎于Gudmund R.Iversen開設的一門課的講義,目的是滿足人們對統(tǒng)計信息日益增長的需要。該課是Swarthmore學院為使大學文科的學生能夠迎接21世紀的挑戰(zhàn)而開設的一系列課程之一。開設這些課程的思想是為了使學生們能夠開闊眼界,而不是拘囿于某一學科的復雜之處。這些課程試圖使學生們了解一個領域的主要思想是如何聯(lián)系于現(xiàn)實世界的。在許多方面,統(tǒng)計學看起來正是這類課程的理想選擇之一。盡管統(tǒng)計學可能是一門令人困惑的、自我膨脹的、神秘莫測的學科,但它也能夠成為理解許多其它學科的一把鑰匙。課程《統(tǒng)計學I:統(tǒng)計思想》就是被設計成產(chǎn)生這種理解力的。事實證明,這門課非常受歡迎,其規(guī)模每年都在擴大。隨著時間的流逝,這門課的講義變得越來越精練和豐富,最終構成了本書的基礎。
公式
正如大部分統(tǒng)計教師所敏銳地意識到的那樣,統(tǒng)計的教學方法已經(jīng)發(fā)生了戲劇性的變化。計算機與教學環(huán)境的結合,尤其是界面越來越方便友好的統(tǒng)計軟件的使用,已經(jīng)使舊的學習方法——特別是記憶并運用統(tǒng)計公式——不再適用于大部分學生。為了忠實于本書的目的,我們在每一章的講解中都沒有使用統(tǒng)計公式。盡管這看起來有些激進,但經(jīng)過深思熟慮之后,我們降低了公式的地位,把它們放在每章末尾的單獨一節(jié)里。
我們的經(jīng)驗是,統(tǒng)計公式就像一門外語。如果一個人理解了這種語言,那么公式會大大增進他對統(tǒng)計學的理解;否則,這些公式就像密碼一樣難以破譯。我們已經(jīng)看到,很多同學在學習統(tǒng)計時,公式反倒成了一種障礙。我們堅信,不用公式,也照樣有可能獲得對統(tǒng)計思想的深刻理解。
1 統(tǒng)計學:隨機性和規(guī)律性
1.1 統(tǒng)計學:用一句話來說是什么?
1.2 懂得如何運用統(tǒng)計:讀者的目標
理解什么可能出差錯
理解統(tǒng)計術語
1.3 統(tǒng)計學的主要思想
隨機性和規(guī)律性:關系密切的孿生子
規(guī)律性中的隨機性7
研究隨機性和規(guī)律性時的兩個例子
概率:什么是機會
變量:我們給事物所起的名字
變量.值和個體
理論變量和經(jīng)驗變量
常數(shù)
1.4 統(tǒng)計的使用者
1.5 統(tǒng)計學和數(shù)學、鉛筆及計算機的關系
1.6 小結
補充讀物
習題
2 數(shù)據(jù)的收集
2.1 定義變量
2.2 觀測數(shù)據(jù):問題和可能性
總體相對樣本
樣本的選擇:確信鍋里的湯被攪拌均勻
隨機樣本:是什么?
方便樣本:如何產(chǎn)生一個“壞的”樣本
選擇合適的樣本
用于收集觀測數(shù)據(jù)的變量的選擇
2.3 收集觀測數(shù)據(jù)時的錯誤和誤差
抽樣誤差:并非錯誤的“誤差”
未響應誤差:粗魯?shù)?匆忙的或沉默的響應者造成的結果
響應誤差
2.4 實驗數(shù)據(jù):尋找造成結果的原因
實驗組和對照組
選擇實驗組和對照組
對人做實驗時產(chǎn)生的問題
在實驗中統(tǒng)計的角色
總結:班級規(guī)模影響學校表現(xiàn)嗎?
2.5 數(shù)據(jù)陣/數(shù)據(jù)文件
2.6 小結
補充讀物
習題
3 數(shù)據(jù)的描述:圖和表
3.1 圖:畫出數(shù)據(jù)
生成統(tǒng)計圖
圖的種類
3.2 分類變量:圓餅圖和條形圖
為一個分類變量作圖
為兩個分類變量作圖
3.3 度量變量:點圖和直方圖
為一個度量變量作圖
為兩個度量變量作圖
時間序列圖
3.4 根據(jù)數(shù)據(jù)作地圖
3.5 作圖:優(yōu)秀的標準
“最少的筆墨”:最簡單的圖是最好的嗎?62
“圖中垃圾”:垃圾的一種新名稱63
數(shù)據(jù)密度
“復雜性的展示”
3.6 表:改變排列方式可能更合適
3.7 小結
補充讀物
習題
4 數(shù)據(jù)的描述:計算匯總統(tǒng)計量
4.1 各種平均數(shù):讓我們數(shù)數(shù)有幾種
眾數(shù):“最多的”的宿主
中位數(shù):數(shù)到中間那一個
均值:平衡蹺蹺板
眾數(shù),中位數(shù),還是均值?
4.2 變差:測量生活的樂趣
極差:套住兩個極端值
標準差:重要的偏差
4.3 均值的標準誤差
4.4 標準得分:比較蘋果和桔子
4.5 簡單化的收益與信息的丟失
用圖表來代替數(shù)據(jù)
用匯總值代替數(shù)據(jù)
4.6 房地產(chǎn)數(shù)據(jù):看不見的價格
4.7 小結
補充讀物
公式
習題
5 概率
5.1 怎樣得到概率
利用等可能性事件
使用相對頻數(shù)的方法
利用主觀概率
5.2 概率的計算
概率的加法
概率的乘法
5.3 優(yōu)勢:概率的對照物
5.4 離散變量的概率分布
二項分布
Poisson分布
超幾何分布
用圖表來表示概率
概率的計算
5.5 連續(xù)變量的概率分布
標準正態(tài)分布:鐘形曲線
t-分布
X2分布
F-分布
正態(tài)分布數(shù)據(jù)的需要
5.6 使用概率來核對假設
硬幣是公平的嗎?
是一種公平的工作環(huán)境嗎?
兩黨選民是否勢均力敵?
5.7 決策分析:利用概率來作決策
5.8 小結
補充讀物
公式
習題
6 作出結論:估計
6.1 樣本統(tǒng)計量和總體參數(shù)
6.2 點估計
什么是一個好的點估計?
戰(zhàn)略中使用點估計的例子:德軍有多少坦克?
6.3 區(qū)間估計:給結論留一些余地
置信區(qū)間的長度
差異的置信區(qū)間
6.4 小結
補充讀物
公式
習題
7 作出結論:假設檢驗
7.1 作為一個問題的假設
零假設
備擇假設
回答問題時的錯誤
7.2 怎樣回答零假設所提出的問題
概率:p-值
假設檢驗的機制
拒絕或不拒絕零假設
因果關系:過猶不及
一些統(tǒng)計理論和計算游戲
7.3 顯著水平
7.4 總體比例檢驗
7.5 兩個總體比例的差異
檢驗零假設
估計差異值
7.6 假設檢驗與構造置信區(qū)間
7.7 統(tǒng)計顯著和實際顯著
7.8 應用:何時拒絕零假設
關于合作性與競爭性的心理測試
對社區(qū)的藍領工人的研究
7.9 小結
補充讀物
公式
習題
8 變量間的關系
8.1 關于兩個變量的4個問題以及它們之間的關系
問題1.變量間有關系么?
問題2.關系的強弱程度?
問題3.變量在總體中的關系如何?
問題4.是因果關系嗎?
8.2 預測:從一個變量到另一個變量
8.3 自變量和因變量
8.4 不同類型的變量:分類型變量.順序型變量和數(shù)量型變量
8.5 回到因果關系的問題
別的變量的角色
時間的角色
多元因果關系
8.6 小結
補充讀物
習題
9 兩個分類變量的X2分析
9.1 數(shù)據(jù)分析:在態(tài)度上有可靠的差異嗎?
條形圖
分類變量的匯總計算
9.2 問題1.變量間的關系?
9.3 問題2.關系的強度?
樣本中的
總體中的
9.4 問題3:總體中的關系?
提出零假設
檢驗零假設
從X2到p-值
X2分析的自由度
9.5 問題4.是因果關系嗎?
9.6 更大的表:更多的可能性
問題1.兩變量間的關系?
問題2.關系的強度?
問題3.總體中的關系?
問題4.是因果關系嗎?
9.7 小結
補充讀物
公式
習題
10 兩個數(shù)值型變量的回歸分析和相關分析
10.1 問題1.兩個變量間的關系?
作這些數(shù)據(jù)的散點圖
了解散點圖
線性關系
10.2 問題2a.關系的強度?
r是正的還是負的?大還是小?
四種不同的散點圖:關系從強到弱
r的解釋:不那么嚴謹
10.3 問題2b.關系的形式?
一條通過點的中心的直線
怎樣計算回歸直線:最小二乘原理
用回歸分析進行預測:從脂肪到熱量
效果的度量:r2的解釋
相關和/或回歸?多多益善
變化數(shù)據(jù)的回歸分析
10.4 問題3.總體中的關系?
置信區(qū)間的方法
用t進行假設檢驗
利用F進行假設檢驗
10.5 警告:所測即所得
10.6 用虛擬變量時怎樣變得聰明些
自變量是有兩個取值的分類變量和因變量是數(shù)值變量
因變量是有兩個取值的分類變量和自變量是數(shù)值變量
10.7 問題4.是因果關系嗎?
10.8 小結
補充讀物
公式
習題
11 ANOVA:一個分類變量和一個數(shù)量變量的方差分析
11.1 方差分析:對比事物的平均值
11.2 問題1.犯罪率和地區(qū)之間的關系
散點圖
盒子圖:更簡單地了解數(shù)據(jù)
11.3 問題2.關系有多強?
地區(qū)變量
殘差變量
地區(qū)變量和殘差變量的總效應:總平方和
測量關系的強度
對變化量的解釋程度
11.4 問題3.這個關系是純屬偶然的嗎?
零假設
F變量的p-值
超出F檢驗:比較均值
11.5 問題4.是因果關系嗎?
11.6 方差分析:鳥瞰回顧
11.7 配對分析:每個單元兩個觀測
t-檢驗
符號檢驗:只回答是或否
11.8 小結
補充讀物
公式
習題
12 兩個順序變量的秩方法
12.1 用詞作為值的兩個順序變量
問題1.身份和興趣間的關系?
問題2.相關的程度?
問題3.總體的關系?
問題4.是因果關系嗎?
12.2 把數(shù)目的排序作為值:Phillies表現(xiàn)如何?
問題1.數(shù)據(jù)中的關系?
問題2.關系強度?
問題3.相關性是由于偶然嗎?
問題4.是因果關系嗎?
12.3 小結
補充讀物
公式
習題
13 多元分析
13.1 偏:三個分類型變量
控制第三個變量:中立策略
偏
13.2 數(shù)值型變量的多元回歸
問題1.數(shù)據(jù)中的關系是什么?
問題2a.這種關系的形式是什么?偏回歸系數(shù)
問題2b.這些關系的強度有多大?偏相關系數(shù)
問題2c.總體關系的強度有多大?多重相關系數(shù)
問題3.總體中的關系?
13.3 用一個啞元作多元回歸
13.4 雙因子方差分析
僅對于時段的單因子分析
僅對于路線的單因子分析
時段和路線的雙因于分析
考慮交互效應,再進行研究
13.5 建立因果關系
13.6 小結
補充讀物
公式
習題
14 日常生活中的統(tǒng)計
14.1 通向統(tǒng)計精妙的基石
14.2 小心地處理數(shù)據(jù)
14.3 數(shù)據(jù)和統(tǒng)計方法
14.4 怎么會出錯
數(shù)據(jù)收集中的危險
調(diào)查研究的特殊問題
分析方法的誤用
統(tǒng)計推斷的誤用
數(shù)字的錯誤解釋
14.5 統(tǒng)計和專制
14.6 在高潮時結束
補充讀物
習題
統(tǒng)計術語
統(tǒng)計表
奇數(shù)號練習題答案
索引