本書的重點是介紹定類和定序變量的統(tǒng)計方法,特點是盡可能地應用簡單的數(shù)學知識解釋相關的統(tǒng)計學原理,以利于從事社會科學研究的學者掌握并應用定性數(shù)據(jù)的量度方法。在本書中,概率比是貫穿全書的最重要的概念和量度。在學習對數(shù)概率比和對數(shù)線性模型時,讀者要具備普通線性回歸和方差分析的知識,并結合列聯(lián)表的分析方法,才能理解模型的設定及其參數(shù)的意義。
趙平,中國社會科學院社會學研究所研究員。
第1章 二維列聯(lián)表
1 列聯(lián)表的頻次和概率結構
2 變量獨立檢驗
3 定序數(shù)據(jù)的獨立性檢驗
4 定類-定序列聯(lián)表的檢驗統(tǒng)計量
5 r×c列聯(lián)表的概率
6 小樣本的精確檢驗
7 方差分析
第2章 多維列聯(lián)表
1 三維列聯(lián)表的變量關聯(lián)和控制
2 三維列聯(lián)表的統(tǒng)計分析
3 條件關聯(lián)的精確推論
4 變量關聯(lián)的簡化量度
第3章 對數(shù)線性模型
1 定類變量的二維對數(shù)線性模型 第1章 二維列聯(lián)表
1 列聯(lián)表的頻次和概率結構
2 變量獨立檢驗
3 定序數(shù)據(jù)的獨立性檢驗
4 定類-定序列聯(lián)表的檢驗統(tǒng)計量
5 r×c列聯(lián)表的概率
6 小樣本的精確檢驗
7 方差分析
第2章 多維列聯(lián)表
1 三維列聯(lián)表的變量關聯(lián)和控制
2 三維列聯(lián)表的統(tǒng)計分析
3 條件關聯(lián)的精確推論
4 變量關聯(lián)的簡化量度
第3章 對數(shù)線性模型
1 定類變量的二維對數(shù)線性模型
2 定類變量的三維對數(shù)線性模型
3 應用對數(shù)線性模型分析數(shù)據(jù)
4 對數(shù)線性模型和定序數(shù)據(jù)
第4章 定序變量的對數(shù)線性模型
1 二元定序變量的對數(shù)線性模型
2 多元定類和定序變量的對數(shù)線性模型
3 含交互項的模型
第5章 對數(shù)概率比模型
1 線性概率模型和對數(shù)概率比模型的比較
2 對數(shù)線性模型和對數(shù)概率比模型的關系
第6章 定序應變量的對數(shù)概率比模型
1 對數(shù)概率比模型的類型和應用
2 定序-定類列聯(lián)表的對數(shù)概率比模型
3 多元定序概率比模型
第7章 統(tǒng)計軟件的迅猛發(fā)展
1 使用SAS和SPSS對定性數(shù)據(jù)進行分析
2 用于交互分類表的軟件
參考文獻
定性變量包含定類變量和定序變量。顧名思義,定類變量包含不同的類別,例如性別、黨派;而定序變量是連續(xù)的,如情感、意識等。但是定類變量和定序變量不能量化。例如,比較兩個家庭的夫妻關系,我們只能說一個家庭的夫妻關系比另一個家庭的夫妻關系好,而不能說“好多少”。在社會科學的一些領域,定類變量和定序變量占有很大的比重,一向是統(tǒng)計學要處理的。
20世紀40年代,數(shù)理統(tǒng)計學家和應用統(tǒng)計學家經(jīng)過不懈的努力,撰寫了大量的論文,至1980年完善了數(shù)學思想,創(chuàng)立了很多關于定序變量和定類變量的統(tǒng)計與檢驗方法。例如,通過定序變量的層次賦值方法,學者應用尼爾森相關系數(shù),量度列聯(lián)表的定序變量的關聯(lián),并將適用于定序變量和定類變量的對數(shù)概率比回歸模型和對數(shù)線性回歸模型引入社會統(tǒng)計學,取代了有問題的概率線性回歸模型。時至今日,30多年過去了,當時針對列聯(lián)表的量度和檢測方法以及對數(shù)概率比和對數(shù)線性回歸已經(jīng)成為社會統(tǒng)計學的基礎,不掌握這方面的知識,不僅不能正確地分析和量度定性變量,而且會阻礙我們學習更先進的統(tǒng)計方法。
本書的重點是介紹定類和定序變量的統(tǒng)計方法。一般來講,當一個變量既可以作為定類變量也可以作為定序變量處理時,應該選擇后者,因為應用定序變量的連續(xù)性質及其層次賦值的方法,具有很多特殊的優(yōu)點:
對于同一變量,定序方法比定類方法更靈敏,可以檢測出定類量度否定的變量之間的關聯(lián);
定序數(shù)據(jù)和定距數(shù)據(jù)具有相同的連續(xù)性,因此適用于定距數(shù)據(jù)的統(tǒng)計量,如相關、均值和斜率也適用于定序數(shù)據(jù);
有很多簡單的模型適用于定序變量,并且很容易對參數(shù)進行解釋,這是定類變量所不及的;
在量度含有相同數(shù)目變量的模型的擬合優(yōu)度方面,定序變量的參數(shù)往往少于定類變量的參數(shù),所以更簡單,易于計算。
從另一方面講,在社會調查數(shù)據(jù)中,既有定序數(shù)據(jù),也有定類數(shù)據(jù)。例如在列聯(lián)表中,應變量是定序變量,解釋變量是定類變量。更有甚者,研究人員為了方便或其他目的會將定序變量改成定類變量。因此,在介紹處理定序數(shù)據(jù)的統(tǒng)計方法時,本書也要涉及處理定類數(shù)據(jù)的統(tǒng)計方法。
本書的宗旨是盡可能地應用簡單的數(shù)學知識解釋相關的統(tǒng)計學原理,以利于從事社會科學研究的讀者掌握并應用定性數(shù)據(jù)的量度方法。盡管如此,書中仍有大量的數(shù)學內容。實際上,這些數(shù)學內容并不高深,只要具有髙中數(shù)學水平就能看懂。在閱讀過程中,讀者要注意以下幾點:首先,數(shù)學符號本身不是數(shù)學,但是在學習的過程中,常常不是數(shù)學知識而是紛雜的符號及其角標令讀者望而卻步。本書中也有很多數(shù)學符號,這是無法回避的。讀者只有在理解和記住這些符號后,才能學習那些并不深奧的數(shù)學知識。其次,概率比(θ)不僅是對二維列聯(lián)表和多維列聯(lián)表的變量關聯(lián)的量度,而且是對對數(shù)概率比模型和對數(shù)線性回歸模型的關聯(lián)參數(shù)的量度?梢哉f,概率比是貫穿全書的最重要的概念和量度。最后,列聯(lián)表和模型對定性數(shù)據(jù)進行統(tǒng)計量度的目的在于測量定序數(shù)據(jù)的“線性趨勢”,例如列聯(lián)表的累積概率和概率比描述的概率分布就是為此服務的。在學習對數(shù)概率比和對數(shù)線性模型時,讀者要具備普通線性回歸和方差分析的知識,并結合列聯(lián)表的分析方法,才能理解模型的設定及其參數(shù)的意義。
在撰寫本書的過程中,陳嬰嬰、夏傳玲、趙峰和張亮杰同志為本書提供了豐富的社會調查數(shù)據(jù)。此外,社會科學文獻出版社的同志為本書的出版付出了大量精力。對以上諸位同志,我要表示衷心的感謝。
書中如有不當之處,敬請讀者批評指正。