關(guān)于我們
書單推薦
新書推薦
|
應(yīng)用STATA做統(tǒng)計(jì)分析
Stata軟件與Stata的資源、數(shù)據(jù)管理、制圖、調(diào)查數(shù)據(jù)分析、概要統(tǒng)計(jì)及交互表、方差分析和其他比較方法、線性回歸分析、回歸診斷、擬合曲線、穩(wěn)健回歸、logistic回歸、生存模型與事件計(jì)數(shù)模型、主成分/因子和聚類分析、時(shí)間序列分析、調(diào)查數(shù)據(jù)分析、多層與混合效應(yīng)建模、編程入門。
l結(jié)合示例介紹Stata的制圖功能,包括圖形編輯器。主題從簡(jiǎn)單的條形圖和曲線標(biāo)繪圖到回歸診斷、疊并多幅標(biāo)繪圖和繪制詳細(xì)的、符合發(fā)表要求的圖形。
l基本統(tǒng)計(jì)工具,包括制表、參數(shù)檢驗(yàn)、卡方和其他非參數(shù)檢驗(yàn)、ANOVA/ANCOVA、相關(guān)以及回歸分析。
l高級(jí)方法,包括lowess回歸、穩(wěn)健回歸、分位數(shù)回歸、非線性回歸和Box-Cox回歸;logit、序次logit和多項(xiàng)logit模型;生存分析、事件計(jì)數(shù)分析和泊松分析;一般化線性建模(GLM);因子分析和聚類分析;ARIMA和ARMAX時(shí)間序列建模;以及多層或混合效應(yīng)建!詫(shí)際的易效仿示例加以說明,并側(cè)重統(tǒng)計(jì)分析結(jié)果的解釋。
l新增內(nèi)容涉及從簡(jiǎn)單到高深的調(diào)查數(shù)據(jù)分析;用邊際效應(yīng)圖直觀地解釋ANOVA、線性回歸、logit或混合效應(yīng)建模所得的結(jié)果;結(jié)構(gòu)方程建模(SEM);因子分在回歸中的使用;以及缺失值的多重插補(bǔ)。
l時(shí)新且有趣的示例數(shù)據(jù)集,包括3個(gè)新近的調(diào)查和追蹤氣候亙古變化的時(shí)間序列。
l用示例展示如何編寫自己的Stata程序——用戶自編的程序允許創(chuàng)建數(shù)據(jù)管理和分析的新工具。
中文版序
很高興看到《應(yīng)用STATA做統(tǒng)計(jì)分析》一書經(jīng)巫錫煒、焦開山、李丁、趙聯(lián)飛和王軍等人的努力又一次被翻譯成中文。此書的英文版一直非常成功,一版再版,所以讀者現(xiàn)在閱讀的已是其第8版的中文版。伴隨Stata本身的發(fā)展,《應(yīng)用STATA做統(tǒng)計(jì)分析》一書在每次修訂后都會(huì)變得篇幅更長(zhǎng),并且覆蓋更多的主題。借助此中文版,我希望初次偶讀到《應(yīng)用STATA做統(tǒng)計(jì)分析》一書的新讀者也將會(huì)開卷有益。熟悉更早各版本的讀者們將會(huì)見到新的內(nèi)容。新的介紹調(diào)查研究的一章出現(xiàn)在書的前面,因?yàn)樯鐣?huì)科學(xué)領(lǐng)域的課程經(jīng)常會(huì)涉及該主題。其他章節(jié)中的新增內(nèi)容會(huì)介紹缺失值多重填補(bǔ)、結(jié)構(gòu)方程建模、因子分在回歸中的使用及混合效應(yīng)建模的應(yīng)用。最后一章介紹編程,內(nèi)容做了簡(jiǎn)化,并圍繞部分讀者會(huì)覺得實(shí)用的一個(gè)主要例子(繪制多幅調(diào)查圖形)來進(jìn)行。在本版的寫作中,我也設(shè)法使用更有趣且最新的例子。比如,介紹時(shí)間序列分析的第12章使用了全球氣溫?cái)?shù)據(jù)。它向讀者說明了如何證實(shí)更大規(guī)模研究所得的主要結(jié)論:持續(xù)變暖的全球氣溫并不能為太陽輻照、火山爆發(fā)或自然變化(厄爾尼諾現(xiàn)象)所解釋,而只有當(dāng)我們考慮到持續(xù)攀升的二氧化碳濃度水平時(shí)才能得以理解。一些其他章也使用了環(huán)境主題的例子,從北極海冰到環(huán)境問題看法的調(diào)查,不同領(lǐng)域的讀者或許都會(huì)對(duì)它們感興趣。與這些例子相對(duì)應(yīng)的數(shù)據(jù)可以從Stata網(wǎng)站的Bookstore處下載。《應(yīng)用STATA做統(tǒng)計(jì)分析》(1990)是第一本針對(duì)Stata而寫的書。與Stata軟件本身一樣,此書也旨在做一些前人未做過的事情。我寫這本書的目的是想為學(xué)生和研究人員彌合理論色彩濃厚的教材與Stata自帶手冊(cè)中數(shù)千頁內(nèi)容之間的差距。研究人員需要掌握分析其數(shù)據(jù)的各式技能。因此,《應(yīng)用STATA做統(tǒng)計(jì)分析》一書從基本的主題開始,比如統(tǒng)計(jì)學(xué)導(dǎo)論課上的那些內(nèi)容,或如何建立新的數(shù)據(jù)集。然后進(jìn)入到中級(jí)和高級(jí)主題,諸如回歸診斷、logit模型、穩(wěn)健回歸、因子分析、生存分析、時(shí)間序列模型乃至編程。其中的一些可能出現(xiàn)在研究生的統(tǒng)計(jì)學(xué)課上,而另一些則可能會(huì)在開展研究項(xiàng)目過程中遇到。對(duì)于每一章,我都關(guān)注兩個(gè)實(shí)用的問題:我如何在Stata中進(jìn)行該分析?所得結(jié)果告訴我什么?我的目的是為讀者寫一本工作時(shí)會(huì)擺在其計(jì)算機(jī)旁的書。我經(jīng)常收到GoogleScholar發(fā)來的信息告訴我不同國家的人們確實(shí)如此,并且在他們自己發(fā)表的研究中引用本書。感謝巫錫煒、焦開山、李丁、趙聯(lián)飛和王軍為翻譯此書所付出的努力,現(xiàn)在您有機(jī)會(huì)來判定它對(duì)您的用處了。LawrenceC.Hamilton2016年9月
看到巫錫煒、焦開山、李丁、趙聯(lián)飛和王軍等完成LawrenceC.Hamilton所著StatisticswithSTATA:UpdatedforVersion12,EighthEdition一書的翻譯工作并邀請(qǐng)我審校,我感到十分欣慰和高興。欣慰的是因?yàn)樗麄兌际俏业膶W(xué)生,而我看到他們?cè)诓┦慨厴I(yè)之后仍能在科研、教學(xué)之余做翻譯統(tǒng)計(jì)學(xué)教材這種費(fèi)力不討好但卻非;A(chǔ)性的工作。在我看來,保持對(duì)知識(shí)、方法的不斷學(xué)習(xí)和不斷更新的渴望是一名研究者應(yīng)當(dāng)具備的基本素質(zhì),而專業(yè)文獻(xiàn)翻譯是學(xué)習(xí)和消化新知識(shí)、新方法的重要途徑之一。高興的是雖然我不再參與本書的翻譯工作,但是審校過程中,他們5人的工作仍保持了之前的高質(zhì)量,而熟悉本書的讀者會(huì)看到,本版相對(duì)于以前版本在篇幅、所介紹內(nèi)容和所用示例等方面做了幅度挺大的改動(dòng)。一如既往,本書保持了它的實(shí)用風(fēng)格。第一,它介紹了社會(huì)研究人員常用的統(tǒng)計(jì)方法,從最基礎(chǔ)的數(shù)據(jù)創(chuàng)建、變量改造等到諸如時(shí)間序列模型、生存分析、混合效應(yīng)建模乃至結(jié)構(gòu)方程建模等更復(fù)雜的建模技術(shù)。第二,它側(cè)重Stata操作以及對(duì)統(tǒng)計(jì)分析結(jié)果的解讀,從而在統(tǒng)計(jì)學(xué)教科書與Stata軟件之間架起了一座橋梁。第三,更值得稱道的是,原作者介紹每一統(tǒng)計(jì)方法時(shí)都使用自己或其他研究者所做的實(shí)際研究作為示例,從研究問題開始,到如何做數(shù)據(jù)分析,最后說明哪些分析結(jié)果回答了研究問題,娓娓道來,這幾乎相當(dāng)于教人如何完整實(shí)施一項(xiàng)研究課題,引人入勝。以我本人作為前面兩版翻譯組織者和本版審校者的經(jīng)歷,相信對(duì)定量社會(huì)研究方法感興趣的讀者朋友都能從中獲益匪淺。相比于之前我?guī)ьI(lǐng)他們5位翻譯的兩個(gè)版本,這一版雖然在章數(shù)上有所減少,但內(nèi)容上做了重新編排,結(jié)構(gòu)上顯得更緊湊。比如,原來有關(guān)線性回歸、回歸診斷、擬合曲線和穩(wěn)健回歸的數(shù)章被整合成兩章;同時(shí),還結(jié)合Stata軟件12.0版的更新和統(tǒng)計(jì)方法的發(fā)展,新增了缺失值多重填補(bǔ)、結(jié)構(gòu)方程建模以及復(fù)雜抽樣設(shè)計(jì)下的調(diào)查數(shù)據(jù)等新內(nèi)容,還介紹了一套非常有用的Stata模型擬合后續(xù)命令margins和marginsplot。從我對(duì)譯稿所做審讀和校對(duì)工作來看,譯者們不但對(duì)新增方法本身理解到位,而且對(duì)其Stata軟件的實(shí)現(xiàn)也很熟練,從而確保了翻譯的質(zhì)量。專業(yè)文獻(xiàn)的翻譯首先要追求的是準(zhǔn)確無誤,這一版的翻譯滿足了這一標(biāo)準(zhǔn)。當(dāng)然,就表述的精當(dāng)、流暢而言,譯者們?nèi)杂欣^續(xù)完善的空間。郭志剛2016年10月
這是StatisticswithSTATA第8版的中譯本,也是該書的第三個(gè)中文版。前面兩版都是我們幾位在郭志剛教授的帶領(lǐng)和指導(dǎo)下完成的。他一直用這種翻譯專業(yè)文獻(xiàn)的方式訓(xùn)練我們對(duì)統(tǒng)計(jì)方法的學(xué)習(xí)和掌握。我們都從中受益匪淺。這次我們之所以“劈腿”郭老師獨(dú)立承擔(dān)翻譯工作,完全是他向出版社力薦的結(jié)果。這既是他對(duì)我們的認(rèn)可,更是一種鼓勵(lì)和幫助。感謝郭老師給予這一難得的機(jī)會(huì)!StatisticswithSTATA一書堪稱Stata軟件應(yīng)用教材中的經(jīng)典。自1990年以來,此書伴隨著Stata軟件的更新和統(tǒng)計(jì)方法的發(fā)展而一版再版。一本統(tǒng)計(jì)軟件應(yīng)用教材能夠在圖書市場(chǎng)存活25年并且越來越受讀者歡迎,非經(jīng)典之作而不能為,要知道這個(gè)時(shí)間差不多與Stata軟件本身到目前已經(jīng)存在30余年的時(shí)光一樣長(zhǎng)。當(dāng)然,成就其為經(jīng)典之作更重要的還在于下面兩點(diǎn)。一是此書在形式上既兼顧必要但簡(jiǎn)潔易懂的統(tǒng)計(jì)學(xué)原理介紹,又從實(shí)際研究問題出發(fā)示例說明如何應(yīng)用Stata軟件完成數(shù)據(jù)分析并解讀統(tǒng)計(jì)分析結(jié)果以回答研究問題,非常好地將讓很多人覺得枯燥甚至深?yuàn)W的統(tǒng)計(jì)學(xué)原理與看上去浩繁冗長(zhǎng)的Stata軟件手冊(cè)融合起來。二是此書在內(nèi)容上緊跟統(tǒng)計(jì)理論的發(fā)展和研究實(shí)踐的需要,介紹大多數(shù)學(xué)科領(lǐng)域中最為實(shí)用的統(tǒng)計(jì)方法。比如,此版中既有屬于“基本功”的數(shù)據(jù)管理方面的內(nèi)容,結(jié)合Stata12.0版的新功能,也涉及近年來日漸增多的混合效應(yīng)建模、結(jié)構(gòu)方程建模和缺失值多重填補(bǔ)等“進(jìn)階術(shù)”。所以,盡管此書不斷修訂再版,但始終能夠讓新老讀者開卷有益。翻譯本身就是一件費(fèi)力不討好的事。對(duì)于StatisticswithSTATA這樣的經(jīng)典教材,翻譯它更讓人覺得有壓力,尤其是前面還有郭老師之前的兩個(gè)高質(zhì)量譯本。幸運(yùn)的是,郭老師建議我們?cè)谥白g本的基礎(chǔ)上完成翻譯工作,甚至提供了翻譯之前版本時(shí)創(chuàng)建的關(guān)鍵詞中英文對(duì)照表,這大大方便了我們的翻譯工作,翻譯質(zhì)量也有一定保證。加上他還親自對(duì)譯稿進(jìn)行審校,更為翻譯質(zhì)量增加了一重保證。希望本次翻譯仍能如之前郭老師親自帶領(lǐng)翻譯的兩個(gè)中譯本那樣受讀者們的歡迎和好評(píng)。本版的翻譯工作從今年4月11日同清華大學(xué)出版社李萬紅、王軍老師的第一次見面就開始啟動(dòng)。出于方便,由巫錫煒協(xié)調(diào)整個(gè)翻譯工作。我們根據(jù)各自的興趣和時(shí)間確定了任務(wù)分工:全書正文共14章,巫錫煒承擔(dān)第1、第2、第3、第11、第12、第13章以及書中的前言、中文版序言等內(nèi)容,焦開山承擔(dān)第4、第5、第14章,趙聯(lián)飛承擔(dān)第6、第7章,李丁承擔(dān)第8、第10章,王軍承擔(dān)第9章。雖然各有分工,但是我們?cè)诜g過程中相互討論,并對(duì)其他人的譯稿提出修訂意見。不過,非常遺憾的是,由于出版署名方面的一些限制,只有巫錫煒、焦開山和李丁作為譯者署名出現(xiàn),而具有近乎同樣貢獻(xiàn)的趙聯(lián)飛和王軍則被“等”取代了。受專業(yè)水平和理解能力所限,翻譯中難免有不當(dāng)甚或舛誤之處,懇請(qǐng)讀者們指教和斧正!巫錫煒、焦開山、李丁、趙聯(lián)飛、王軍2016年10月
《應(yīng)用STATA做統(tǒng)計(jì)分析》一書旨在為學(xué)生和實(shí)際研究工作者在統(tǒng)計(jì)教材和Stata應(yīng)用之間架設(shè)橋梁,以縮小兩者之間的差距。為扮演這樣一個(gè)中介角色,本書既不準(zhǔn)備對(duì)某一合適教材做詳細(xì)說明,也不打算盡可能地描述Stata的全部特征。相反,本書示范了如何使用Stata來完成各種各樣的統(tǒng)計(jì)任務(wù)。每章的討論遵循統(tǒng)計(jì)學(xué)概念主題展開,而并非只集中在特定的Stata命令上,這使得《應(yīng)用STATA做統(tǒng)計(jì)分析》一書又具有與Stata參考手冊(cè)不同的結(jié)構(gòu)。比如,數(shù)據(jù)管理一章涉及了創(chuàng)建、導(dǎo)入、合并或改變數(shù)據(jù)文件結(jié)構(gòu)的各種程序。有關(guān)圖形、概要統(tǒng)計(jì)與表格,以及方差分析與其他比較方法的這幾章也都包含諸多不同技術(shù)在內(nèi)而又具有類似性的寬泛主題。本書將新的介紹調(diào)查數(shù)據(jù)(SurveyData)的一章放到了前面,為后續(xù)各章在恰當(dāng)位置出現(xiàn)的更具技術(shù)性的調(diào)查數(shù)據(jù)示例提供了背景知識(shí)。前7章(直到線性回歸分析)為一般性主題,大體上對(duì)應(yīng)了應(yīng)用統(tǒng)計(jì)學(xué)中本科生或研究生一年級(jí)水平的課程,但是增加了深度,討論了分析人員經(jīng)常碰到的實(shí)際問題——比如,如何導(dǎo)入數(shù)據(jù)、繪制符合發(fā)表質(zhì)量要求的圖形、使用調(diào)查權(quán)重,或者解決回歸中的問題。在第8章(高級(jí)回歸)及隨后各章中,我們轉(zhuǎn)入高級(jí)課程或原創(chuàng)研究的領(lǐng)域。這里,讀者能夠找到有關(guān)lowess修勻、穩(wěn)健回歸、分位數(shù)回歸、非線性回歸、logit模型、序次logit模型、多項(xiàng)logit模型或泊松回歸的基本信息和舉例說明;應(yīng)用新方法進(jìn)行結(jié)構(gòu)方程建模(structuralequationmodeling)或缺失值多重填補(bǔ)(multipleimputation);擬合存活時(shí)間和事件計(jì)數(shù)模型;根據(jù)因子分析或主成分結(jié)果構(gòu)建和使用合成變量(compositevariables);將觀測(cè)案例區(qū)分成不同的經(jīng)驗(yàn)類型或聚類;分析簡(jiǎn)單或多元時(shí)間序列;以及擬合多層或混合效應(yīng)模型。Stata近年來一直致力于提升其一流地位,這種努力尤其體現(xiàn)在它現(xiàn)在所提供的各種各樣的統(tǒng)計(jì)建模命令上。本書最后介紹Stata編程的內(nèi)容。許多讀者將會(huì)發(fā)現(xiàn)Stata可以做他們想做的任何事情,因此他們不需要編寫原始程序。但是,對(duì)于積極主動(dòng)的少數(shù)人而言,編程能力也是Stata的主要吸引力之一,并且它也肯定構(gòu)成了Stata廣泛傳播和快速發(fā)展的基礎(chǔ)。第14章為想探索Stata編程的初學(xué)者開啟了大門,不論是用于專業(yè)化的數(shù)據(jù)管理,還是建立一種新的統(tǒng)計(jì)方法以進(jìn)行蒙特卡羅實(shí)驗(yàn)或教學(xué)。通常,對(duì)于Windows、Macintosh和Unix等操作系統(tǒng)的計(jì)算機(jī)都有類似版本(“風(fēng)格”)的Stata可以安裝運(yùn)行。在所有操作系統(tǒng)上,Stata都使用相同的命令并形成相同的輸出結(jié)果。這些風(fēng)格只是在屏幕外觀、菜單和文件處理的一些細(xì)節(jié)上有些差異,這是因?yàn)镾tata會(huì)遵循每一操作系統(tǒng)自己的規(guī)則——比如,Windows系統(tǒng)下采用諸如“\目錄\文件名”的文件設(shè)定,而在Unix系統(tǒng)下則采用“目錄/文件名”的設(shè)定。本書并未示范所有三種規(guī)則,而只采用Windows規(guī)則,但是采用其他操作系統(tǒng)的用戶應(yīng)能發(fā)現(xiàn),其實(shí)只需要稍加改變即可。
關(guān)于第8版的說明筆者從1985年開始使用Stata,當(dāng)時(shí)還是它的首次發(fā)布年。起初,Stata只在MS-DOS系統(tǒng)的個(gè)人電腦上運(yùn)行,但其面向桌面的特點(diǎn)使得它明顯比其主要競(jìng)爭(zhēng)對(duì)手更現(xiàn)代,因?yàn)槟菚r(shí)大多數(shù)競(jìng)爭(zhēng)者還處于桌面革命之前,還基于主機(jī)環(huán)境、使用80列穿孔卡的Fortran語言。與認(rèn)為每個(gè)用戶都是一堆卡片的主機(jī)統(tǒng)計(jì)軟件不同,Stata將用戶視為人機(jī)對(duì)話。它的互動(dòng)本質(zhì)以及統(tǒng)計(jì)程序與數(shù)據(jù)管理和制圖的渾然一體支持了分析思維的自然流程,而這些方面則是其他程序所不具備的。graph(作圖命令)和predict(預(yù)測(cè)命令)很快成為倍受歡迎的命令。筆者深受其所有內(nèi)容渾然一體打動(dòng),并開始寫作《應(yīng)用STATA做統(tǒng)計(jì)分析》的最初版本,該書對(duì)應(yīng)著Stata第2版,并于1989年出版。Stata在2005年迎來了它的20周年紀(jì)念,為此該年的《Stata期刊》(StataJournal)開辟了一期特刊,登載有關(guān)它發(fā)展史的文章和訪談,以及受邀而寫就的《應(yīng)用STATA做統(tǒng)計(jì)分析》一書的簡(jiǎn)史。自該書第1版問世以來,Stata已經(jīng)發(fā)生了巨大變化。筆者在該書中就注意到,“Stata并不是一個(gè)萬能程序……但是只要是它做的事情,它就做得棒極了”。Stata功能的擴(kuò)展一直都引人注目。這一點(diǎn)在模型擬合程序的激增以及隨后不斷條理化方面顯而易見。WilliamGould為Stata建立的架構(gòu),包括其編程工具和統(tǒng)一的命令語法都已非常成熟,并已證明能夠容納新發(fā)展出來的統(tǒng)計(jì)思想。本書第3章廣泛的作圖命令、第8章開頭提供的大量建模命令或者后續(xù)各章所介紹的新的時(shí)間序列分析、調(diào)查數(shù)據(jù)分析、多重填補(bǔ)或混合建模能力,都說明多年來Stata在這些方面日益變得豐富。比如,適用于面板數(shù)據(jù)(xt)、調(diào)查數(shù)據(jù)(svy)、時(shí)間序列數(shù)據(jù)(ts)、存活時(shí)間數(shù)據(jù)(st)或數(shù)據(jù)多重填補(bǔ)(mi)等的套裝新技術(shù)開辟了更多可能領(lǐng)域,像一般化線性模型(glm)以及最大似然估計(jì)的一般程序中的可編程命令也同樣做到了這點(diǎn)。其他重要擴(kuò)展還包括矩陣編程能力的發(fā)展、大量新的數(shù)據(jù)管理特征以及諸如邊際效應(yīng)圖(marginalplots)或結(jié)構(gòu)方程建模等新的多用途分析工具。在最初版本的《應(yīng)用STATA做統(tǒng)計(jì)分析》中,數(shù)據(jù)管理只是一個(gè)附帶的話題;但它在本書的第8版中已經(jīng)合乎情理地成為最長(zhǎng)的一章。Stata全面的菜單和對(duì)話框系統(tǒng)提供了對(duì)大多數(shù)鍵入命令的點(diǎn)選式替代。不過,菜單和對(duì)話選擇系列通過探索比通過閱讀更易于學(xué)習(xí),因此《應(yīng)用STATA做統(tǒng)計(jì)分析》會(huì)在每章開頭只提供有關(guān)菜單的一般性建議。絕大部分情況下都用命令來展示Stata能做什么;找到那些命令的對(duì)應(yīng)菜單應(yīng)非難事。相反,若你主要憑借菜單開始工作,Stata會(huì)通過在結(jié)果窗口中呈現(xiàn)每一條相應(yīng)的命令提供非正式訓(xùn)練。菜單/對(duì)話框系統(tǒng)通過將點(diǎn)選操作翻譯成Stata命令,然后反饋給Stata并執(zhí)行。分析性制圖是Stata的一大強(qiáng)項(xiàng),這一點(diǎn)在每一章中都有體現(xiàn)。本書的許多例子都并非意在說明一種特定方法的單調(diào)圖像,而都做了一些改進(jìn)以滿足發(fā)表或演示要求。讀者或許會(huì)瀏覽這些圖形以了解制圖的潛力,這超出了Stata手冊(cè)的內(nèi)容。針對(duì)Stata12.0更新的《應(yīng)用STATA做統(tǒng)計(jì)分析》與之前針對(duì)Stata10.0更新的該書大為不同。很多章已被重新組織,包括出現(xiàn)在本書前面新的介紹調(diào)查數(shù)據(jù)分析的一章。10.0版的本書中分為4章的回歸分析內(nèi)容在這里已被更加邏輯性地整合和組織成篇幅更長(zhǎng)的線性回歸分析和高級(jí)回歸兩章!案呒(jí)回歸”一章包含新的有關(guān)缺失值多重填補(bǔ)和結(jié)構(gòu)方程建模(StructuralEquationModeling,SEM)的內(nèi)容。主成分、因子和聚類分析一章也納入兩節(jié)新內(nèi)容,介紹回歸中因子得分的使用和SEM中測(cè)量模型的使用。分層與混合效應(yīng)建模一章中新的一節(jié)呈現(xiàn)了一個(gè)重復(fù)測(cè)量數(shù)據(jù)分析的例子。有關(guān)編程的最后一章已被精簡(jiǎn)并圍繞一個(gè)主要示例(繪制多幅調(diào)查數(shù)據(jù)圖)來展開,可以證明這對(duì)于一些讀者而言更有益。本次針對(duì)Stata12.0所做修訂的一個(gè)目標(biāo)是更新許多例子,其中一些涉及本人自20世紀(jì)90年代以來的研究,但已經(jīng)過時(shí)。挑戰(zhàn)者號(hào)航天飛機(jī)一例曾出現(xiàn)在最初1989年版的封面上,仍在logistic回歸一章開頭很好地說明基本思路。但是,該章的結(jié)尾為對(duì)2011年調(diào)查時(shí)收集到的人們關(guān)于氣候變化的知識(shí)和觀點(diǎn)的應(yīng)答所做的加權(quán)多分類logit分析(weightedmultinomiallogitanalysis)。氣候調(diào)查是三個(gè)新的2010或2011調(diào)查數(shù)據(jù)集之一,這些數(shù)據(jù)集為若干章提供了重要的例子。其中一章(主成分和因子分析)以簡(jiǎn)單的行星數(shù)據(jù)開篇,但結(jié)尾則是使用2011年沿海環(huán)境調(diào)查數(shù)據(jù)所做的結(jié)合因子分析與回歸的分析,或者類似的測(cè)量和結(jié)構(gòu)方程模型。其他例子涉及物理學(xué)氣候指標(biāo)的時(shí)間序列。一個(gè)關(guān)于42個(gè)北極阿拉斯加村莊的獨(dú)特?cái)?shù)據(jù)集取自2011年的一篇論文,被用來示例說明混合效應(yīng)建模如何可以將自然科學(xué)數(shù)據(jù)與社會(huì)科學(xué)數(shù)據(jù)結(jié)合起來。時(shí)間序列一章最后部分的ARMAX模型受到2011年一篇考察全球變暖“真實(shí)跡象”(realsignal)的重要論文的啟發(fā)。只要可能,都致力于使用提出大眾感興趣研究問題的例子,而不僅僅是提供一堆數(shù)字來示例說明一個(gè)技術(shù)。許多示例數(shù)據(jù),包括書中所討論之外的其他變量,吸引著讀者自行去做進(jìn)一步分析。正如在第1章指出的,Stata的幫助和搜索功能也與程序同步,得以完善。除了可以通過幫助文件獲得的互動(dòng)說明文檔以外,可用資源還包括了Stata的網(wǎng)站、互聯(lián)網(wǎng)及其文獻(xiàn)搜索功能、用戶社區(qū)郵件列表、網(wǎng)絡(luò)課程、《Stata期刊》以及9000多頁的手冊(cè)文檔!稇(yīng)用STATA做統(tǒng)計(jì)分析》提供了Stata的便捷入門,而這些其他資源將幫助你走得更遠(yuǎn)。
致謝Stata的設(shè)計(jì)師WilliamGould值得稱贊,因?yàn)槭撬麆?chuàng)建了《應(yīng)用STATA做統(tǒng)計(jì)分析》所介紹的這個(gè)一流程序。Stata公司的很多其他人員多年來貢獻(xiàn)過他們的真知灼見。就此第8版而言,要特別感謝組織評(píng)閱工作的PatBranton和閱讀過絕大部分章節(jié)的KristinMacDonald。JamesHamilton為第12和13章的時(shí)間序列提出過重要建議。LeslieHamilton閱讀并幫著修改了最終手稿的諸多部分。本書圍繞著數(shù)據(jù)分析的內(nèi)容而寫成。該版中新的一節(jié)對(duì)數(shù)據(jù)來源做了說明,包括存在的網(wǎng)頁鏈接,或者所發(fā)表論文的索引。許多例子取自于公共資源,它們是其他研究者辛苦工作的成果。也借鑒了本人自己的研究,特別是一些新近的調(diào)查與整合自然和社會(huì)科學(xué)數(shù)據(jù)的研究。所有與本人一同開展這些項(xiàng)目的同事都值得稱贊,包括MilDuncan和TomSafford(CERA農(nóng)村調(diào)查),RichardLammers、DanWhite和GretaMyerchin(阿拉斯加社區(qū)調(diào)查),DavidMoore和CameronWake(氣候環(huán)境調(diào)查),BarryKeim和CliffBrown(滑雪運(yùn)動(dòng)與氣候環(huán)境研究),以及RasmusOleRasmussen和PerLysterPedersen(格陵蘭島人口狀況研究)。慷慨分享原始數(shù)據(jù)的其他人還有DaveHamilton、DaveMeeker、SteveSelvin、AndrewSmith和SallyWard。
獻(xiàn)給Leslie、Sarah和Dave。
Hamilton博士任教于美國New Hampshire大學(xué),主講統(tǒng)計(jì)學(xué),至今為止,他已經(jīng)撰寫了多部關(guān)于統(tǒng)計(jì)方面的學(xué)術(shù)著作,包括Modern Data Analysis、Regression with Graphics、Data Analysis for Social Scientists等,它們對(duì)于整個(gè)業(yè)內(nèi)更好地理解統(tǒng)計(jì)方法、開展統(tǒng)計(jì)分析具有重要參考價(jià)值。
第1章 Stata軟件與Stata的資源 1
1.1 本書體例的說明 1
1.2 一個(gè)Stata操作的例子 2
1.3 Stata的文件管理與幫助文件 6
1.4 搜尋信息 7
1.5 Stata公司 8
1.6 《Stata期刊》 9
1.7 應(yīng)用Stata的圖書 10
第2章 數(shù)據(jù)管理 13
2.1 命令示范 14
2.2 創(chuàng)建一個(gè)新的數(shù)據(jù)集 16
2.3 通過復(fù)制和粘貼創(chuàng)建新
數(shù)據(jù)集 21
2.4 定義數(shù)據(jù)的子集:in和if
選擇條件 22
2.5 創(chuàng)建和替代變量 25
2.6 缺失值編碼 28
2.7 使用函數(shù) 31
2.8 數(shù)值和字符串之間的格式
轉(zhuǎn)換 34
2.9 創(chuàng)建新的分類變量和定序
變量 37
2.10 標(biāo)注變量下標(biāo) 39
2.11 導(dǎo)入其他程序的數(shù)據(jù) 40
2.12 合并兩個(gè)或多個(gè)Stata文件 43
2.13 數(shù)據(jù)分類匯總 46
2.14 重組數(shù)據(jù)結(jié)構(gòu) 49
2.15 使用權(quán)數(shù) 52
2.16 生成隨機(jī)數(shù)據(jù)和隨機(jī)樣本 53
2.17 編制數(shù)據(jù)管理程序 57
第3章 制圖 59
3.1 命令示范 59
3.2 直方圖 62
3.3 箱線圖 65
3.4 散點(diǎn)圖和疊并 68
3.5 曲線標(biāo)繪圖和連線標(biāo)繪圖 73
3.6 其他類型的二維標(biāo)繪圖 77
3.7 條形圖和餅圖 79
3.8 對(duì)稱圖和分位數(shù)圖 82
3.9 給圖形添加文本 84
3.10 使用do文件制圖 86
3.11 讀取與合并圖形 87
3.12 圖形編輯器 88
3.13 創(chuàng)造性制圖 91
第4章 調(diào)查數(shù)據(jù) 99
4.1 命令示范 99
4.2 定義調(diào)查數(shù)據(jù) 100
4.3 設(shè)計(jì)權(quán)數(shù) 102
4.4 事后分層權(quán)數(shù) 104
4.5 調(diào)查加權(quán)的表格和圖形 107
4.6 多重比較的條形圖 110
第5章 概要統(tǒng)計(jì)及統(tǒng)計(jì)表 115
5.1 命令示范 115
5.2 測(cè)量變量的描述性統(tǒng)計(jì) 117
5.3 探索性數(shù)據(jù)分析 119
5.4 正態(tài)性檢驗(yàn)和數(shù)據(jù)轉(zhuǎn)換 121
5.5 頻數(shù)表和二維交互表 124
5.6 多表和多維交互表 127
5.7 均值、中位數(shù)以及其他概要
統(tǒng)計(jì)量的列表 129
5.8 使用頻數(shù)權(quán)數(shù) 131
第6章 方差分析和其他比較方法 133
6.1 示范 134
6.2 單樣本檢驗(yàn) 135
6.3 兩樣本檢驗(yàn) 138
6.4 單因素方差分析 140
6.5 雙因素和多因素方差分析 143
6.6 因素變量和協(xié)方差分析 144
6.7 預(yù)測(cè)值和誤差條形圖 147
第7章 線性回歸分析 151
7.1 命令示范 151
7.2 簡(jiǎn)單回歸 155
7.3 相關(guān) 158
7.4 多元回歸 161
7.5 假設(shè)檢驗(yàn) 165
7.6 虛擬變量 167
7.7 交互效應(yīng) 170
7.8 方差的穩(wěn)健估計(jì) 175
7.9 預(yù)測(cè)值及殘差 177
7.10 其他案例統(tǒng)計(jì)量 181
7.11 診斷多重共線性和異方差性 186
7.12 簡(jiǎn)單回歸中的置信帶 188
7.13 診斷回歸 191
第8章 高級(jí)回歸 197
8.1 命令示范 197
8.2 lowess修勻 199
8.3 穩(wěn)健回歸 204
8.4 對(duì)rreg和qreg的更多應(yīng)用 209
8.5 曲線回歸1 212
8.6 曲線回歸2 214
8.7 Box-Cox回歸 219
8.8 缺失值的多重填補(bǔ) 221
8.9 結(jié)構(gòu)方程建模 225
第9章 logistic回歸 231
9.1 命令示范 233
9.2 航天飛機(jī)數(shù)據(jù) 234
9.3 使用logistic回歸 238
9.4 邊際或條件效應(yīng)標(biāo)繪圖 241
9.5 診斷統(tǒng)計(jì)量與標(biāo)繪圖 243
9.6 對(duì)序次y的logistic回歸 247
9.7 多項(xiàng)logistic回歸 249
9.8 缺失值的多重填補(bǔ)—— logit
回歸的例子 256
第10章 生存模型與事件計(jì)數(shù)模型 259
10.1 命令示范 260
10.2 生存時(shí)間數(shù)據(jù) 262
10.3 計(jì)數(shù)時(shí)間數(shù)據(jù) 264
10.4 Kaplan-Meier存活函數(shù) 266
10.5 Cox比例風(fēng)險(xiǎn)模型 268
10.6 指數(shù)回歸與Weibull回歸 273
10.7 泊松回歸 277
10.8 一般化線性模型 280
第11章 主成分分析、因子分析
和聚類分析 285
11.1 命令示范 286
11.2 主成分分析和主成分
因子法 287
11.3 旋轉(zhuǎn) 289
11.4 因子分 292
11.5 主因子法 294
11.6 *大似然因子法 296
11.7 聚類分析-1 297
11.8 聚類分析-2 301
11.9 因子分在回歸中的使用 305
11.10 測(cè)量與結(jié)構(gòu)方程模型 312
第12章 時(shí)間序列分析 317
12.1 命令示范 317
12.2 修勻 319
12.3 時(shí)間標(biāo)繪圖的更多例子 325
12.4 *近的氣候變化 328
12.5 時(shí)滯、前導(dǎo)和差分 331
12.6 相關(guān)圖 336
12.7 ARIMA模型 339
12.8 ARMAX模型 346
第13章 多層與混合效應(yīng)建模 351
13.1 命令示范 352
13.2 含隨機(jī)截距的回歸 354
13.3 隨機(jī)截距和斜率 358
13.4 多個(gè)隨機(jī)斜率 363
13.5 多層嵌套 366
13.6 重復(fù)測(cè)量 368
13.7 截面時(shí)間序列 371
13.8 混合效應(yīng)logit回歸 376
第14章 編程入門 383
14.1 基本概念與工具 383
14.2 程序示范:multicat(畫出許多
定類變量的圖) 393
14.3 使用multicat 396
14.4 幫助文件 400
14.5 蒙特卡羅模擬 403
14.6 用Mata進(jìn)行矩陣編程 410
數(shù)據(jù)來源 415
參考文獻(xiàn) 419
你還可能感興趣
我要評(píng)論
|