Stata 是一(yi)套提供其使用者數據分(fen)析、數據管理以(yi)及繪(hui)制專(zhuan)業圖表的(de)完(wan)整(zheng)(zheng)及整(zheng)(zheng)合性統(tong)計軟件。它(ta)擁有很多(duo)功能,包含線性混合模(mo)型、均(jun)衡重復反復及多(duo)項式普羅比模(mo)式。用Stata繪(hui)制的(de)統(tong)計圖形相當精美。
新版本的(de)STATA采用(yong)(yong)最具親和力的(de)窗口(kou)接口(kou),使用(yong)(yong)者自(zi)行建立程序時,軟件能提供具有(you)直(zhi)接命令式(shi)的(de)語法。Stata提供完整的(de)使用(yong)(yong)手冊(ce),包含統(tong)計樣(yang)本建立、解釋、模型與(yu)語法、文獻等超過一萬余頁(ye)的(de)出版品。
除(chu)此(ci)之外,Stata軟件可(ke)(ke)以透(tou)過網絡實時(shi)更新每天的(de)最(zui)新功能,更可(ke)(ke)以得知世界(jie)各(ge)地的(de)使(shi)用者對于(yu)STATA公司提出的(de)問(wen)題與(yu)解決之道(dao)。使(shi)用者也可(ke)(ke)以透(tou)過Stata Journal獲得許許多(duo)多(duo)的(de)相關訊息以及(ji)書籍介紹等(deng)。另(ling)外一個(ge)(ge)獲取龐大資源的(de)管道(dao)就是(shi)Statalist,它(ta)是(shi)一個(ge)(ge)獨立的(de)listserver,每月交替(ti)提供使(shi)用者超過1000個(ge)(ge)訊息以及(ji)50個(ge)(ge)程序。
Stata官方(fang)網站。Stata公司提(ti)(ti)供(gong)的(de)Web resources,涵蓋(gai)了(le)大量相關網絡資源;其FAQ則(ze)提(ti)(ti)供(gong)了(le)各種常見問(wen)題的(de)解答;Statalist則(ze)是(shi)一個類似于人大經濟論(lun)(lun)壇的(de)免(mian)費的(de)討(tao)論(lun)(lun)區。加(jia)入(ru)Statalist的(de)方(fang)法很簡單,你(ni)只(zhi)需要發送郵(you)(you)件至Stata-maillist,郵(you)(you)件內容無需任何稱謂,只(zhi)需寫上“subscribe Statalist”的(de)字樣即可。接(jie)到確認信(xin)息(xi)后,你(ni)便成(cheng)為一名Statalist的(de)成(cheng)員了(le)。當(dang)然(ran),即使(shi)不(bu)加(jia)入(ru),你(ni)仍然(ran)可以瀏(liu)覽,但不(bu)能提(ti)(ti)問(wen)。
UCLA(加州大學洛(luo)杉磯分校提(ti)供的(de)(de)網(wang)絡教程。該網(wang)站提(ti)供的(de)(de)Data Management、Graphics、Regression、Logistic Regression、Multilevel Modeling、Survey Data Analysis等模塊都非(fei)常出色;其Web Books、Textbook Examples模塊則非(fei)常細致地(di)呈現了幾十本非(fei)常流行(xing)的(de)(de)統計和計量(liang)教材(cai)的(de)(de)Stata實例;對于LaTeX感興(xing)趣的(de)(de)朋(peng)友,則可以通過Stata Tools for LaTeX模塊獲得諸(zhu)多有(you)用的(de)(de)信息;在(zai)(zai)Graph examples模塊中(zhong),則列舉了四十余(yu)種(zhong)圖(tu)形的(de)(de)繪制方法;最后,在(zai)(zai)Classes and Seminars模塊中(zhong),你可以在(zai)(zai)線觀看數十個Stata教學視頻。
Stata中(zhong)文討(tao)論(lun)專(zhuan)區(qu)。目前,國(guo)(guo)內(nei)(nei)已有(you)多個專(zhuan)門討(tao)論(lun)Stata應(ying)用的(de)論(lun)壇,包括人(ren)大經(jing)濟論(lun)壇Stata專(zhuan)區(qu),公衛人(ren)EpiMan等(deng)。這些論(lun)壇集中(zhong)了國(guo)(guo)內(nei)(nei)外(wai)數(shu)十萬的(de)Stata用戶,為交流和(he)解(jie)決Stata應(ying)用過(guo)程中(zhong)遇到(dao)的(de)各種問(wen)題(ti)和(he)經(jing)驗提供了很好的(de)平臺。
自從Hamilton(1990)出版Statistics with Stata后,一系列將計(ji)量理論與軟(ruan)(ruan)件操作(zuo)結(jie)合起來(lai)的(de)(de)(de)書籍(ji)開始(shi)相繼(ji)面(mian)世,而在(zai)此(ci)之前,人們似乎都認為軟(ruan)(ruan)件操作(zuo)是件非常(chang)簡單的(de)(de)(de)事情。也正(zheng)因為如此(ci),很多(duo)學生在(zai)修(xiu)改(gai)完了一個學年的(de)(de)(de)計(ji)量經濟學課程后,仍(reng)然不知道(dao)該如何完成OLS估計(ji)。為此(ci),我列舉的(de)(de)(de)書籍(ji)多(duo)附有Stata實(shi)例(* 表示我的(de)(de)(de)推薦程度),多(duo)數(shu)書中(zhong)的(de)(de)(de)范(fan)例數(shu)據都可通(tong)過Stata官(guan)方(fang)網(wang)站下載。
一份詳細的(de)書(shu)單:UCLA提供了的(de)書(shu)單 。
入門教材:Baum(2006)*、Newton and Cox(2009)、Chen et al.(2005)、Adkins and Hill(2008)*;Wooldridge(2009)*,波(bo)士(shi)頓大(da)學(xue)(xue)的(de)網站(zhan)上提(ti)供了該(gai)書(shu)所有章節的(de)Stata范(fan)例,是一(yi)套(tao)非常(chang)好(hao)的(de)學(xue)(xue)習資料。
綜合(he)性(xing)教材:Cameron and Trivedi(2005)撰寫的(de)Microeconometrics: Methods and applications一書全面(mian)介紹了微觀計(ji)(ji)量中的(de)基本分析(xi)工具,其(qi)中不乏最近十(shi)年(nian)中得(de)到(dao)廣泛應(ying)用的(de)Bootstrap、Monte Carlo模擬,以及非參數估計(ji)(ji)法(fa)。二人于2009年(nian)出版的(de)另(ling)一力作(Cameron and Trivedi(2009)*)是這本書的(de)姊妹篇,重點介紹了常用計(ji)(ji)量模型的(de)Stata實(shi)現方法(fa)。
Stata手(shou)冊(ce)(ce)(ce):我一(yi)直非常佩服(fu)撰寫Stata手(shou)冊(ce)(ce)(ce)的(de)那些人,他們總能(neng)以最(zui)簡(jian)潔的(de)語言說清楚(chu)糾結我很久的(de)問題(ti)。Stata11附有(you)16本電子手(shou)冊(ce)(ce)(ce),僅(jin)需(xu)統(tong)一(yi)放置于(yu)(yu)D:stata11utilities目錄下(xia),即(ji)可從Stata內部(bu)的(de)幫(bang)助(zhu)文件(jian)中的(de)Also see部(bu)分(fen)直接(jie)鏈接(jie)到相(xiang)應的(de)PDF說明書(shu)中。作(zuo)為初(chu)學者,我強烈建議你將[U]和[D]打(da)印出來(lai)(lai),反(fan)復研讀。stata手(shou)冊(ce)(ce)(ce)內容齊(qi)全,但(dan)不便于(yu)(yu)閱讀,把(ba)命令與例題(ti)割裂開來(lai)(lai),閱讀起來(lai)(lai)很不方(fang)便。
stata軟件(jian)在社會科學(xue)研究中的(de)高級應(ying)用(yong):周文光,李堯遠,梁煒 著,西北工(gong)業大學(xue)出(chu)(chu)版(ban)社出(chu)(chu)版(ban)。該書詳細介紹了如何(he)應(ying)用(yong)stata對連續變量(liang)與(yu)分類變量(liang)進行分析,包括回歸(gui)分析,時間序列(lie)分析,面板數據(ju)分析等(deng),并介紹了如何(he)使(shi)用(yong)stata進行生存(cun)分析與(yu)聚類分析、編程等(deng)內容。
Stata視頻。相比于(yu)網絡教程和(he)紙本(ben)教材,通過(guo)視頻學(xue)習Stata可能(neng)是最快捷(jie)的(de)(de)(de)方式(shi)了。UCLA免(mian)費發(fa)布(bu)的(de)(de)(de)視頻教程,內容(rong)涉及(ji)(ji)(ji)Stata入(ru)門、數(shu)據(ju)處(chu)(chu)理(li)和(he)繪圖(tu)等。采(cai)用英文(wen)講解(jie),思路清(qing)晰(xi)。局限在于(yu)所涉及(ji)(ji)(ji)內容(rong)不夠系(xi)統,但對于(yu)想快速入(ru)門的(de)(de)(de)學(xue)生則是一(yi)份不錯的(de)(de)(de)參考資料(liao)。同時(shi),藉由這份資料(liao)也可以(yi)練習一(yi)下(xia)英語聽(ting)力。對于(yu)中文(wen)用戶而言,人大論壇(tan)發(fa)布(bu)的(de)(de)(de)Stata初(chu)(chu)(chu)級(ji)和(he)高級(ji)視頻則提供了更為快捷(jie)的(de)(de)(de)學(xue)習方式(shi)。其(qi)中,初(chu)(chu)(chu)級(ji)視頻主要介紹(shao)stata的(de)(de)(de)操作(zuo)方法(fa),包括(kuo)stata入(ru)門、stata數(shu)據(ju)處(chu)(chu)理(li)、stata繪圖(tu)、stata矩(ju)陣以(yi)及(ji)(ji)(ji)stata編(bian)程初(chu)(chu)(chu)步(bu)五個(ge)部分。高級(ji)視頻主要介紹(shao)各種計(ji)量模(mo)(mo)型(xing)的(de)(de)(de)基(ji)本(ben)原理(li),重點介紹(shao)其(qi)在stata中的(de)(de)(de)實現方法(fa),包括(kuo)OLS、GLS、MLE、IV-GMM、時(shi)間序列分析、面(mian)板模(mo)(mo)型(xing)、stata高級(ji)編(bian)程、Bootstrap和(he)Monte Carlo模(mo)(mo)擬等內容(rong),比較全面(mian)的(de)(de)(de)涵(han)蓋了計(ji)量經濟學(xue)和(he)核心內容(rong)。
統(tong)計方法(fa):Rabe-Hesketh and Everitt(2006)。
Stata繪圖:Mitchell(2008),非常(chang)細致地介(jie)紹了各(ge)種圖形的繪制方法。
Stata數據處理(li):Kohler and Kreuter(2005)*、Long(2009)*、楊菊(ju)華(2008)。
Stata編(bian)程(cheng):Baum(2009),當(dang)然,該書中(zhong)有關數(shu)據處理的(de)介紹也非常(chang)精彩。
Logit/Probit模型(xing):Hosmer and Lemeshow(2000)*對相關的(de)理論進(jin)行非常細致的(de)介(jie)紹,是我學(xue)習Logit模型(xing)的(de)入門教材;Long and Freese(2001)*、Long and Freese(2006)、Hilbe(2009)則涉及了大量的(de)Stata實(shi)例,對解讀Logit/Probit模型(xing)的(de)結果很有幫助;Rabe-Hesketh et al.(2004)提供了在GLLAMM架(jia)構下估計xtlogit, xtprobit, xtmelogit以及xtmepoisson模型(xing)的(de)方法。
Panel Data和多(duo)層次(ci)模型:Stata11 手冊[XT]*,簡潔明了,附有大量實(shi)例;Cameron and Trivedi(2009)*、王志剛(2008)、Rabe-Hesketh and Skrondal(2008)。
Mata:Schmidheiny(2008)*,簡(jian)潔明(ming)了介紹了Mata的(de)基本用法;詳情則可(ke)參與Stata11手(shou)冊[M]。
GLLAMM:Rabe-Hesketh et al.(2004)。
Meta:Sterne(2009)。
GLM:Hardin et al.(2007)。
MLE:Harrison(2008)(Lectures)、Gould et al.(2006)。
生存分析:Cleves et al.(2008)。
Stata是(shi)一個(ge)統計(ji)分析軟(ruan)件,但它也(ye)具有很強的(de)程序語言(yan)功能,這給用(yong)戶提供了(le)一個(ge)廣(guang)闊(kuo)的(de)開(kai)發(fa)應用(yong)的(de)天地,用(yong)戶可以充分發(fa)揮自己(ji)的(de)聰(cong)明才智,熟練應用(yong)各(ge)種技巧(qiao),真正(zheng)做到隨心所欲。事實(shi)上,Stata的(de)ado文件(高級統計(ji)部分)都(dou)是(shi)用(yong)Stata自己(ji)的(de)語言(yan)編寫的(de)。
Stata其統(tong)計(ji)分(fen)(fen)析(xi)能(neng)力遠遠超過(guo)了(le)(le)SPSS,在(zai)許多方面也超過(guo)了(le)(le)SAS!由(you)于Stata在(zai)分(fen)(fen)析(xi)時是(shi)將(jiang)數(shu)(shu)(shu)(shu)據全部讀入(ru)內存,在(zai)計(ji)算全部完成后(hou)才(cai)和磁(ci)盤交換數(shu)(shu)(shu)(shu)據,因此計(ji)算速(su)度(du)(du)極快(kuai)(一般來說(shuo), SAS的(de)運算速(su)度(du)(du)要(yao)比SPSS至少快(kuai)一個數(shu)(shu)(shu)(shu)量(liang)級(ji),而Stata的(de)某(mou)些模(mo)塊(kuai)和執(zhi)行同樣功能(neng)的(de)SAS模(mo)塊(kuai)比,其速(su)度(du)(du)又比SAS快(kuai)將(jiang)近一個數(shu)(shu)(shu)(shu)量(liang)級(ji)!)Stata也是(shi)采(cai)用命(ming)令行方式來操作,但使用上遠比SAS簡單。其生存數(shu)(shu)(shu)(shu)據分(fen)(fen)析(xi)、縱向數(shu)(shu)(shu)(shu)據(重(zhong)復(fu)測量(liang)數(shu)(shu)(shu)(shu)據)分(fen)(fen)析(xi)等模(mo)塊(kuai)的(de)功能(neng)甚至超過(guo)了(le)(le)SAS。用Stata繪制的(de)統(tong)計(ji)圖形相(xiang)當(dang)精美,很有特(te)色。
Stata的(de)統(tong)計功能很強,除(chu)了傳統(tong)的(de)統(tong)計分析(xi)方(fang)法外,還收集了近20年發(fa)展起來的(de)新方(fang)法,如Cox比例風(feng)險回歸(gui)(gui)(gui),指數與(yu)Weibull回歸(gui)(gui)(gui),多類結果與(yu)有序(xu)結果的(de)logistic回歸(gui)(gui)(gui),Poisson回歸(gui)(gui)(gui),負二項(xiang)回歸(gui)(gui)(gui)及廣義(yi)負二項(xiang)回歸(gui)(gui)(gui),隨機效應模型(xing)等。具體說, Stata具有如下統(tong)計分析(xi)能力:
數(shu)(shu)(shu)值變(bian)量資料的(de)一(yi)般分析:參數(shu)(shu)(shu)估計,t檢驗(yan),單因素(su)(su)和多因素(su)(su)的(de)方差(cha)分析,協方差(cha)分析,交互(hu)效應(ying)模型,平衡和非平衡設計,嵌套設計,隨機效應(ying),多個均數(shu)(shu)(shu)的(de)兩兩比較,缺項(xiang)數(shu)(shu)(shu)據(ju)的(de)處(chu)理(li),方差(cha)齊性(xing)檢驗(yan),正態性(xing)檢驗(yan),變(bian)量變(bian)換等(deng)。
分(fen)(fen)類資料的一般(ban)分(fen)(fen)析(xi):參數估計,列聯表(biao)分(fen)(fen)析(xi) ( 列聯系(xi)數,確切概(gai)率 ) ,流行病學表(biao)格分(fen)(fen)析(xi)等(deng)。
等(deng)級資(zi)料的一般分析:秩(zhi)(zhi)變換,秩(zhi)(zhi)和檢驗,秩(zhi)(zhi)相關等(deng)
相(xiang)(xiang)關與回(hui)(hui)(hui)(hui)歸(gui)(gui)(gui)分析(xi):簡單相(xiang)(xiang)關,偏相(xiang)(xiang)關,典型相(xiang)(xiang)關,以及多達(da)數(shu)十(shi)種的回(hui)(hui)(hui)(hui)歸(gui)(gui)(gui)分析(xi)方法(fa),如多元(yuan)線性回(hui)(hui)(hui)(hui)歸(gui)(gui)(gui),逐步回(hui)(hui)(hui)(hui)歸(gui)(gui)(gui),加權回(hui)(hui)(hui)(hui)歸(gui)(gui)(gui),穩鍵回(hui)(hui)(hui)(hui)歸(gui)(gui)(gui),二(er)階段回(hui)(hui)(hui)(hui)歸(gui)(gui)(gui),百分位(wei)數(shu) ( 中(zhong)位(wei)數(shu) ) 回(hui)(hui)(hui)(hui)歸(gui)(gui)(gui),殘差分析(xi)、強(qiang)影響點分析(xi),曲線擬(ni)合,隨機效應的線性回(hui)(hui)(hui)(hui)歸(gui)(gui)(gui)模(mo)型等。
其他方(fang)法:質量控(kong)制(zhi),整(zheng)群抽樣的設計(ji)效率,診(zhen)斷試驗評價(jia), kappa等(deng)。
Stata的(de)作(zuo)圖(tu)模塊,主要提供(gong)如(ru)下(xia)八種基(ji)本圖(tu)形(xing)的(de)制(zhi)作(zuo) : 直方(fang)圖(tu)(histogram),條(tiao)形(xing)圖(tu)(bar),百分(fen)條(tiao)圖(tu) (oneway),百分(fen)圓圖(tu)(pie),散點(dian)圖(tu)(two way),散點(dian)圖(tu)矩(ju)陣(zhen)(matrix),星(xing)形(xing)圖(tu)(star),分(fen)位數圖(tu)。這(zhe)些(xie)圖(tu)形(xing)的(de)巧妙應用,可以滿(man)足絕(jue)大多數用戶的(de)統計作(zuo)圖(tu)要求。在有(you)些(xie)非繪圖(tu)命令中,也(ye)提供(gong)了(le)(le)專門繪制(zhi)某種圖(tu)形(xing)的(de)功能,如(ru)在生存分(fen)析中,提供(gong)了(le)(le)繪制(zhi)生存曲線圖(tu),回歸分(fen)析中提供(gong)了(le)(le)殘差(cha)圖(tu)等。
矩(ju)(ju)陣(zhen)(zhen)代數是多元統計(ji)分(fen)析的(de)(de)(de)重要工具(ju), Stata提供了(le)多元統計(ji)分(fen)析中所需的(de)(de)(de)矩(ju)(ju)陣(zhen)(zhen)基本運(yun)算,如(ru)矩(ju)(ju)陣(zhen)(zhen)的(de)(de)(de)加(jia)、積(ji)、逆、 Cholesky分(fen)解(jie)、 Kronecker內積(ji)等;還提供了(le)一些高級運(yun)算,如(ru)特(te)征(zheng)根(gen)、特(te)征(zheng)向量(liang)、奇異值分(fen)解(jie)等;在(zai)執行完某些統計(ji)分(fen)析命令后,還提供了(le)一些系統矩(ju)(ju)陣(zhen)(zhen),如(ru)估計(ji)系數向量(liang)、估計(ji)系數的(de)(de)(de)協(xie)方(fang)差矩(ju)(ju)陣(zhen)(zhen)等。
數據管(guan)理(Data management)
資料轉換、分組處理、附加(jia)檔案、 ODBC 、行 - 列轉換、數(shu)據(ju)標(biao)記、字符串函數(shu)…等
基(ji)本(ben)統計(ji)(Basic statistics)
直交表、相關性、 t- 檢(jian)定(ding)、變(bian)異數相等性檢(jian)定(ding)、比例檢(jian)定(ding)、信賴區間…等
線性(xing)模式(Linear models)
穩健Huber/White/sandwich變異估計 , 三階最小平(ping)方法、類非相關(guan)回(hui)歸、齊(qi)次多項式回(hui)歸、GLS
廣義型(xing)線性(xing)模式(Generalized linear models)
十連結(jie)函數、使用(yong)者(zhe)-定義(yi)連結(jie)、 ML及IRLS估計(ji)、九變(bian)異數估計(ji)、七殘(can)差…等
二元(yuan)、計數及有(you)限應變量(Binary, count and limited dependent variables)
羅(luo)吉斯(si)特、probit、卜松回(hui)歸、tobit、truncated回(hui)歸、條件(jian)羅(luo)吉斯(si)特、多項式(shi)邏輯、巢狀(zhuang)邏輯、負(fu)二項、 zero-inflated模型、Heckman 選擇模式(shi)、邊際影(ying)響
Panel數據/交(jiao)叉 - 組合(he)時(shi)間序列(Panel data/cross-sectional time-series)
隨機及(ji)(ji)固定影響(xiang)之回歸、GEE、隨機及(ji)(ji)固定-影響(xiang)之卜松及(ji)(ji)負二項(xiang)分配(pei)、隨機 - 影響(xiang)、工具變量(liang)回歸、AR(1) 干(gan)擾回歸
無母數方法(Nonparametric methods)
多變量方法(Multivariate methods)
因素分(fen)析、多變(bian)量回歸、 anonical 相關(guan)系(xi)數
模型檢(jian)定(ding)及(ji)事后估計(ji)量支持分析(Model testing and post-estimation support)
Wald檢定、LR檢定、線性及非線性組合、非線性限制(zhi)檢定、邊際(ji)影(ying)響、修正平均數Hausman檢定
群(qun)集(ji)分(fen)析(Cluster analysis)
加權平均、質量中(zhong)心及(ji)中(zhong)位數聯結、kmeans、kmedians、dendrograms、停止規則(ze)、使用者擴(kuo)充
圖(tu)形(Graphics)
直線圖(tu)(tu)、散(san)布圖(tu)(tu)、條狀圖(tu)(tu)、圓餅圖(tu)(tu)、 hi-lo 圖(tu)(tu)、回(hui)歸(gui)診斷圖(tu)(tu)…
調(diao)查方法(fa)(Survey methods)
抽(chou)樣(yang)權重、叢(cong)集抽(chou)樣(yang)、分層、線性(xing)變異數估計量(liang)、擬 - 概似最大估計量(liang)、回歸、工具(ju)變量(liang)…
生存分(fen)析(Survival analysis)
Kaplan–Meier、Nelson–Aalen、Cox回歸(弱性(xing))、參(can)數(shu)模式(弱性(xing))、危險比例測試、時(shi)間共(gong)變項、左-右(you)檢查(cha)、韋柏分(fen)配(pei)、指數(shu)分(fen)配(pei)…
流行(xing)病學工具(Tools for epidemiologists)
比例標準化(hua)、病(bing)例控(kong)制、已配適(shi)病(bing)例控(kong)制、Mantel – Haenszel,藥理學、ROC分析、ICD-9-CM
時(shi)間序列(Time series)
ARIMA、ARCH/GARCH、VAR、Newey–West、correlograms、periodograms、白色 - 噪音測試、最(zui)小(xiao)整數(shu)根(gen)檢定、時間序列運(yun)算、平滑化
最大概似法(Maximum likelihood)
轉換(huan)及(ji)常態檢定(Transforms and normality tests)
Box–Cox、次方轉換Shapiro–Wilk、Shapiro–Francia檢(jian)定
其它(ta)統計方法(Other statistical methods)
樣本數(shu)量及次(ci)方(fang)、非線性回歸、逐步式(shi)回歸 、統計(ji)及數(shu)學函數(shu)
包(bao)含樣本范例(Sample session)
再抽樣及(ji)模(mo)擬方法(Resampling and simulation methods)
bootstrapping、jackknife、蒙地卡(ka)羅(luo)模擬、排列檢定
網絡功能
安裝新(xin)指令、網絡升級、網站檔案(an)分享、Stata 最(zui)新(xin)消息
epiman論壇學(xue)習資(zi)源豐富,學(xue)術氛(fen)圍良好(hao),在(zai)國內(nei)新(xin)生代公共衛生學(xue)術界有一定影響(xiang)力。是(shi)探討Stata、spss、sas、epidata等統計(ji)軟件的(de)主流(liu)論壇之一。