Stata 是一套提供其使(shi)用者數據分析、數據管(guan)理以及繪(hui)(hui)制(zhi)專業圖表的完整及整合性統(tong)計(ji)軟件(jian)。它(ta)擁有很多(duo)(duo)功(gong)能,包(bao)含線性混合模(mo)型(xing)、均衡重復反(fan)復及多(duo)(duo)項式普羅比模(mo)式。用Stata繪(hui)(hui)制(zhi)的統(tong)計(ji)圖形相當精美。
新版本的(de)(de)STATA采用最具親(qin)和(he)力的(de)(de)窗口(kou)接口(kou),使(shi)用者自行(xing)建立(li)程序(xu)時(shi),軟(ruan)件能提供具有直(zhi)接命令式的(de)(de)語法(fa)。Stata提供完整的(de)(de)使(shi)用手冊,包含統計樣本建立(li)、解釋、模型與語法(fa)、文(wen)獻等(deng)超過一萬余(yu)頁(ye)的(de)(de)出版品。
除此(ci)之外,Stata軟(ruan)件(jian)可以(yi)透過網絡實時更(geng)新每(mei)天的(de)(de)最(zui)新功(gong)能,更(geng)可以(yi)得(de)知世界各(ge)地(di)的(de)(de)使用(yong)(yong)者對(dui)于STATA公司提(ti)出(chu)的(de)(de)問題與(yu)解(jie)決之道。使用(yong)(yong)者也可以(yi)透過Stata Journal獲得(de)許(xu)許(xu)多(duo)多(duo)的(de)(de)相關訊(xun)息(xi)(xi)以(yi)及書籍介紹(shao)等。另外一個(ge)(ge)獲取龐大資源的(de)(de)管(guan)道就是Statalist,它是一個(ge)(ge)獨立(li)的(de)(de)listserver,每(mei)月交替提(ti)供使用(yong)(yong)者超過1000個(ge)(ge)訊(xun)息(xi)(xi)以(yi)及50個(ge)(ge)程序。
Stata官方網站(zhan)。Stata公司提供(gong)的(de)Web resources,涵蓋了大量相關網絡資源;其(qi)FAQ則提供(gong)了各種常見問(wen)題的(de)解答;Statalist則是一個類似于人大經濟論(lun)壇的(de)免(mian)費的(de)討論(lun)區(qu)。加入Statalist的(de)方法很簡單,你只(zhi)需要(yao)發送郵件至Stata-maillist,郵件內(nei)容無需任何稱謂(wei),只(zhi)需寫上“subscribe Statalist”的(de)字(zi)樣即(ji)可。接到確認信息后,你便成(cheng)為一名Statalist的(de)成(cheng)員了。當(dang)然,即(ji)使不加入,你仍然可以瀏(liu)覽(lan),但(dan)不能提問(wen)。
UCLA(加州大(da)學洛杉(shan)磯(ji)分校(xiao)提(ti)供(gong)的(de)網(wang)(wang)絡教程。該網(wang)(wang)站提(ti)供(gong)的(de)Data Management、Graphics、Regression、Logistic Regression、Multilevel Modeling、Survey Data Analysis等模塊(kuai)都非(fei)常(chang)出色;其Web Books、Textbook Examples模塊(kuai)則非(fei)常(chang)細致(zhi)地呈現了(le)幾十本(ben)非(fei)常(chang)流行的(de)統計(ji)和計(ji)量(liang)教材的(de)Stata實例;對于LaTeX感興趣的(de)朋友,則可(ke)以通過Stata Tools for LaTeX模塊(kuai)獲得諸(zhu)多(duo)有用的(de)信(xin)息;在Graph examples模塊(kuai)中,則列舉了(le)四十余種(zhong)圖形的(de)繪(hui)制方(fang)法;最后,在Classes and Seminars模塊(kuai)中,你可(ke)以在線觀看數十個Stata教學視頻(pin)。
Stata中文討論專(zhuan)區。目前(qian),國內已(yi)有多個專(zhuan)門討論Stata應(ying)用(yong)的(de)論壇,包括人大經濟論壇Stata專(zhuan)區,公(gong)衛人EpiMan等。這些論壇集中了(le)國內外數十(shi)萬的(de)Stata用(yong)戶,為(wei)交流和解決(jue)Stata應(ying)用(yong)過(guo)程中遇到的(de)各種問題和經驗提供了(le)很好的(de)平臺(tai)。
自從Hamilton(1990)出版(ban)Statistics with Stata后(hou),一系列(lie)將計量理(li)論與軟(ruan)件(jian)操作(zuo)結合(he)起來的(de)(de)書(shu)籍開(kai)始相繼面(mian)世,而在(zai)此(ci)之前(qian),人(ren)們似乎(hu)都認為(wei)(wei)軟(ruan)件(jian)操作(zuo)是件(jian)非常(chang)簡單的(de)(de)事情(qing)。也正因為(wei)(wei)如此(ci),很多(duo)學(xue)生在(zai)修改完了一個學(xue)年(nian)的(de)(de)計量經(jing)濟(ji)學(xue)課程后(hou),仍(reng)然不知道該(gai)如何完成OLS估計。為(wei)(wei)此(ci),我(wo)列(lie)舉的(de)(de)書(shu)籍多(duo)附有Stata實(shi)例(li)(* 表(biao)示我(wo)的(de)(de)推(tui)薦程度),多(duo)數(shu)書(shu)中的(de)(de)范(fan)例(li)數(shu)據(ju)都可通(tong)過(guo)Stata官方網站下載(zai)。
一份詳細的(de)書(shu)單(dan):UCLA提供了的(de)書(shu)單(dan) 。
入門教材:Baum(2006)*、Newton and Cox(2009)、Chen et al.(2005)、Adkins and Hill(2008)*;Wooldridge(2009)*,波士頓大學(xue)(xue)的(de)(de)(de)網站(zhan)上提(ti)供了該書所有章(zhang)節(jie)的(de)(de)(de)Stata范例,是一(yi)套非常好的(de)(de)(de)學(xue)(xue)習資(zi)料。
綜合性教材(cai):Cameron and Trivedi(2005)撰寫的(de)(de)(de)Microeconometrics: Methods and applications一書(shu)全面介紹了(le)微觀計量中的(de)(de)(de)基本分析(xi)工具,其中不乏最近十年(nian)(nian)中得到廣泛應用(yong)(yong)的(de)(de)(de)Bootstrap、Monte Carlo模(mo)擬(ni),以及非(fei)參數估計法。二人于2009年(nian)(nian)出版的(de)(de)(de)另(ling)一力作(Cameron and Trivedi(2009)*)是這本書(shu)的(de)(de)(de)姊妹篇,重點介紹了(le)常用(yong)(yong)計量模(mo)型的(de)(de)(de)Stata實現(xian)方法。
Stata手(shou)冊:我(wo)一(yi)(yi)直非常(chang)佩服撰寫Stata手(shou)冊的那些人,他們總能以最簡潔的語言說(shuo)清楚(chu)糾結我(wo)很(hen)久的問題。Stata11附有16本電(dian)子手(shou)冊,僅需統一(yi)(yi)放置于D:stata11utilities目錄下,即可從Stata內部的幫助文件(jian)中(zhong)的Also see部分直接鏈接到相應的PDF說(shuo)明書(shu)中(zhong)。作為初(chu)學者,我(wo)強烈建議你將[U]和[D]打印(yin)出來,反(fan)復研(yan)讀。stata手(shou)冊內容(rong)齊全,但不便(bian)于閱讀,把命令與例題割裂開來,閱讀起來很(hen)不方便(bian)。
stata軟件在(zai)社會(hui)科學(xue)研究中的(de)高(gao)級應用:周文光,李堯(yao)遠,梁煒 著,西北工(gong)業大學(xue)出版(ban)社出版(ban)。該書詳細介紹了(le)如(ru)何應用stata對連續(xu)變(bian)量(liang)與分(fen)類變(bian)量(liang)進行(xing)分(fen)析(xi),包括回歸分(fen)析(xi),時間序列分(fen)析(xi),面板數據分(fen)析(xi)等,并(bing)介紹了(le)如(ru)何使用stata進行(xing)生存分(fen)析(xi)與聚類分(fen)析(xi)、編程等內容。
Stata視頻。相比于網絡(luo)教(jiao)程(cheng)(cheng)和(he)紙本教(jiao)材,通過視頻學(xue)習(xi)Stata可能是(shi)最(zui)快捷的(de)(de)方式(shi)了(le)。UCLA免費(fei)發(fa)布(bu)的(de)(de)視頻教(jiao)程(cheng)(cheng),內容(rong)涉(she)及Stata入(ru)門、數據(ju)處理和(he)繪圖等。采用英(ying)文講解,思路清晰。局(ju)限(xian)在于所涉(she)及內容(rong)不(bu)夠系(xi)統,但對(dui)于想(xiang)快速入(ru)門的(de)(de)學(xue)生(sheng)則是(shi)一(yi)份不(bu)錯的(de)(de)參(can)考資料。同時,藉(jie)由這份資料也可以練習(xi)一(yi)下英(ying)語(yu)聽力。對(dui)于中文用戶而言,人大論壇發(fa)布(bu)的(de)(de)Stata初(chu)(chu)級(ji)和(he)高(gao)級(ji)視頻則提供了(le)更為快捷的(de)(de)學(xue)習(xi)方式(shi)。其中,初(chu)(chu)級(ji)視頻主(zhu)要(yao)介紹stata的(de)(de)操作方法(fa),包括stata入(ru)門、stata數據(ju)處理、stata繪圖、stata矩(ju)陣以及stata編程(cheng)(cheng)初(chu)(chu)步(bu)五個(ge)部分。高(gao)級(ji)視頻主(zhu)要(yao)介紹各(ge)種計(ji)量模型(xing)的(de)(de)基(ji)本原理,重點(dian)介紹其在stata中的(de)(de)實現方法(fa),包括OLS、GLS、MLE、IV-GMM、時間序列分析、面板模型(xing)、stata高(gao)級(ji)編程(cheng)(cheng)、Bootstrap和(he)Monte Carlo模擬等內容(rong),比較全(quan)面的(de)(de)涵蓋了(le)計(ji)量經濟學(xue)和(he)核心(xin)內容(rong)。
統計方(fang)法:Rabe-Hesketh and Everitt(2006)。
Stata繪(hui)圖(tu):Mitchell(2008),非(fei)常(chang)細致地介(jie)紹(shao)了各種圖(tu)形(xing)的繪(hui)制方法。
Stata數(shu)據處理:Kohler and Kreuter(2005)*、Long(2009)*、楊菊華(2008)。
Stata編程:Baum(2009),當然,該書中有關數據處理的介紹也非常精彩。
Logit/Probit模型(xing)(xing):Hosmer and Lemeshow(2000)*對(dui)相關的(de)(de)理論進行非(fei)常細(xi)致的(de)(de)介紹,是我學(xue)習Logit模型(xing)(xing)的(de)(de)入門教材;Long and Freese(2001)*、Long and Freese(2006)、Hilbe(2009)則(ze)涉及(ji)了(le)大量(liang)的(de)(de)Stata實(shi)例(li),對(dui)解讀Logit/Probit模型(xing)(xing)的(de)(de)結果很有幫助;Rabe-Hesketh et al.(2004)提供了(le)在GLLAMM架構下(xia)估(gu)計(ji)xtlogit, xtprobit, xtmelogit以及(ji)xtmepoisson模型(xing)(xing)的(de)(de)方法(fa)。
Panel Data和(he)多層(ceng)次模(mo)型(xing):Stata11 手冊(ce)[XT]*,簡潔明了,附有大量實例;Cameron and Trivedi(2009)*、王志剛(2008)、Rabe-Hesketh and Skrondal(2008)。
Mata:Schmidheiny(2008)*,簡潔(jie)明了(le)介(jie)紹(shao)了(le)Mata的(de)基(ji)本用法;詳情則可參與Stata11手冊[M]。
GLLAMM:Rabe-Hesketh et al.(2004)。
Meta:Sterne(2009)。
GLM:Hardin et al.(2007)。
MLE:Harrison(2008)(Lectures)、Gould et al.(2006)。
生存分(fen)析:Cleves et al.(2008)。
Stata是一個(ge)統計分析(xi)軟件(jian),但它也具有很強(qiang)的(de)程序語(yu)言(yan)功能(neng),這給用(yong)戶(hu)提(ti)供了(le)一個(ge)廣闊的(de)開發(fa)應(ying)用(yong)的(de)天地,用(yong)戶(hu)可以充(chong)分發(fa)揮自己的(de)聰明才智,熟練應(ying)用(yong)各(ge)種技巧(qiao),真正做到隨心所欲。事實上,Stata的(de)ado文件(jian)(高級統計部分)都是用(yong)Stata自己的(de)語(yu)言(yan)編寫的(de)。
Stata其(qi)統計(ji)分(fen)析能(neng)力遠(yuan)遠(yuan)超過了SPSS,在許(xu)多(duo)方(fang)面也(ye)超過了SAS!由于Stata在分(fen)析時(shi)是將數(shu)據(ju)全(quan)部讀(du)入內(nei)存,在計(ji)算(suan)全(quan)部完成(cheng)后(hou)才(cai)和(he)磁盤交(jiao)換(huan)數(shu)據(ju),因此(ci)計(ji)算(suan)速度(du)極快(kuai)(一般來(lai)說, SAS的運算(suan)速度(du)要比SPSS至少快(kuai)一個(ge)數(shu)量(liang)級,而Stata的某(mou)些(xie)模塊(kuai)和(he)執(zhi)行同樣功能(neng)的SAS模塊(kuai)比,其(qi)速度(du)又(you)比SAS快(kuai)將近一個(ge)數(shu)量(liang)級!)Stata也(ye)是采用(yong)命令行方(fang)式來(lai)操作,但使用(yong)上遠(yuan)比SAS簡(jian)單。其(qi)生(sheng)存數(shu)據(ju)分(fen)析、縱向數(shu)據(ju)(重復測(ce)量(liang)數(shu)據(ju))分(fen)析等(deng)模塊(kuai)的功能(neng)甚至超過了SAS。用(yong)Stata繪制的統計(ji)圖形相(xiang)當精美,很有(you)特色。
Stata的(de)統計功能(neng)很強,除(chu)了傳統的(de)統計分析方法外(wai),還(huan)收集了近20年發(fa)展起來的(de)新(xin)方法,如(ru)Cox比例風險回歸(gui),指數與Weibull回歸(gui),多類結果(guo)與有序結果(guo)的(de)logistic回歸(gui),Poisson回歸(gui),負(fu)二(er)項回歸(gui)及廣義負(fu)二(er)項回歸(gui),隨機效應(ying)模型等(deng)。具體說, Stata具有如(ru)下統計分析能(neng)力:
數值變量資料的一(yi)般分析:參數估(gu)計(ji),t檢驗(yan),單因素(su)和(he)(he)多因素(su)的方差(cha)分析,協方差(cha)分析,交互(hu)效(xiao)應模型,平(ping)衡和(he)(he)非平(ping)衡設(she)計(ji),嵌(qian)套(tao)設(she)計(ji),隨機效(xiao)應,多個均數的兩兩比較,缺(que)項(xiang)數據的處理,方差(cha)齊性檢驗(yan),正態性檢驗(yan),變量變換等。
分(fen)類資料的一般分(fen)析:參數(shu)(shu)估(gu)計,列聯表(biao)分(fen)析 ( 列聯系數(shu)(shu),確(que)切概率 ) ,流(liu)行病(bing)學(xue)表(biao)格分(fen)析等。
等級(ji)資料的一(yi)般分析:秩(zhi)變換(huan),秩(zhi)和(he)檢(jian)驗,秩(zhi)相關等
相(xiang)(xiang)關(guan)與(yu)回(hui)(hui)歸(gui)(gui)分(fen)析:簡單相(xiang)(xiang)關(guan),偏相(xiang)(xiang)關(guan),典型相(xiang)(xiang)關(guan),以及多達(da)數十種的回(hui)(hui)歸(gui)(gui)分(fen)析方法,如多元線性回(hui)(hui)歸(gui)(gui),逐(zhu)步回(hui)(hui)歸(gui)(gui),加(jia)權(quan)回(hui)(hui)歸(gui)(gui),穩鍵回(hui)(hui)歸(gui)(gui),二階段回(hui)(hui)歸(gui)(gui),百(bai)分(fen)位(wei)數 ( 中位(wei)數 ) 回(hui)(hui)歸(gui)(gui),殘差分(fen)析、強(qiang)影響(xiang)點分(fen)析,曲線擬合,隨機效應的線性回(hui)(hui)歸(gui)(gui)模型等。
其(qi)他方法:質量控制,整群(qun)抽樣的設(she)計效率,診(zhen)斷試驗評價, kappa等。
Stata的作(zuo)圖(tu)(tu)模塊(kuai),主要(yao)提(ti)供如(ru)下八種基(ji)本圖(tu)(tu)形的制作(zuo) : 直方圖(tu)(tu)(histogram),條形圖(tu)(tu)(bar),百分(fen)條圖(tu)(tu) (oneway),百分(fen)圓圖(tu)(tu)(pie),散點圖(tu)(tu)(two way),散點圖(tu)(tu)矩陣(matrix),星形圖(tu)(tu)(star),分(fen)位數圖(tu)(tu)。這些(xie)圖(tu)(tu)形的巧妙應用(yong)(yong),可(ke)以滿(man)足絕大多(duo)數用(yong)(yong)戶(hu)的統(tong)計作(zuo)圖(tu)(tu)要(yao)求。在有(you)些(xie)非繪(hui)圖(tu)(tu)命令中(zhong),也提(ti)供了(le)(le)專門(men)繪(hui)制某種圖(tu)(tu)形的功能,如(ru)在生(sheng)存分(fen)析中(zhong),提(ti)供了(le)(le)繪(hui)制生(sheng)存曲(qu)線圖(tu)(tu),回歸分(fen)析中(zhong)提(ti)供了(le)(le)殘差圖(tu)(tu)等。
矩(ju)(ju)陣(zhen)代數(shu)(shu)是多(duo)元統(tong)(tong)計(ji)(ji)分析的(de)重(zhong)要(yao)工具(ju), Stata提供(gong)(gong)了多(duo)元統(tong)(tong)計(ji)(ji)分析中所需的(de)矩(ju)(ju)陣(zhen)基(ji)本(ben)運(yun)算,如(ru)矩(ju)(ju)陣(zhen)的(de)加(jia)、積、逆、 Cholesky分解(jie)、 Kronecker內(nei)積等(deng);還提供(gong)(gong)了一些高級運(yun)算,如(ru)特征根、特征向量、奇異值分解(jie)等(deng);在執行完某些統(tong)(tong)計(ji)(ji)分析命令后,還提供(gong)(gong)了一些系統(tong)(tong)矩(ju)(ju)陣(zhen),如(ru)估(gu)計(ji)(ji)系數(shu)(shu)向量、估(gu)計(ji)(ji)系數(shu)(shu)的(de)協(xie)方差矩(ju)(ju)陣(zhen)等(deng)。
數據管理(li)(Data management)
資(zi)料轉換、分組處(chu)理、附加(jia)檔案、 ODBC 、行 - 列轉換、數據標記、字符串函數…等
基本統(tong)計(ji)(Basic statistics)
直交表、相(xiang)關性(xing)、 t- 檢(jian)定、變(bian)異數相(xiang)等(deng)性(xing)檢(jian)定、比例檢(jian)定、信賴區(qu)間(jian)…等(deng)
線(xian)性(xing)模式(Linear models)
穩健(jian)Huber/White/sandwich變異估計 , 三階最小(xiao)平(ping)方法、類非相關回(hui)歸、齊次多項式回(hui)歸、GLS
廣義型線性(xing)模式(Generalized linear models)
十連(lian)結函(han)數(shu)、使用者-定義連(lian)結、 ML及IRLS估計(ji)、九變異數(shu)估計(ji)、七殘差…等(deng)
二元、計數及(ji)有(you)限應變(bian)量(Binary, count and limited dependent variables)
羅(luo)吉斯特(te)、probit、卜松回歸(gui)、tobit、truncated回歸(gui)、條件羅(luo)吉斯特(te)、多項(xiang)式邏(luo)(luo)輯、巢狀邏(luo)(luo)輯、負二(er)項(xiang)、 zero-inflated模(mo)型、Heckman 選(xuan)擇模(mo)式、邊際影響
Panel數據/交叉 - 組(zu)合(he)時間序列(Panel data/cross-sectional time-series)
隨機(ji)(ji)及固定(ding)影(ying)響(xiang)之回歸(gui)、GEE、隨機(ji)(ji)及固定(ding)-影(ying)響(xiang)之卜松及負(fu)二項分配、隨機(ji)(ji) - 影(ying)響(xiang)、工具變量回歸(gui)、AR(1) 干擾(rao)回歸(gui)
無母數方法(fa)(Nonparametric methods)
多變量方法(fa)(Multivariate methods)
因素分析、多(duo)變(bian)量回(hui)歸、 anonical 相關系數
模型檢定及事(shi)后(hou)估(gu)計(ji)量支持分(fen)析(Model testing and post-estimation support)
Wald檢定、LR檢定、線(xian)(xian)(xian)性(xing)及非(fei)(fei)線(xian)(xian)(xian)性(xing)組合、非(fei)(fei)線(xian)(xian)(xian)性(xing)限制(zhi)檢定、邊際影響、修正平(ping)均數Hausman檢定
群集分析(Cluster analysis)
加權平均、質量中(zhong)心及(ji)中(zhong)位數聯(lian)結(jie)、kmeans、kmedians、dendrograms、停(ting)止規則、使用者擴充
圖形(Graphics)
直(zhi)線圖、散布圖、條狀圖、圓(yuan)餅圖、 hi-lo 圖、回歸(gui)診斷圖…
調查(cha)方法(fa)(Survey methods)
抽(chou)樣權重、叢(cong)集抽(chou)樣、分層、線性(xing)變(bian)異(yi)數估計量(liang)、擬 - 概似最(zui)大估計量(liang)、回歸、工具變(bian)量(liang)…
生存(cun)分(fen)析(xi)(Survival analysis)
Kaplan–Meier、Nelson–Aalen、Cox回歸(弱性(xing))、參(can)數(shu)模式(弱性(xing))、危險比(bi)例測試、時(shi)間(jian)共變項(xiang)、左-右檢(jian)查、韋柏分(fen)配(pei)、指(zhi)數(shu)分(fen)配(pei)…
流行(xing)病學工具(Tools for epidemiologists)
比(bi)例標準化(hua)、病例控制、已配(pei)適病例控制、Mantel – Haenszel,藥(yao)理學、ROC分析、ICD-9-CM
時間序列(Time series)
ARIMA、ARCH/GARCH、VAR、Newey–West、correlograms、periodograms、白色 - 噪音測試、最小(xiao)整數根檢定、時間序(xu)列(lie)運算、平滑化
最大概似(si)法(fa)(Maximum likelihood)
轉換及(ji)常態檢定(ding)(Transforms and normality tests)
Box–Cox、次(ci)方轉換Shapiro–Wilk、Shapiro–Francia檢定
其它(ta)統(tong)計(ji)方法(Other statistical methods)
樣本數(shu)量(liang)及次方、非線性回歸、逐步式回歸 、統計(ji)及數(shu)學函數(shu)
包(bao)含樣本范例(Sample session)
再抽樣及模擬方法(Resampling and simulation methods)
bootstrapping、jackknife、蒙地卡羅模擬(ni)、排列檢定(ding)
網絡功能
安裝新(xin)指令、網(wang)絡(luo)升級、網(wang)站(zhan)檔案分享、Stata 最新(xin)消(xiao)息
epiman論壇學習資源豐富,學術氛圍良好(hao),在國內(nei)新生代公共衛(wei)生學術界有一定影響(xiang)力。是(shi)探討Stata、spss、sas、epidata等(deng)統計軟件(jian)的主流論壇之一。