UniProt是Universal Protein的(de)(de)英文(wen)(wen)縮(suo)寫(xie),是信息(xi)最豐富、資源最廣的(de)(de)蛋(dan)(dan)(dan)白(bai)質數據庫。它(ta)由整合Swiss-Prot、TrEMBL和(he) PIR-PSD三大(da)數據庫的(de)(de)數據而成。他(ta)的(de)(de)數據主要來(lai)(lai)自于(yu)基因組測序項目完成后(hou),后(hou)續獲得的(de)(de)蛋(dan)(dan)(dan)白(bai)質序列。它(ta)包含了(le)大(da)量來(lai)(lai)自文(wen)(wen)獻的(de)(de)蛋(dan)(dan)(dan)白(bai)質的(de)(de)生物功能的(de)(de)信息(xi)。
UniProtKB全稱UniProt Knowledgebase(UniProt知識庫)它是經過專家校(xiao)驗(yan)的(de)數據集,主要由(you)兩部分組成:UniProtKB/Swiss-Prot(包(bao)含檢(jian)查過的(de)、手(shou)工(gong)注(zhu)(zhu)釋(shi)(shi)的(de)條目(mu))和(he)UniProtKB/TrEMBL(包(bao)含未校(xiao)驗(yan)的(de)、自(zi)動注(zhu)(zhu)釋(shi)(shi)的(de)條目(mu)),在2010年8月是10日(ri)發(fa)布的(de)版本中(zhong),UniProtKB/Swiss-Prot包(bao)含519,348條注(zhu)(zhu)釋(shi)(shi)條目(mu),UniProtKB/TrEMBL包(bao)含11,636,205條注(zhu)(zhu)釋(shi)(shi)條目(mu)。
UniProtKB/Swiss-Prot
高質(zhi)量(liang)的(de)、手工注釋(shi)的(de)、非冗余的(de)數(shu)據(ju)(ju)集(ji);主要來(lai)自文(wen)獻中的(de)研(yan)究成果(guo)和E-value校驗過計(ji)算分(fen)析(xi)結(jie)果(guo)。有質(zhi)量(liang)保(bao)證(zheng)的(de)數(shu)據(ju)(ju)才(cai)被加(jia)入該數(shu)據(ju)(ju)庫(ku)。
UniProtKB/TrEMBL
該數(shu)據(ju)集包含高質量(liang)的(de)計算分析結果(guo),一(yi)般都在(zai)自動(dong)(dong)注(zhu)釋中(zhong)(zhong)富集,主要應對基因組項目(mu)獲得(de)的(de)大(da)(da)量(liang)數(shu)據(ju)流以人(ren)工(gong)校驗在(zai)時間上和(he)人(ren)力上的(de)不足(zu)。他(ta)能注(zhu)釋所有可用的(de)蛋白序(xu)列(lie)。在(zai)三大(da)(da)核(he)酸(suan)數(shu)據(ju)庫(ku)(EMBL-Bank/GenBank/DDBJ)中(zhong)(zhong)注(zhu)釋的(de)編(bian)碼序(xu)列(lie)都被自動(dong)(dong)翻譯并加(jia)入(ru)該數(shu)據(ju)庫(ku)中(zhong)(zhong)。它也有來自PDB數(shu)據(ju)庫(ku)的(de)序(xu)列(lie),以及(ji)Ensembl、Refeq和(he)CCDS基因預測的(de)序(xu)列(lie)。
UniParc
UniParc全(quan)稱是(shi)UniProt Archive,他(ta)是(shi)一(yi)(yi)個(ge)綜合(he)性的(de)非冗余數(shu)(shu)據(ju)庫(ku)(ku),他(ta)包含了所有主要的(de)、公開的(de)數(shu)(shu)據(ju)庫(ku)(ku)的(de)蛋白質(zhi)序(xu)列(lie)(lie)。 由(you)于蛋白質(zhi)可能(neng)在不(bu)同(tong)(tong)的(de)數(shu)(shu)據(ju)庫(ku)(ku)中存(cun)在,并(bing)且可能(neng)在同(tong)(tong)一(yi)(yi)個(ge)數(shu)(shu)據(ju)庫(ku)(ku)中有多個(ge)版本,為(wei)了去冗余,UniaraParc對(dui)每(mei)條(tiao)唯一(yi)(yi)的(de)序(xu)列(lie)(lie)只存(cun)一(yi)(yi)次。無論是(shi)否(fou)為(wei)同(tong)(tong)一(yi)(yi)物種的(de)序(xu)列(lie)(lie),只要序(xu)列(lie)(lie)相(xiang)同(tong)(tong)就被合(he)并(bing)為(wei)一(yi)(yi)條(tiao),每(mei)條(tiao)序(xu)列(lie)(lie)提供穩定的(de)、唯一(yi)(yi)的(de)編號UPI。該數(shu)(shu)據(ju)庫(ku)(ku)只含有蛋白質(zhi)的(de)序(xu)列(lie)(lie)信(xin)息,而沒有注釋數(shu)(shu)據(ju)。