UniProt是(shi)Universal Protein的(de)(de)英文縮寫,是(shi)信(xin)息最(zui)豐富、資源最(zui)廣的(de)(de)蛋(dan)(dan)白(bai)質(zhi)(zhi)數(shu)據(ju)庫。它由(you)整合Swiss-Prot、TrEMBL和 PIR-PSD三(san)大數(shu)據(ju)庫的(de)(de)數(shu)據(ju)而(er)成。他的(de)(de)數(shu)據(ju)主要來(lai)自于(yu)基(ji)因(yin)組測(ce)序(xu)(xu)項目完成后,后續獲得的(de)(de)蛋(dan)(dan)白(bai)質(zhi)(zhi)序(xu)(xu)列(lie)。它包含了大量來(lai)自文獻(xian)的(de)(de)蛋(dan)(dan)白(bai)質(zhi)(zhi)的(de)(de)生(sheng)物功能(neng)的(de)(de)信(xin)息。
UniProtKB全(quan)稱(cheng)UniProt Knowledgebase(UniProt知(zhi)識庫)它是(shi)經(jing)過專家校驗(yan)的數據(ju)集,主要由兩部分組成:UniProtKB/Swiss-Prot(包(bao)(bao)含(han)檢查過的、手(shou)工注(zhu)釋(shi)的條(tiao)目)和(he)UniProtKB/TrEMBL(包(bao)(bao)含(han)未校驗(yan)的、自動注(zhu)釋(shi)的條(tiao)目),在2010年8月(yue)是(shi)10日發布(bu)的版本中,UniProtKB/Swiss-Prot包(bao)(bao)含(han)519,348條(tiao)注(zhu)釋(shi)條(tiao)目,UniProtKB/TrEMBL包(bao)(bao)含(han)11,636,205條(tiao)注(zhu)釋(shi)條(tiao)目。
UniProtKB/Swiss-Prot
高質量(liang)的、手工注釋的、非冗(rong)余的數(shu)據(ju)集;主要來自文獻(xian)中的研究成果和E-value校(xiao)驗過計算分析結果。有質量(liang)保證的數(shu)據(ju)才被加(jia)入該數(shu)據(ju)庫。
UniProtKB/TrEMBL
該數據(ju)集包含高(gao)質量的計(ji)算(suan)分析(xi)結果,一般都(dou)在(zai)(zai)自動(dong)注釋中(zhong)富(fu)集,主要應(ying)對基因組項目獲得的大量數據(ju)流以人工校驗在(zai)(zai)時間上(shang)和(he)人力上(shang)的不足(zu)。他(ta)能注釋所有(you)可用的蛋(dan)白(bai)序列(lie)。在(zai)(zai)三大核酸數據(ju)庫(ku)(EMBL-Bank/GenBank/DDBJ)中(zhong)注釋的編碼序列(lie)都(dou)被自動(dong)翻(fan)譯并加入該數據(ju)庫(ku)中(zhong)。它也有(you)來自PDB數據(ju)庫(ku)的序列(lie),以及Ensembl、Refeq和(he)CCDS基因預測的序列(lie)。
UniParc
UniParc全稱是(shi)UniProt Archive,他是(shi)一個(ge)綜合(he)性的(de)(de)非冗余數(shu)據庫(ku)(ku),他包含了所有主要的(de)(de)、公開的(de)(de)數(shu)據庫(ku)(ku)的(de)(de)蛋白(bai)質(zhi)序列(lie)(lie)(lie)。 由(you)于蛋白(bai)質(zhi)可(ke)能在(zai)不同(tong)的(de)(de)數(shu)據庫(ku)(ku)中存在(zai),并且可(ke)能在(zai)同(tong)一個(ge)數(shu)據庫(ku)(ku)中有多個(ge)版本(ben),為(wei)了去冗余,UniaraParc對每條唯一的(de)(de)序列(lie)(lie)(lie)只存一次。無論是(shi)否(fou)為(wei)同(tong)一物(wu)種的(de)(de)序列(lie)(lie)(lie),只要序列(lie)(lie)(lie)相同(tong)就被(bei)合(he)并為(wei)一條,每條序列(lie)(lie)(lie)提(ti)供穩定(ding)的(de)(de)、唯一的(de)(de)編(bian)號UPI。該數(shu)據庫(ku)(ku)只含有蛋白(bai)質(zhi)的(de)(de)序列(lie)(lie)(lie)信息,而沒有注釋(shi)數(shu)據。