UniProt是Universal Protein的(de)英文縮(suo)寫(xie),是信息(xi)(xi)最豐(feng)富、資源(yuan)最廣的(de)蛋(dan)白質(zhi)數據(ju)庫(ku)。它(ta)由整合Swiss-Prot、TrEMBL和 PIR-PSD三大數據(ju)庫(ku)的(de)數據(ju)而成。他(ta)的(de)數據(ju)主要來自(zi)于基(ji)因組(zu)測序(xu)項(xiang)目(mu)完(wan)成后,后續(xu)獲得(de)的(de)蛋(dan)白質(zhi)序(xu)列。它(ta)包含了大量來自(zi)文獻(xian)的(de)蛋(dan)白質(zhi)的(de)生(sheng)物功能的(de)信息(xi)(xi)。
UniProtKB全稱UniProt Knowledgebase(UniProt知識庫)它是(shi)經過專家校驗的(de)數據集,主要由兩部分組成:UniProtKB/Swiss-Prot(包(bao)含(han)檢查過的(de)、手工注(zhu)(zhu)釋的(de)條(tiao)(tiao)目(mu)(mu))和UniProtKB/TrEMBL(包(bao)含(han)未校驗的(de)、自動注(zhu)(zhu)釋的(de)條(tiao)(tiao)目(mu)(mu)),在2010年8月是(shi)10日發布的(de)版本中,UniProtKB/Swiss-Prot包(bao)含(han)519,348條(tiao)(tiao)注(zhu)(zhu)釋條(tiao)(tiao)目(mu)(mu),UniProtKB/TrEMBL包(bao)含(han)11,636,205條(tiao)(tiao)注(zhu)(zhu)釋條(tiao)(tiao)目(mu)(mu)。
UniProtKB/Swiss-Prot
高質量的(de)、手工(gong)注(zhu)釋的(de)、非冗余(yu)的(de)數(shu)據(ju)集(ji);主要來(lai)自文獻中(zhong)的(de)研究成(cheng)果(guo)和E-value校驗(yan)過計算分析(xi)結(jie)果(guo)。有質量保證的(de)數(shu)據(ju)才被加入(ru)該數(shu)據(ju)庫。
UniProtKB/TrEMBL
該數據集包(bao)含高質量(liang)的(de)(de)計算分析結果(guo),一般都在自(zi)(zi)動注釋(shi)中富集,主要(yao)應對基因(yin)組(zu)項(xiang)目獲得的(de)(de)大量(liang)數據流以(yi)人工校驗在時(shi)間上和人力上的(de)(de)不(bu)足。他能注釋(shi)所有可(ke)用的(de)(de)蛋白序(xu)列。在三大核酸數據庫(EMBL-Bank/GenBank/DDBJ)中注釋(shi)的(de)(de)編(bian)碼序(xu)列都被自(zi)(zi)動翻(fan)譯并加入該數據庫中。它也(ye)有來(lai)自(zi)(zi)PDB數據庫的(de)(de)序(xu)列,以(yi)及Ensembl、Refeq和CCDS基因(yin)預測的(de)(de)序(xu)列。
UniParc
UniParc全稱是UniProt Archive,他是一個綜合性(xing)的(de)非冗余數(shu)據(ju)庫(ku)(ku),他包(bao)含(han)了(le)所有主(zhu)要的(de)、公開的(de)數(shu)據(ju)庫(ku)(ku)的(de)蛋(dan)(dan)白質(zhi)序(xu)(xu)列。 由(you)于(yu)蛋(dan)(dan)白質(zhi)可能在(zai)(zai)不同的(de)數(shu)據(ju)庫(ku)(ku)中存(cun)在(zai)(zai),并(bing)且可能在(zai)(zai)同一個數(shu)據(ju)庫(ku)(ku)中有多個版(ban)本(ben),為(wei)了(le)去冗余,UniaraParc對每條唯(wei)一的(de)序(xu)(xu)列只(zhi)存(cun)一次。無論(lun)是否(fou)為(wei)同一物種的(de)序(xu)(xu)列,只(zhi)要序(xu)(xu)列相同就被合并(bing)為(wei)一條,每條序(xu)(xu)列提供穩定(ding)的(de)、唯(wei)一的(de)編(bian)號UPI。該數(shu)據(ju)庫(ku)(ku)只(zhi)含(han)有蛋(dan)(dan)白質(zhi)的(de)序(xu)(xu)列信(xin)息,而沒(mei)有注釋數(shu)據(ju)。