UniProt是Universal Protein的(de)英文縮寫(xie),是信(xin)息(xi)最豐富、資(zi)源最廣的(de)蛋白質數據(ju)(ju)(ju)庫。它由整合Swiss-Prot、TrEMBL和 PIR-PSD三大(da)數據(ju)(ju)(ju)庫的(de)數據(ju)(ju)(ju)而成。他的(de)數據(ju)(ju)(ju)主要來(lai)自于基因組測序項目完成后,后續獲得的(de)蛋白質序列(lie)。它包含了大(da)量(liang)來(lai)自文獻的(de)蛋白質的(de)生(sheng)物功(gong)能的(de)信(xin)息(xi)。
UniProtKB全稱UniProt Knowledgebase(UniProt知識庫)它是經過(guo)專家校驗的(de)(de)(de)數(shu)據集,主要由(you)兩部分組成:UniProtKB/Swiss-Prot(包含(han)檢查(cha)過(guo)的(de)(de)(de)、手(shou)工(gong)注(zhu)(zhu)釋(shi)的(de)(de)(de)條(tiao)目)和UniProtKB/TrEMBL(包含(han)未校驗的(de)(de)(de)、自動(dong)注(zhu)(zhu)釋(shi)的(de)(de)(de)條(tiao)目),在(zai)2010年(nian)8月是10日(ri)發布(bu)的(de)(de)(de)版本中,UniProtKB/Swiss-Prot包含(han)519,348條(tiao)注(zhu)(zhu)釋(shi)條(tiao)目,UniProtKB/TrEMBL包含(han)11,636,205條(tiao)注(zhu)(zhu)釋(shi)條(tiao)目。
UniProtKB/Swiss-Prot
高質量(liang)(liang)的(de)(de)(de)、手工注釋的(de)(de)(de)、非(fei)冗(rong)余的(de)(de)(de)數據(ju)集;主要來自文獻中的(de)(de)(de)研究成果(guo)和E-value校驗過計算分析(xi)結(jie)果(guo)。有質量(liang)(liang)保證的(de)(de)(de)數據(ju)才被加入該數據(ju)庫(ku)。
UniProtKB/TrEMBL
該數據(ju)集包含(han)高質量(liang)的計(ji)算分析結果,一般都在(zai)(zai)自(zi)動注釋中富集,主要應對基因組項目(mu)獲得的大量(liang)數據(ju)流(liu)以(yi)人工校驗在(zai)(zai)時間(jian)上和人力上的不足。他能注釋所有可用的蛋白序(xu)列。在(zai)(zai)三(san)大核酸數據(ju)庫(EMBL-Bank/GenBank/DDBJ)中注釋的編(bian)碼序(xu)列都被(bei)自(zi)動翻(fan)譯并加入(ru)該數據(ju)庫中。它也有來自(zi)PDB數據(ju)庫的序(xu)列,以(yi)及Ensembl、Refeq和CCDS基因預測的序(xu)列。
UniParc
UniParc全稱(cheng)是(shi)UniProt Archive,他(ta)是(shi)一(yi)個(ge)綜合性的(de)(de)非冗(rong)余(yu)數(shu)(shu)(shu)據(ju)(ju)庫,他(ta)包含了所有主要(yao)的(de)(de)、公開的(de)(de)數(shu)(shu)(shu)據(ju)(ju)庫的(de)(de)蛋白(bai)質(zhi)(zhi)序(xu)(xu)列(lie)。 由于蛋白(bai)質(zhi)(zhi)可能在不同的(de)(de)數(shu)(shu)(shu)據(ju)(ju)庫中存(cun)在,并且可能在同一(yi)個(ge)數(shu)(shu)(shu)據(ju)(ju)庫中有多(duo)個(ge)版本,為(wei)了去冗(rong)余(yu),UniaraParc對每條唯一(yi)的(de)(de)序(xu)(xu)列(lie)只存(cun)一(yi)次(ci)。無論是(shi)否為(wei)同一(yi)物種的(de)(de)序(xu)(xu)列(lie),只要(yao)序(xu)(xu)列(lie)相同就被合并為(wei)一(yi)條,每條序(xu)(xu)列(lie)提供穩定(ding)的(de)(de)、唯一(yi)的(de)(de)編號UPI。該(gai)數(shu)(shu)(shu)據(ju)(ju)庫只含有蛋白(bai)質(zhi)(zhi)的(de)(de)序(xu)(xu)列(lie)信(xin)息,而沒有注釋數(shu)(shu)(shu)據(ju)(ju)。