UniProt是(shi)Universal Protein的(de)英(ying)文(wen)縮寫,是(shi)信(xin)息最豐富、資源最廣的(de)蛋白質(zhi)數(shu)據(ju)庫。它由(you)整合Swiss-Prot、TrEMBL和 PIR-PSD三大數(shu)據(ju)庫的(de)數(shu)據(ju)而成。他的(de)數(shu)據(ju)主要(yao)來自于基因組測序項目(mu)完成后(hou)(hou),后(hou)(hou)續(xu)獲得的(de)蛋白質(zhi)序列。它包含了大量來自文(wen)獻(xian)的(de)蛋白質(zhi)的(de)生(sheng)物(wu)功能的(de)信(xin)息。
UniProtKB全稱UniProt Knowledgebase(UniProt知識庫)它是(shi)經過(guo)專(zhuan)家(jia)校驗的(de)(de)數據集,主(zhu)要由兩部分組成:UniProtKB/Swiss-Prot(包含檢(jian)查過(guo)的(de)(de)、手(shou)工注釋的(de)(de)條(tiao)(tiao)(tiao)目)和(he)UniProtKB/TrEMBL(包含未校驗的(de)(de)、自動注釋的(de)(de)條(tiao)(tiao)(tiao)目),在2010年8月是(shi)10日發布的(de)(de)版(ban)本中,UniProtKB/Swiss-Prot包含519,348條(tiao)(tiao)(tiao)注釋條(tiao)(tiao)(tiao)目,UniProtKB/TrEMBL包含11,636,205條(tiao)(tiao)(tiao)注釋條(tiao)(tiao)(tiao)目。
UniProtKB/Swiss-Prot
高質(zhi)量(liang)的(de)、手工(gong)注釋的(de)、非冗(rong)余的(de)數據(ju)(ju)(ju)集(ji);主要來自文獻中(zhong)的(de)研究成果和E-value校驗(yan)過計(ji)算(suan)分析結果。有(you)質(zhi)量(liang)保證的(de)數據(ju)(ju)(ju)才被(bei)加入該(gai)數據(ju)(ju)(ju)庫。
UniProtKB/TrEMBL
該(gai)數(shu)(shu)據集(ji)包含高質量(liang)的(de)計算分析結果(guo),一般(ban)都在(zai)自動(dong)注釋中富集(ji),主要應對基(ji)因組項目獲得的(de)大量(liang)數(shu)(shu)據流(liu)以(yi)人(ren)工校(xiao)驗在(zai)時間(jian)上和人(ren)力上的(de)不足(zu)。他能注釋所有可用的(de)蛋白序列(lie)。在(zai)三大核酸數(shu)(shu)據庫(ku)(EMBL-Bank/GenBank/DDBJ)中注釋的(de)編碼序列(lie)都被自動(dong)翻譯(yi)并加入該(gai)數(shu)(shu)據庫(ku)中。它也有來自PDB數(shu)(shu)據庫(ku)的(de)序列(lie),以(yi)及Ensembl、Refeq和CCDS基(ji)因預測的(de)序列(lie)。
UniParc
UniParc全稱是(shi)UniProt Archive,他是(shi)一(yi)(yi)個綜合性的(de)(de)(de)非冗余(yu)(yu)數(shu)據(ju)(ju)(ju)庫(ku),他包含了(le)所有主要(yao)的(de)(de)(de)、公(gong)開的(de)(de)(de)數(shu)據(ju)(ju)(ju)庫(ku)的(de)(de)(de)蛋(dan)白質序(xu)(xu)列(lie)。 由于蛋(dan)白質可(ke)能(neng)在(zai)不(bu)同(tong)的(de)(de)(de)數(shu)據(ju)(ju)(ju)庫(ku)中(zhong)存(cun)在(zai),并且可(ke)能(neng)在(zai)同(tong)一(yi)(yi)個數(shu)據(ju)(ju)(ju)庫(ku)中(zhong)有多個版本,為(wei)(wei)了(le)去冗余(yu)(yu),UniaraParc對(dui)每(mei)條唯一(yi)(yi)的(de)(de)(de)序(xu)(xu)列(lie)只(zhi)存(cun)一(yi)(yi)次。無論是(shi)否為(wei)(wei)同(tong)一(yi)(yi)物種的(de)(de)(de)序(xu)(xu)列(lie),只(zhi)要(yao)序(xu)(xu)列(lie)相同(tong)就(jiu)被合并為(wei)(wei)一(yi)(yi)條,每(mei)條序(xu)(xu)列(lie)提供穩定(ding)的(de)(de)(de)、唯一(yi)(yi)的(de)(de)(de)編號UPI。該(gai)數(shu)據(ju)(ju)(ju)庫(ku)只(zhi)含有蛋(dan)白質的(de)(de)(de)序(xu)(xu)列(lie)信息(xi),而沒有注釋(shi)數(shu)據(ju)(ju)(ju)。