UniProt是Universal Protein的(de)(de)英文(wen)縮寫,是信(xin)息(xi)最豐富、資源最廣(guang)的(de)(de)蛋(dan)(dan)白質(zhi)數(shu)據(ju)庫(ku)。它(ta)(ta)由(you)整合Swiss-Prot、TrEMBL和(he) PIR-PSD三(san)大(da)數(shu)據(ju)庫(ku)的(de)(de)數(shu)據(ju)而成。他的(de)(de)數(shu)據(ju)主要來自于基(ji)因(yin)組測序(xu)項目(mu)完成后,后續(xu)獲(huo)得(de)的(de)(de)蛋(dan)(dan)白質(zhi)序(xu)列。它(ta)(ta)包含了大(da)量來自文(wen)獻的(de)(de)蛋(dan)(dan)白質(zhi)的(de)(de)生(sheng)物功能的(de)(de)信(xin)息(xi)。
UniProtKB全稱UniProt Knowledgebase(UniProt知識(shi)庫)它(ta)是經過專家校驗(yan)的(de)(de)(de)數據集,主要(yao)由兩部分組成:UniProtKB/Swiss-Prot(包含(han)檢查過的(de)(de)(de)、手(shou)工注釋(shi)的(de)(de)(de)條目(mu)(mu)(mu))和UniProtKB/TrEMBL(包含(han)未(wei)校驗(yan)的(de)(de)(de)、自(zi)動注釋(shi)的(de)(de)(de)條目(mu)(mu)(mu)),在2010年8月是10日發布的(de)(de)(de)版本中,UniProtKB/Swiss-Prot包含(han)519,348條注釋(shi)條目(mu)(mu)(mu),UniProtKB/TrEMBL包含(han)11,636,205條注釋(shi)條目(mu)(mu)(mu)。
UniProtKB/Swiss-Prot
高質量(liang)的、手(shou)工注釋的、非冗余的數據(ju)集;主(zhu)要(yao)來自文獻中的研究(jiu)成果和E-value校驗過(guo)計(ji)算分(fen)析結果。有質量(liang)保證的數據(ju)才被(bei)加入該數據(ju)庫。
UniProtKB/TrEMBL
該(gai)數(shu)據(ju)(ju)集包含高質量的(de)(de)(de)計算分析結果(guo),一般都在自(zi)動(dong)注(zhu)(zhu)釋(shi)中富集,主要(yao)應對基因(yin)組項(xiang)目獲得(de)的(de)(de)(de)大量數(shu)據(ju)(ju)流以人(ren)工(gong)校驗在時間上(shang)和(he)人(ren)力上(shang)的(de)(de)(de)不(bu)足。他(ta)能注(zhu)(zhu)釋(shi)所有(you)可用(yong)的(de)(de)(de)蛋(dan)白序列(lie)(lie)。在三(san)大核酸數(shu)據(ju)(ju)庫(ku)(ku)(EMBL-Bank/GenBank/DDBJ)中注(zhu)(zhu)釋(shi)的(de)(de)(de)編碼序列(lie)(lie)都被自(zi)動(dong)翻譯并加入該(gai)數(shu)據(ju)(ju)庫(ku)(ku)中。它(ta)也有(you)來(lai)自(zi)PDB數(shu)據(ju)(ju)庫(ku)(ku)的(de)(de)(de)序列(lie)(lie),以及Ensembl、Refeq和(he)CCDS基因(yin)預測的(de)(de)(de)序列(lie)(lie)。
UniParc
UniParc全稱是UniProt Archive,他是一(yi)(yi)個(ge)綜合性的(de)(de)(de)非冗余(yu)數(shu)(shu)(shu)據(ju)庫,他包含了所(suo)有主(zhu)要的(de)(de)(de)、公(gong)開(kai)的(de)(de)(de)數(shu)(shu)(shu)據(ju)庫的(de)(de)(de)蛋白(bai)質序(xu)列。 由于蛋白(bai)質可能(neng)在不(bu)同(tong)的(de)(de)(de)數(shu)(shu)(shu)據(ju)庫中存在,并(bing)且可能(neng)在同(tong)一(yi)(yi)個(ge)數(shu)(shu)(shu)據(ju)庫中有多(duo)個(ge)版本,為了去(qu)冗余(yu),UniaraParc對每條唯一(yi)(yi)的(de)(de)(de)序(xu)列只存一(yi)(yi)次。無論是否為同(tong)一(yi)(yi)物種的(de)(de)(de)序(xu)列,只要序(xu)列相同(tong)就被合并(bing)為一(yi)(yi)條,每條序(xu)列提供(gong)穩定的(de)(de)(de)、唯一(yi)(yi)的(de)(de)(de)編(bian)號UPI。該數(shu)(shu)(shu)據(ju)庫只含有蛋白(bai)質的(de)(de)(de)序(xu)列信(xin)息(xi),而沒有注釋數(shu)(shu)(shu)據(ju)。