UniProt是Universal Protein的(de)(de)英文縮寫(xie),是信息(xi)最豐富、資源最廣的(de)(de)蛋白(bai)質(zhi)(zhi)數據(ju)庫。它由(you)整合Swiss-Prot、TrEMBL和 PIR-PSD三(san)大數據(ju)庫的(de)(de)數據(ju)而(er)成。他的(de)(de)數據(ju)主(zhu)要來自(zi)(zi)于(yu)基因組(zu)測序(xu)項目完(wan)成后(hou),后(hou)續(xu)獲得(de)的(de)(de)蛋白(bai)質(zhi)(zhi)序(xu)列。它包含了(le)大量來自(zi)(zi)文獻的(de)(de)蛋白(bai)質(zhi)(zhi)的(de)(de)生物(wu)功能的(de)(de)信息(xi)。
UniProtKB全稱UniProt Knowledgebase(UniProt知(zhi)識庫)它是經(jing)過(guo)專家校驗的(de)(de)數據集,主要由兩部分組成(cheng):UniProtKB/Swiss-Prot(包含(han)檢查(cha)過(guo)的(de)(de)、手工注(zhu)釋的(de)(de)條(tiao)(tiao)目(mu))和UniProtKB/TrEMBL(包含(han)未校驗的(de)(de)、自動注(zhu)釋的(de)(de)條(tiao)(tiao)目(mu)),在2010年8月是10日(ri)發布的(de)(de)版本(ben)中,UniProtKB/Swiss-Prot包含(han)519,348條(tiao)(tiao)注(zhu)釋條(tiao)(tiao)目(mu),UniProtKB/TrEMBL包含(han)11,636,205條(tiao)(tiao)注(zhu)釋條(tiao)(tiao)目(mu)。
UniProtKB/Swiss-Prot
高(gao)質(zhi)量的(de)(de)(de)、手(shou)工注釋的(de)(de)(de)、非冗余的(de)(de)(de)數(shu)(shu)據(ju)(ju)集;主(zhu)要來自文獻(xian)中的(de)(de)(de)研(yan)究成果和E-value校驗過計算(suan)分析結果。有(you)質(zhi)量保證的(de)(de)(de)數(shu)(shu)據(ju)(ju)才被加(jia)入該數(shu)(shu)據(ju)(ju)庫。
UniProtKB/TrEMBL
該數據(ju)(ju)集包含(han)高質量的(de)計算分析結(jie)果(guo),一般都在自動注(zhu)(zhu)釋中(zhong)富集,主要應(ying)對基因組項(xiang)目獲得的(de)大(da)(da)量數據(ju)(ju)流以人工校驗在時間上(shang)和人力上(shang)的(de)不足。他能注(zhu)(zhu)釋所有可用的(de)蛋白序(xu)列。在三大(da)(da)核(he)酸數據(ju)(ju)庫(EMBL-Bank/GenBank/DDBJ)中(zhong)注(zhu)(zhu)釋的(de)編(bian)碼序(xu)列都被自動翻譯并(bing)加入(ru)該數據(ju)(ju)庫中(zhong)。它也有來自PDB數據(ju)(ju)庫的(de)序(xu)列,以及(ji)Ensembl、Refeq和CCDS基因預測的(de)序(xu)列。
UniParc
UniParc全稱是UniProt Archive,他是一個綜合性的(de)非冗余數據(ju)庫(ku),他包含(han)了所(suo)有(you)主要的(de)、公開的(de)數據(ju)庫(ku)的(de)蛋(dan)白質序(xu)(xu)列。 由(you)于蛋(dan)白質可(ke)能在(zai)不同的(de)數據(ju)庫(ku)中存在(zai),并(bing)且可(ke)能在(zai)同一個數據(ju)庫(ku)中有(you)多個版本,為了去冗余,UniaraParc對每(mei)條(tiao)唯一的(de)序(xu)(xu)列只存一次。無論是否為同一物種(zhong)的(de)序(xu)(xu)列,只要序(xu)(xu)列相同就被合并(bing)為一條(tiao),每(mei)條(tiao)序(xu)(xu)列提(ti)供穩定的(de)、唯一的(de)編號UPI。該數據(ju)庫(ku)只含(han)有(you)蛋(dan)白質的(de)序(xu)(xu)列信息,而沒有(you)注釋(shi)數據(ju)。