【基(ji)因測(ce)序(xu)是什么(me)】基(ji)因測(ce)序(xu)有什么(me)用 基(ji)因測(ce)序(xu)原理技術
隨著基因(yin)測序技術的(de)發(fa)展(zhan)和費用的(de)降(jiang)低,現在(zai)普通人也可以(yi)在(zai)可承受的(de)經濟范圍內進(jin)行個體測序分析,測序技術成(cheng)為精準醫學發(fa)展(zhan)和個體化治療中(zhong)一(yi)(yi)個非常重(zhong)要的(de)工具,我們(men)即(ji)將迎來一(yi)(yi)個全民測序的(de)時代。而這樣一(yi)(yi)種強大的(de)工具在(zai)科學家們(men)的(de)手中(zhong)又可以(yi)發(fa)揮出更大價(jia)值,挖(wa)掘出更有深度的(de)信息。基因(yin)測序技術在(zai)精準醫學中(zhong)得到了哪些(xie)應用呢?小(xiao)編從以(yi)下幾個方面(mian)結(jie)(jie)合已發(fa)表文章(zhang)進(jin)行了總結(jie)(jie)。
基因測序助力癌癥研究尋找治療靶點
在2016年4月8日那期(qi)Science期(qi)刊上,美國布羅德研究(jiu)所Aviv Regev的領(ling)導的癌癥研究(jiu)團隊通(tong)過(guo)與麻省理(li)工學院副教授、單細(xi)胞(bao)分(fen)(fen)析(xi)(xi)先鋒(feng)Alex Shalek合作,利(li)(li)用(yong)(yong)單細(xi)胞(bao)RNA-seq方(fang)法(fa)每次一個細(xi)胞(bao)地研究(jiu)整個腫(zhong)(zhong)(zhong)(zhong)瘤(liu)(liu)(liu)(liu)以便確定哪些類(lei)型的細(xi)胞(bao)存在于腫(zhong)(zhong)(zhong)(zhong)瘤(liu)(liu)(liu)(liu)中。他們(men)不僅分(fen)(fen)析(xi)(xi)了惡(e)性(xing)腫(zhong)(zhong)(zhong)(zhong)瘤(liu)(liu)(liu)(liu)細(xi)胞(bao),而(er)且(qie)也分(fen)(fen)析(xi)(xi)了腫(zhong)(zhong)(zhong)(zhong)瘤(liu)(liu)(liu)(liu)內所有不同類(lei)型的細(xi)胞(bao)。這(zhe)(zhe)(zhe)是首次開展(zhan)這(zhe)(zhe)(zhe)樣(yang)的研究(jiu)。如今,他們(men)知道(dao)每種(zhong)腫(zhong)(zhong)(zhong)(zhong)瘤(liu)(liu)(liu)(liu)的細(xi)胞(bao)組成,也知道(dao)每種(zhong)類(lei)型的細(xi)胞(bao)的基因表達模(mo)式,這(zhe)(zhe)(zhe)樣(yang)就能夠回個頭去重新分(fen)(fen)析(xi)(xi)一些大體積腫(zhong)(zhong)(zhong)(zhong)瘤(liu)(liu)(liu)(liu)測序數據(ju)(比如,癌癥基因組圖譜)以便從(cong)現存的數據(ju)中找出細(xi)胞(bao)如何相(xiang)互作用(yong)(yong)和一定程度上利(li)(li)用(yong)(yong)細(xi)胞(bao)重建(jian)大塊(kuai)腫(zhong)(zhong)(zhong)(zhong)瘤(liu)(liu)(liu)(liu)樣(yang)品的整體行為。
在(zai)一篇發(fa)表在(zai)國際學術期(qi)刊Nature Communication上的文章中,來自美國的科學家們對109名胰腺導管(guan)腺癌(PDA)病人進行了全外顯子測序,發(fa)現(xian)了PDA中的基因突變多(duo)樣性,并(bing)且為發(fa)現(xian)PDA治療靶點(dian)提供了重(zhong)要(yao)信息。
在(zai)該項研(yan)究(jiu)(jiu)中,研(yan)究(jiu)(jiu)人(ren)員(yuan)為方(fang)便檢測基(ji)因(yin)突(tu)變,同時(shi)移(yi)除非腫瘤性組織的(de)(de)(de)污染,他們利用(yong)顯微切(qie)割的(de)(de)(de)方(fang)法將癌癥患者的(de)(de)(de)腫瘤組織進(jin)行(xing)(xing)了(le)異種移(yi)植(zhi)并建立了(le)細(xi)胞系。隨(sui)后(hou)對109例進(jin)行(xing)(xing)過(guo)顯微切(qie)割的(de)(de)(de)PDA病例進(jin)行(xing)(xing)了(le)全外顯子測序,經過(guo)顯微切(qie)割操作后(hou),腫瘤細(xi)胞得(de)到富集并增強了(le)對基(ji)因(yin)突(tu)變的(de)(de)(de)檢測。研(yan)究(jiu)(jiu)人(ren)員(yuan)通(tong)過(guo)分析發(fa)現導(dao)致PDA發(fa)生的(de)(de)(de)病因(yin)事件與腫瘤突(tu)變譜(pu)具有(you)明顯相關性。
基因測序幫助尋找生物標記物 助力疾病診斷
在(zai)歐洲泌尿外科協(xie)會的(de)(de)(de)研究(jiu)者公(gong)布的(de)(de)(de)一項最新研究(jiu)成(cheng)果(guo)中(zhong)(zhong),研究(jiu)者對64份(fen)前列(lie)腺(xian)組織樣本(ben)進(jin)行研究(jiu),對每一種(zhong)樣本(ben)中(zhong)(zhong)的(de)(de)(de)2億(yi)個(ge)序列(lie)進(jin)行閱(yue)讀分析,結果(guo)研究(jiu)者發現在(zai)腫瘤和控制樣本(ben)中(zhong)(zhong)有(you)(you)超過2000個(ge)基因都表現出了(le)明顯的(de)(de)(de)差(cha)異性,其(qi)中(zhong)(zhong)有(you)(you)些相(xiang)比已知的(de)(de)(de)前列(lie)腺(xian)癌標志物而言表現出了(le)較高的(de)(de)(de)特異性和敏感性;其(qi)中(zhong)(zhong)一種(zhong)名為(wei)TAPIR的(de)(de)(de)非編碼(ma)RNAs則可以有(you)(you)效(xiao)抑制癌細胞的(de)(de)(de)生長,盡管(guan)其(qi)可以轉化(hua)為(wei)臨床有(you)(you)用的(de)(de)(de)治療靶(ba)點還為(wei)時尚早。
研究者在前列(lie)(lie)腺癌(ai)患(huan)者的(de)(de)尿液中發現(xian)了這(zhe)些生(sheng)(sheng)物(wu)標(biao)志(zhi)(zhi)物(wu),檢(jian)測結果顯示其可以(yi)幫助進行(xing)(xing)準(zhun)確(que)的(de)(de)前列(lie)(lie)腺癌(ai)檢(jian)測,基于(yu)相關研究結果,研究人員決定開發一種進行(xing)(xing)前列(lie)(lie)腺癌(ai)早期診斷的(de)(de)高(gao)特異(yi)性及敏感(gan)性的(de)(de),且基于(yu)尿液的(de)(de)檢(jian)測手段;這(zhe)種檢(jian)測方法基于(yu)對多(duo)個生(sheng)(sheng)物(wu)標(biao)志(zhi)(zhi)物(wu)的(de)(de)組合(he),相比單一標(biao)志(zhi)(zhi)物(wu)而言將(jiang)表現(xian)出較高(gao)的(de)(de)特異(yi)性。
基因測序幫助監測全球性疾病暴發
在一篇(pian)發(fa)表于Nature雜(za)志上的(de)報道中(zhong),來自伯明翰大學的(de)研究人(ren)員(yuan)解釋了如何利(li)用基因組(zu)(zu)測(ce)(ce)序的(de)技術來快速實現對疾病(bing)暴發(fa)的(de)有效(xiao)監測(ce)(ce);文章中(zhong)他(ta)們開(kai)發(fa)了一種手(shou)提箱(xiang)式的(de)基因組(zu)(zu)測(ce)(ce)序“實驗室(shi)”,其中(zhong)包含有一種新型(xing)的(de)DNA測(ce)(ce)序儀,最初該(gai)設備(bei)用于2015年4月在幾內(nei)亞對埃(ai)博拉(la)病(bing)人(ren)的(de)樣本(ben)進(jin)行檢測(ce)(ce)。
這項研究中(zhong),研究人員利用(yong)這種便(bian)攜(xie)式(shi)的(de)DNA測序(xu)儀(yi)在整個基因組(zu)庫中(zhong)鑒別出(chu)了新型的(de)單核(he)苷酸多態性(SNPs),目前當測序(xu)工作局限(xian)于實(shi)驗室的(de)時候,這種便(bian)攜(xie)式(shi)機(ji)(ji)器(qi)的(de)開發對(dui)于有(you)效進行疾病暴發的(de)監測而言非常重要,研究者們還(huan)希望可(ke)以將(jiang)這種便(bian)攜(xie)式(shi)的(de)機(ji)(ji)器(qi)應用(yong)于別的(de)領域的(de)研究中(zhong),比如癌癥研究等。
在(zai)另外一項研究中(zhong),來自(zi)英(ying)國(guo)牛(niu)津大學和巴西Evandro Chagas研究所等機構的研究人員對巴西的寨卡病毒(du)暴發進行首個基因組分析,從而提供關于這種病毒(du)如何和何時可能進入美(mei)洲(zhou)方(fang)面的新(xin)信息(xi)。
研究人員對7株巴西寨卡病毒毒株的基因組進行測序,包括一株毒株來自一例致命的成年人病例和另一株毒株來自一名頭小畸型新生兒。
1、第一代測序
1.1 Sanger 測序
采(cai)用(yong)的(de)(de)(de)(de)是(shi)(shi)直接測(ce)序法(fa)。1977年,Frederick Sanger 等(deng)發(fa)明了雙脫氧(yang)鏈(lian)末端終止(zhi)法(fa),這(zhe)一(yi)技(ji)(ji)術隨(sui)后成(cheng)為(wei)(wei)最為(wei)(wei)常(chang)用(yong)的(de)(de)(de)(de)基(ji)因測(ce)序技(ji)(ji)術。2001 年,Allan Maxam 和(he) Walter Gibert 發(fa) 明了 Sanger 測(ce)序法(fa),并在此后的(de)(de)(de)(de) 10 年里成(cheng)為(wei)(wei)基(ji)因檢測(ce)的(de)(de)(de)(de)金標準。其(qi)基(ji)本原理即(ji)雙脫氧(yang)核(he)苷三磷酸(dideoxyribonucleoside triphosphate,ddNTP)缺(que)乏PCR 延伸(shen)所需的(de)(de)(de)(de) 3'-OH,因此每(mei)當 DNA 鏈(lian)加(jia)入分子 ddNTP,延伸(shen)便終止(zhi)。每(mei)一(yi)次(ci) DNA 測(ce)序是(shi)(shi)由 4個(ge)獨立的(de)(de)(de)(de)反應(ying)組成(cheng),將模板、引物和(he) 4 種含有(you)不同的(de)(de)(de)(de)放(fang)射(she)性(xing)同位素標記的(de)(de)(de)(de)核(he)苷酸的(de)(de)(de)(de) ddNTP 分別與DNA 聚合酶(mei)混合形成(cheng)長短不一(yi)的(de)(de)(de)(de)片(pian)段,大量(liang)起始點(dian)相(xiang)同、終止(zhi)點(dian)不同的(de)(de)(de)(de) DNA 片(pian)段存在于(yu)反應(ying)體系中,具有(you)單個(ge)堿(jian)基(ji)差別的(de)(de)(de)(de) DNA 序列可以被聚丙烯酰(xian)胺變(bian)性(xing)凝膠(jiao)電(dian)泳分離出(chu)來,得到放(fang)射(she)性(xing)同位素自顯影條(tiao)帶。依據(ju)電(dian)泳條(tiao)帶讀取 DNA 雙鏈(lian)的(de)(de)(de)(de)堿(jian)基(ji)序列。
人類基(ji)(ji)(ji)因(yin)(yin)組(zu)的(de)測(ce)序(xu)正是基(ji)(ji)(ji)于該技術完成的(de)。Sanger 測(ce)序(xu)這種直(zhi)(zhi)接(jie)測(ce)序(xu)方法具有高(gao)度的(de)準確性和簡單、快捷等特(te)點。目前,依然(ran)對于一些臨(lin)床(chuang)上小(xiao)樣本遺傳疾病基(ji)(ji)(ji)因(yin)(yin)的(de)鑒定具有很(hen)高(gao)的(de)實用價(jia)值(zhi)。例如,臨(lin)床(chuang)上采用 Sanger 直(zhi)(zhi)接(jie)測(ce)序(xu) FGFR 2 基(ji)(ji)(ji)因(yin)(yin)證實單基(ji)(ji)(ji)因(yin)(yin) Apert 綜(zong)合征和直(zhi)(zhi)接(jie)測(ce)序(xu) TCOF1 基(ji)(ji)(ji)因(yin)(yin)可以(yi)檢(jian)出(chu)多(duo)達(da) 90% 的(de)與 Treacher Collins 綜(zong)合征相關的(de)突變。值(zhi)得注意(yi)的(de)是,Sanger 測(ce)序(xu)是針對已知致病基(ji)(ji)(ji)因(yin)(yin)的(de)突變位(wei)點設(she)計(ji)引物,進行 PCR 直(zhi)(zhi)接(jie)擴(kuo)增測(ce)序(xu)。單個突變點的(de)擴(kuo)增包括該位(wei)點在(zai)內(nei)的(de)外(wai)顯子片(pian)段即可,不必將該點所(suo)在(zai)基(ji)(ji)(ji)因(yin)(yin)的(de)全部外(wai)顯子都擴(kuo)增。
因(yin)(yin)此,應明確定位要擴(kuo)增的位點所在的基因(yin)(yin)外顯子(zi)(zi)和該點的具體(ti)位置,設(she)計包(bao)括該點在內的上下游 150 ~ 200 bp 的外顯子(zi)(zi)片段引物。此外,盡管有NGS 的出(chu)現,但 Sanger 測序(xu)對于有致(zhi)病(bing)基因(yin)(yin)位點明確并且數量(liang)有限的單基因(yin)(yin)遺(yi)傳(chuan)疾病(bing)的致(zhi)病(bing)基因(yin)(yin)的檢測是非常經濟和高(gao)效(xiao)的。到目前為止,Sanger 測序(xu)仍然是作為基因(yin)(yin)檢測的金標準,也是 NGS 基因(yin)(yin)檢測后進(jin)行家系內和正常對照組驗證的主要手段。
值得注(zhu)意(yi)的(de)(de)是,Sanger 測(ce)(ce)序(xu)(xu)目的(de)(de)是尋找與疾病有(you)關的(de)(de)特定(ding)的(de)(de)基因突變。對于沒有(you)明確候(hou)選(xuan)基因或候(hou)選(xuan)基因數(shu)量較多的(de)(de)大(da)樣本病例篩查(cha)是難以(yi)完成的(de)(de),此類(lei)測(ce)(ce)序(xu)(xu)研究(jiu)還(huan)要依靠具(ju)有(you)高通量測(ce)(ce)序(xu)(xu)能力(li)的(de)(de) NGS。雖然 Sanger 測(ce)(ce)序(xu)(xu)具(ju)有(you)高度的(de)(de)分(fen)析準(zhun)確性,但其準(zhun)確性還(huan)取決于測(ce)(ce)序(xu)(xu)儀(yi)器以(yi)及測(ce)(ce)序(xu)(xu)條件的(de)(de)設(she)定(ding)。另外(wai),Sanger 測(ce)(ce)序(xu)(xu)不(bu)能檢測(ce)(ce)出大(da)片段缺失或拷貝(bei)數(shu)變異(yi)等基因突變的(de)(de)類(lei)型,因此對于一些(xie)與此相關的(de)(de)遺傳性疾病還(huan)不(bu)能做出基因學診斷(duan)。
1.2 連鎖分析
采用(yong)(yong)的(de)(de)(de)(de)(de)是(shi)(shi)(shi)間接測(ce)序(xu)(xu)法。在(zai) NGS 出(chu)現之(zhi)(zhi)前,國(guo)際通用(yong)(yong)的(de)(de)(de)(de)(de)疾病基(ji)(ji)(ji)(ji)(ji)(ji)因(yin)(yin)定(ding)(ding)位(wei)(wei)(wei)克隆(long)策略是(shi)(shi)(shi)建立在(zai)大規模全基(ji)(ji)(ji)(ji)(ji)(ji)因(yin)(yin)掃描(miao)和(he)連(lian)鎖(suo)(suo)(suo)分析基(ji)(ji)(ji)(ji)(ji)(ji)礎(chu)上(shang)的(de)(de)(de)(de)(de)位(wei)(wei)(wei)置候(hou)選基(ji)(ji)(ji)(ji)(ji)(ji)因(yin)(yin)克隆(long)。人類的(de)(de)(de)(de)(de)染(ran)色體(ti)成對出(chu)現,一(yi)(yi)(yi)條來自(zi)父親,一(yi)(yi)(yi)條來自(zi)母(mu)親,每一(yi)(yi)(yi)對染(ran)色體(ti)在(zai)同(tong)樣的(de)(de)(de)(de)(de)位(wei)(wei)(wei)置上(shang)擁有相同(tong)的(de)(de)(de)(de)(de)基(ji)(ji)(ji)(ji)(ji)(ji)因(yin)(yin),但(dan)是(shi)(shi)(shi)其序(xu)(xu)列(lie)并不完全相同(tong),被稱為(wei)父系(xi)和(he)母(mu)系(xi)等位(wei)(wei)(wei)基(ji)(ji)(ji)(ji)(ji)(ji)因(yin)(yin)。遺(yi)(yi)傳(chuan)標(biao)(biao)記(ji)(ji)(ji)(ji)是(shi)(shi)(shi)指(zhi)在(zai)人群中表現出(chu)多(duo)態現象的(de)(de)(de)(de)(de) DNA 序(xu)(xu)列(lie),可追蹤染(ran)色體(ti)、染(ran)色體(ti)某(mou)一(yi)(yi)(yi)節段或某(mou)個(ge)基(ji)(ji)(ji)(ji)(ji)(ji)因(yin)(yin)座在(zai)家系(xi)中傳(chuan)遞的(de)(de)(de)(de)(de)任(ren)何一(yi)(yi)(yi)種遺(yi)(yi)傳(chuan)特性(xing)。它存在(zai)于每一(yi)(yi)(yi)個(ge)人,但(dan)大小和(he)序(xu)(xu)列(lie)有差(cha)別,具有可遺(yi)(yi)傳(chuan)性(xing)和(he)可識別性(xing)。目(mu)前采用(yong)(yong)第二代遺(yi)(yi)傳(chuan)標(biao)(biao)記(ji)(ji)(ji)(ji),即重(zhong)(zhong)復(fu)序(xu)(xu)列(lie)多(duo)態性(xing),特別是(shi)(shi)(shi)短串聯重(zhong)(zhong)復(fu)序(xu)(xu)列(lie),又稱微(wei)衛(wei)星(xing)標(biao)(biao)記(ji)(ji)(ji)(ji)。連(lian)鎖(suo)(suo)(suo)分析是(shi)(shi)(shi)以連(lian)鎖(suo)(suo)(suo)這種遺(yi)(yi)傳(chuan)現象為(wei)基(ji)(ji)(ji)(ji)(ji)(ji)礎(chu),研究致(zhi)病基(ji)(ji)(ji)(ji)(ji)(ji)因(yin)(yin)與遺(yi)(yi)傳(chuan)性(xing)標(biao)(biao)記(ji)(ji)(ji)(ji)之(zhi)(zhi)間關系(xi)的(de)(de)(de)(de)(de)方(fang)法。如果控(kong)制某(mou)一(yi)(yi)(yi)表型性(xing)狀的(de)(de)(de)(de)(de)基(ji)(ji)(ji)(ji)(ji)(ji)因(yin)(yin)附近存在(zai)遺(yi)(yi)傳(chuan)標(biao)(biao)記(ji)(ji)(ji)(ji),那么利用(yong)(yong)某(mou)個(ge)遺(yi)(yi)傳(chuan)標(biao)(biao)記(ji)(ji)(ji)(ji)與某(mou)個(ge)擬(ni)定(ding)(ding)位(wei)(wei)(wei)的(de)(de)(de)(de)(de)基(ji)(ji)(ji)(ji)(ji)(ji)因(yin)(yin)之(zhi)(zhi)間是(shi)(shi)(shi)否存在(zai)連(lian)鎖(suo)(suo)(suo)關系(xi),以及(ji)連(lian)鎖(suo)(suo)(suo)的(de)(de)(de)(de)(de)緊密程(cheng)度就能將該(gai)(gai)基(ji)(ji)(ji)(ji)(ji)(ji)因(yin)(yin)定(ding)(ding)位(wei)(wei)(wei)到染(ran)色體(ti)某(mou)一(yi)(yi)(yi)位(wei)(wei)(wei)置上(shang)。1986 年(nian) Morton 等提出(chu)優勢對數記(ji)(ji)(ji)(ji)分法(og odds score method,LOD),主要檢測(ce)兩基(ji)(ji)(ji)(ji)(ji)(ji)因(yin)(yin)以某(mou)一(yi)(yi)(yi)重(zhong)(zhong)組率連(lian)鎖(suo)(suo)(suo)時的(de)(de)(de)(de)(de)似然性(xing)。LOD 值為(wei)正,支持連(lian)鎖(suo)(suo)(suo);LOD 值為(wei)負,則否定(ding)(ding)連(lian)鎖(suo)(suo)(suo)。通過計算家系(xi)中的(de)(de)(de)(de)(de)微(wei)衛(wei)星(xing)標(biao)(biao)記(ji)(ji)(ji)(ji)與致(zhi)病位(wei)(wei)(wei)點之(zhi)(zhi)間的(de)(de)(de)(de)(de) LOD 值,可以初步(bu)估算二者(zhe)間的(de)(de)(de)(de)(de)遺(yi)(yi)傳(chuan)距離(li)及(ji)連(lian)鎖(suo)(suo)(suo)程(cheng)度,從(cong)而確定(ding)(ding)該(gai)(gai)基(ji)(ji)(ji)(ji)(ji)(ji)因(yin)(yin)在(zai)染(ran)色體(ti)上(shang)的(de)(de)(de)(de)(de)粗略位(wei)(wei)(wei)置。然后(hou)利用(yong)(yong)該(gai)(gai)區(qu)域(yu)的(de)(de)(de)(de)(de)染(ran)色體(ti)基(ji)(ji)(ji)(ji)(ji)(ji)因(yin)(yin)圖譜(pu),分析定(ding)(ding)位(wei)(wei)(wei)區(qu)域(yu)內所有基(ji)(ji)(ji)(ji)(ji)(ji)因(yin)(yin)的(de)(de)(de)(de)(de)功(gong)能與表達(da),選擇合適的(de)(de)(de)(de)(de)候(hou)選基(ji)(ji)(ji)(ji)(ji)(ji)因(yin)(yin)進行(xing)突變(bian)檢測(ce),最終(zhong)將致(zhi)病基(ji)(ji)(ji)(ji)(ji)(ji)因(yin)(yin)定(ding)(ding)位(wei)(wei)(wei)或克隆(long)。
然而(er),采用連鎖分析進(jin)行基(ji)因檢測(ce)存在(zai)很大的局限(xian)性。不(bu)但所需遺傳樣本量較大,一般(ban)要求提供三代(dai)及以上遺傳家系(xi)患者血樣,而(er)且(qie)數據(ju)量大、處理復雜、產出速(su)度較慢、定(ding)(ding)位(wei)(wei)不(bu)夠精(jing)確(一般(ban)只能定(ding)(ding)位(wei)(wei)在(zai)染色(se)體某一區間(jian)(jian)),這就使(shi)得研(yan)究(jiu)工作(zuo)繁重和定(ding)(ding)位(wei)(wei)基(ji)因的時間(jian)(jian)周期特別長。目前,連鎖分析采用的單核苷酸多(duo)肽性和短串聯重復序列還(huan)在(zai)使(shi)用,但經(jing)典的間(jian)(jian)接測(ce)序方法,如單鏈(lian)構象(xiang)多(duo)肽性、變性梯度凝膠電泳和異源雙鏈(lian)分析在(zai)美國(guo)已被淘(tao)汰(tai),而(er)在(zai)發展中國(guo)家作(zuo)為研(yan)究(jiu)手(shou)段還(huan)在(zai)有限(xian)使(shi)用。
2、新一代測序(NGS)
主 要(yao) 包 括 全 基 因(yin) 組 重 測(ce)(ce) 序(xu)(xu)(whole-genomesequencing,WGS)、全外顯子組測(ce)(ce)序(xu)(xu)(whole-exomesequencing,WES)和(he)目標區(qu)域測(ce)(ce)序(xu)(xu)(Targeted regionssequencing,TRS),它們(men)同屬于(yu)新一代測(ce)(ce)序(xu)(xu)技(ji)術。總體而(er)言,NGS 技(ji)術具有通(tong)量大、時間短、精確度高和(he)信息量豐富等(deng)優點(dian),使得(de)遺傳學者(zhe)可以(yi)在短時間內對感興(xing)趣的(de)基因(yin)進行(xing)精確定位。但這(zhe)些不同的(de)測(ce)(ce)序(xu)(xu)技(ji)術在測(ce)(ce)序(xu)(xu)范圍、數據分析量以(yi)及測(ce)(ce)序(xu)(xu)費用(yong)和(he)時間等(deng)方面(mian)又(you)有很大差別(bie),如果(guo)選擇適合的(de)方法,對于(yu)臨(lin)床診斷和(he)科學研(yan)究將(jiang)起到事半功倍的(de)作(zuo)用(yong)。
2.1 目標區域測序
目(mu)(mu)前常用(yong)的(de)(de)(de)(de)是(shi)(shi)基因(yin)(yin)(yin)芯(xin)片(pian)技(ji)術(shu)。其(qi)測(ce)(ce)序(xu)原理是(shi)(shi)基于(yu) DNA 雜(za)交原理,利用(yong)目(mu)(mu)標(biao)基因(yin)(yin)(yin)組(zu)區域(yu)(yu)定制的(de)(de)(de)(de)探針(zhen)與基因(yin)(yin)(yin)組(zu) DNA 進行芯(xin)片(pian)雜(za)交或(huo)溶液雜(za)交,將(jiang)(jiang)目(mu)(mu)標(biao)基因(yin)(yin)(yin)區域(yu)(yu) DNA 富(fu)集,再(zai)通(tong)過(guo)NGS 技(ji)術(shu)進行測(ce)(ce)序(xu)。其(qi)測(ce)(ce)序(xu)過(guo)程(cheng)是(shi)(shi)通(tong)過(guo)把(ba)數(shu)以(yi)(yi)萬計的(de)(de)(de)(de) cDNA 或(huo)寡聚核(he)苷酸(suan)置(zhi)于(yu)芯(xin)片(pian)上(shang)制成列(lie)陣,將(jiang)(jiang)芯(xin)片(pian)上(shang)固定好的(de)(de)(de)(de)已知序(xu)列(lie)的(de)(de)(de)(de)核(he)苷酸(suan)探針(zhen)與溶液中含有熒光標(biao)記的(de)(de)(de)(de)相應核(he)酸(suan)序(xu)列(lie)進行互補配對(dui),根據測(ce)(ce)序(xu)儀所(suo)(suo)顯(xian)示(shi)強熒光的(de)(de)(de)(de)位置(zhi)和強度,獲取每組(zu)點陣列(lie)信息,再(zai)利用(yong)生物信息學算法(fa)確(que)定目(mu)(mu)的(de)(de)(de)(de)靶核(he)苷酸(suan)的(de)(de)(de)(de)序(xu)列(lie)組(zu)成。測(ce)(ce)序(xu)所(suo)(suo)選(xuan)定的(de)(de)(de)(de)目(mu)(mu)標(biao)區域(yu)(yu)可以(yi)(yi)是(shi)(shi)連(lian)續的(de)(de)(de)(de) DNA 序(xu)列(lie),也可以(yi)(yi)是(shi)(shi)分(fen)(fen)布在(zai)(zai)同一個(ge)染色(se)體不同區域(yu)(yu)或(huo)不同染色(se)體上(shang)的(de)(de)(de)(de)片(pian)段。目(mu)(mu)標(biao)區域(yu)(yu)測(ce)(ce)序(xu)技(ji)術(shu),對(dui)于(yu)以(yi)(yi)往通(tong)過(guo)連(lian)鎖(suo)分(fen)(fen)析將(jiang)(jiang)基因(yin)(yin)(yin)突(tu)變鎖(suo)定在(zai)(zai)染色(se)體某一片(pian)段區域(yu)(yu)內,但無(wu)法(fa)找出(chu)突(tu)變是(shi)(shi)一個(ge)非常好的(de)(de)(de)(de)進一步檢測(ce)(ce)手段。2010 年,Nicholas等(deng)使用(yong)基因(yin)(yin)(yin)分(fen)(fen)型芯(xin)片(pian)聯合連(lian)鎖(suo)分(fen)(fen)析技(ji)術(shu),成功發(fa)現(xian)頭小畸形的(de)(de)(de)(de)新基因(yin)(yin)(yin) WDR62,文章發(fa)表在(zai)(zai)《NatGenet》雜(za)志。類似的(de)(de)(de)(de)研(yan)究在(zai)(zai)家族性(xing)胰腺癌中確(que)定 8 個(ge)候選(xuan)變異位點和在(zai)(zai)家族性(xing)滲出(chu)性(xing)玻(bo)璃(li)體視(shi)網膜病變發(fa)現(xian)易感基因(yin)(yin)(yin) TSPAN12。
基(ji)因(yin)芯片測(ce)(ce)序技術可以(yi)將(jiang)經過(guo)連(lian)鎖(suo)分析鎖(suo)定(ding)了(le)目標范圍或經過(guo)全(quan)(quan)(quan)基(ji)因(yin)組篩選的(de)(de)(de)(de)特定(ding)基(ji)因(yin)或區域(yu)進行更深(shen)一層的(de)(de)(de)(de)研究,是解決(jue)連(lian)鎖(suo)分析無(wu)法(fa)發現致病(bing)基(ji)因(yin)的(de)(de)(de)(de)有效(xiao)手段(duan)。基(ji)因(yin)芯片技術對(dui)于(yu)(yu)已(yi)知(zhi)基(ji)因(yin)突變的(de)(de)(de)(de)篩查具有明顯優勢,可以(yi)快(kuai)速、全(quan)(quan)(quan)面地檢測(ce)(ce)出目標基(ji)因(yin)突變。同時,由于(yu)(yu)目標區域(yu)受(shou)到了(le)限制,測(ce)(ce)序范圍大幅度(du)減少(shao),測(ce)(ce)序時間和費用(yong)相(xiang)應降低。但基(ji)因(yin)芯片檢測(ce)(ce)所需要的(de)(de)(de)(de) DNA 的(de)(de)(de)(de)量(liang)要大,由于(yu)(yu)已(yi)提取的(de)(de)(de)(de) DNA 存在(zai)降解的(de)(de)(de)(de)風險,用(yong)于(yu)(yu)基(ji)因(yin)芯片研究的(de)(de)(de)(de)血標本(ben)最好(hao)是冰凍(dong)的(de)(de)(de)(de)全(quan)(quan)(quan)血,這樣可以(yi)使用(yong)于(yu)(yu)檢測(ce)(ce) DNA 的(de)(de)(de)(de)量(liang)有充(chong)分保證。
2.2 全外顯子組測序 (WES)
外(wai)顯(xian)子(zi)組(zu)是(shi)單(dan)個(ge)個(ge)體的(de)(de)基(ji)因(yin)組(zu) DNA 上所有蛋(dan)白質編(bian)(bian)碼序(xu)(xu)列(lie)(lie)的(de)(de)總合。人類外(wai)顯(xian)子(zi)組(zu)序(xu)(xu)列(lie)(lie)約占人類全(quan)(quan)部基(ji)因(yin)組(zu)序(xu)(xu)列(lie)(lie)的(de)(de) 1%,但大約包含(han) 85% 的(de)(de)致病突變(bian)。WES 是(shi)利(li)用(yong)序(xu)(xu)列(lie)(lie)捕獲(huo)(huo)技(ji)術將全(quan)(quan)外(wai)顯(xian)子(zi)區(qu)(qu)域 DNA 捕捉并富集后進(jin)行高通量測(ce)序(xu)(xu)的(de)(de)基(ji)因(yin)分(fen)析方(fang)法。采(cai)用(yong)的(de)(de)技(ji)術平臺主(zhu)要是(shi)羅氏(shi)公司(si)的(de)(de) SeqCap EZ 全(quan)(quan)外(wai)顯(xian)子(zi)捕獲(huo)(huo)系(xi)(xi)統,Illumina 公司(si)的(de)(de) Solexa 技(ji)術和 Agilent 公司(si)的(de)(de) SureSelect 外(wai)顯(xian)子(zi)靶(ba)向序(xu)(xu)列(lie)(lie)富集系(xi)(xi)統。其捕獲(huo)(huo)的(de)(de)目標(biao)(biao)區(qu)(qu)在(zai) 34 ~ 62 M 之間,不僅包括(kuo)編(bian)(bian)碼區(qu)(qu)同時也加入了部分(fen)非(fei)編(bian)(bian)碼區(qu)(qu)。NGS 的(de)(de)測(ce)序(xu)(xu)過程(cheng)主(zhu)要包括(kuo)DNA 測(ce)序(xu)(xu)文庫(ku)的(de)(de)制備、錨定橋接、PCR 擴增、單(dan)堿基(ji)延伸測(ce)序(xu)(xu)和數(shu)據(ju)(ju)分(fen)析。研(yan)究(jiu)者根據(ju)(ju)測(ce)序(xu)(xu)儀捕獲(huo)(huo)到在(zai)測(ce)序(xu)(xu)過程(cheng)中摻入有不同熒(ying)光(guang)標(biao)(biao)記堿基(ji)片段,經計算(suan)機將熒(ying)光(guang)信號轉(zhuan)化(hua)成(cheng)不同顏色的(de)(de)測(ce)序(xu)(xu)峰圖和堿基(ji)序(xu)(xu)列(lie)(lie)。基(ji)因(yin)測(ce)序(xu)(xu)結果與(yu)NCBI的(de)(de)SNP數(shu)據(ju)(ju)庫(ku)、千人基(ji)因(yin)組(zu)數(shu)據(ju)(ju)庫(ku)等國際權威數(shu)據(ju)(ju)庫(ku)比對,最終確定是(shi)否為(wei)突變(bian)基(ji)因(yin)。
自NGS 技術(shu)問世(shi)以來,利用 WES 在(zai)(zai)(zai)臨床疾(ji)病(bing)致(zhi)病(bing)基(ji)因(yin)(yin)(yin)的(de)(de)鑒定研(yan)究中(zhong)(zhong)(zhong)取(qu)(qu)得前所未(wei)有的(de)(de)成(cheng)果(guo)。這些成(cheng)果(guo)不(bu)僅(jin)集(ji)中(zhong)(zhong)(zhong)在(zai)(zai)(zai)單基(ji)因(yin)(yin)(yin)遺傳疾(ji)病(bing),還在(zai)(zai)(zai)多(duo)基(ji)因(yin)(yin)(yin)影響(xiang)的(de)(de)復(fu)雜疾(ji)病(bing)中(zhong)(zhong)(zhong)獲得大量相關基(ji)因(yin)(yin)(yin)的(de)(de)發(fa)現。在(zai)(zai)(zai)單基(ji)因(yin)(yin)(yin)遺傳性(xing)疾(ji)病(bing)中(zhong)(zhong)(zhong),如視(shi)網(wang)膜色素變性(xing)、終(zhong)端骨發(fa)育不(bu)良等發(fa)現新基(ji)因(yin)(yin)(yin)或已知基(ji)因(yin)(yin)(yin)新突變。在(zai)(zai)(zai)一些罕見的(de)(de)疾(ji)病(bing)中(zhong)(zhong)(zhong),如 Kabuki 綜合征、家族性(xing)混合型低(di)脂血癥(zheng)和脊髓小腦共濟失調癥(zheng)等疾(ji)病(bing)中(zhong)(zhong)(zhong)發(fa)現新的(de)(de)致(zhi)病(bing)基(ji)因(yin)(yin)(yin)。同時,在(zai)(zai)(zai)小細胞肺癌(ai)、慢性(xing)淋巴細胞性(xing)白血病(bing)等腫(zhong)瘤研(yan)究和諸(zhu)如肥(fei)胖癥(zheng)、腦皮質發(fa)育不(bu)良等復(fu)雜疾(ji)病(bing)的(de)(de)研(yan)究中(zhong)(zhong)(zhong)也取(qu)(qu)得豐碩成(cheng)果(guo)。
WES 技(ji)術在(zai)(zai)篩查(cha)范圍(wei)和(he)檢出率等(deng)(deng)方(fang)面較(jiao)(jiao)其(qi)他測(ce)(ce)(ce)序(xu)(xu)(xu)技(ji)術具有明顯的優勢。例如,對(dui)(dui)于(yu)采用 Sanger測(ce)(ce)(ce)序(xu)(xu)(xu)和(he)基(ji)因(yin)(yin)芯片測(ce)(ce)(ce)序(xu)(xu)(xu)不(bu)能(neng)(neng)篩查(cha)出基(ji)因(yin)(yin)的樣本,可以(yi)采用 WES 來進(jin)一(yi)步基(ji)因(yin)(yin)篩查(cha)鑒定。應用 WES技(ji)術能(neng)(neng)夠(gou)獲得較(jiao)(jiao)傳(chuan)(chuan)統(tong) Sanger 等(deng)(deng)方(fang)法對(dui)(dui)編(bian)碼區(qu)測(ce)(ce)(ce)序(xu)(xu)(xu)更(geng)(geng)深的覆(fu)蓋度(du)和(he)更(geng)(geng)準確(que)的數據。由于(yu)信息量(liang)的大(da)幅度(du)增加,WES 可以(yi)獲得更(geng)(geng)多個(ge)(ge)體的編(bian)碼區(qu)信息,因(yin)(yin)此成為檢測(ce)(ce)(ce)致病(bing)(bing)基(ji)因(yin)(yin)和(he)易(yi)感基(ji)因(yin)(yin)位(wei)點(dian)的有效手(shou)段(duan)。與連(lian)(lian)鎖分析定位(wei)方(fang)法比(bi)較(jiao)(jiao),WES 對(dui)(dui)家系(xi)(xi)的要(yao)(yao)求(qiu)并不(bu)十(shi)分嚴格,在(zai)(zai)單(dan)基(ji)因(yin)(yin)遺(yi)傳(chuan)(chuan)病(bing)(bing)同(tong)一(yi)家系(xi)(xi)中(zhong)有 2 ~3 個(ge)(ge)患者和(he) 1 個(ge)(ge)正常人即可進(jin)行(xing)致病(bing)(bing)基(ji)因(yin)(yin)的鑒定研(yan)究(jiu),而不(bu)需(xu)要(yao)(yao)連(lian)(lian)續(xu)三代的遺(yi)傳(chuan)(chuan)家系(xi)(xi)。由于(yu)不(bu)需(xu)要(yao)(yao)嚴格的三代以(yi)上(shang)的遺(yi)傳(chuan)(chuan)家系(xi)(xi),WES 使以(yi)前不(bu)能(neng)(neng)進(jin)行(xing)研(yan)究(jiu)的家系(xi)(xi)成為可能(neng)(neng)。不(bu)僅對(dui)(dui)于(yu)單(dan)基(ji)因(yin)(yin)遺(yi)傳(chuan)(chuan)病(bing)(bing)是(shi)一(yi)個(ge)(ge)很好的研(yan)究(jiu)手(shou)段(duan),對(dui)(dui)于(yu)許多常見病(bing)(bing),如腫瘤、糖尿病(bing)(bing)等(deng)(deng)疾病(bing)(bing)也可進(jin)行(xing)大(da)規模比(bi)較(jiao)(jiao)研(yan)究(jiu)。
2.3 全基因組重測序 (WGS)
WGS 是對已知基因組序列的物種進行不同個體的全基因組的測序,經過數據分析后對序列進行拼接、組裝并獲得基因組圖譜,或是對不同組織進行測序并分析體細胞突變的一種研究方法。盡管 WES 可以快速全面地找出個體基因組上的所有突變,從而找到個體間的差異,但對于外顯子以外的區域則不能有效地進行基因檢測。對于此種情況,目前還要借助WGS 進行全基因組檢測。但由于人類基因組過于龐大,一次單端全基因組測序很難達到所需要的測序深度。因此,需要重復測序或雙端測序,由此帶來測序成本的大幅度提高和由于不能達到足夠的測序深度所導致的結果準確性的降低。而對于臨床疾病診斷和普通科研工作,其高昂的檢測費用也是難以承受的。盡管如此,對于部分臨床研究和 WES 不能解決的科研課題還需要借助 WGS進行更加全面的基因檢測。