單細(xì)胞全基因組測(cè)序技術(shù)(scWGS)可以有效揭示生物樣品中不同細(xì)胞之間的異質(zhì)性,并系統(tǒng)鑒定單個(gè)細(xì)胞的基因組中發(fā)生的遺傳變化,例如拷貝數(shù)變異(CNV)和點(diǎn)突變(單核苷酸變異,SNV)等。過(guò)去十年,研究人員已經(jīng)開(kāi)發(fā)出多種單細(xì)胞基因組擴(kuò)增技術(shù),例如簡(jiǎn)并寡核苷酸引物PCR擴(kuò)增技術(shù)(DOP-PCR)、多重置換擴(kuò)增技術(shù)(MDA)、多重退火和基于環(huán)的擴(kuò)增循環(huán)技術(shù)(MALBAC),以及通過(guò)轉(zhuǎn)座子插入和體外轉(zhuǎn)錄進(jìn)行線(xiàn)性擴(kuò)增技術(shù)(LIANTI)等。但是,目前的單細(xì)胞全基因組測(cè)序技術(shù)均基于二代測(cè)序(NGS)平臺(tái),該平臺(tái)檢測(cè)準(zhǔn)確度高,但是測(cè)序讀長(zhǎng)相對(duì)較短(通常只有150bpX2),主要適用于檢測(cè)單個(gè)細(xì)胞中的單核苷酸變異(SNV)、小的插入缺失(<50bp,Indel)以及拷貝數(shù)變異(CNV)等。由于二代測(cè)序平臺(tái)讀長(zhǎng)的限制,對(duì)于基因組中結(jié)構(gòu)變異的檢測(cè)具有很大的局限性。結(jié)構(gòu)變異(包括插入、缺失、重復(fù)和易位等)是人類(lèi)體細(xì)胞遺傳變異的主要來(lái)源之一,對(duì)腫瘤的發(fā)生、發(fā)展和轉(zhuǎn)移具有潛在的驅(qū)動(dòng)作用,然而目前在單個(gè)細(xì)胞水平對(duì)基因組結(jié)構(gòu)變異的研究卻鮮有報(bào)道。
針對(duì)基于二代測(cè)序平臺(tái)的單細(xì)胞基因組測(cè)序技術(shù)難以高效鑒定單個(gè)細(xì)胞中結(jié)構(gòu)變異這一世界難題,北京未來(lái)基因診斷高精尖**中心、北京大學(xué)生物醫(yī)學(xué)前沿**中心湯富酬課題組在Genome Biology上在線(xiàn)發(fā)表了題為“SMOOTH-seq: single-cell genome sequencing of human cells on athird-generation sequencing platform”的研究論文,在國(guó)際上率先開(kāi)發(fā)了基于三代測(cè)序(單分子測(cè)序)平臺(tái)的單細(xì)胞基因組測(cè)序技術(shù)。
該研究的主要突破有:
開(kāi)發(fā)了一種高精度的基于三代測(cè)序(單分子測(cè)序)平臺(tái)的單細(xì)胞基因組測(cè)序方法——SMOOTH-seq(Single-MOlecule real-time sequencing of LOng Fragments amplified THrough Transposon insertion)。使用優(yōu)化后的Tn5轉(zhuǎn)座反應(yīng),SMOOTH-seq能夠從單個(gè)細(xì)胞中擴(kuò)增出平均長(zhǎng)度約6kb的基因組片段(測(cè)序讀長(zhǎng)比單細(xì)胞基因組二代測(cè)序技術(shù)長(zhǎng)了20倍左右),通過(guò)引入與單分子測(cè)序平臺(tái)兼容的細(xì)胞條形碼使單細(xì)胞基因組DNA擴(kuò)增子適用于Pacbio sequel II平臺(tái)的HiFi測(cè)序模式。測(cè)序后的數(shù)據(jù)中,產(chǎn)生的環(huán)化測(cè)序(circular consensus sequencing, CCS)的讀長(zhǎng)平均在6kb左右, *長(zhǎng)可達(dá)43kb。
該研究開(kāi)發(fā)的SMOOTH-seq方法能夠在單個(gè)細(xì)胞中高效檢測(cè)基因組結(jié)構(gòu)變異。在單個(gè)K562細(xì)胞中,當(dāng)測(cè)序深度僅為0.4X時(shí),基因組覆蓋度可達(dá)19%。該研究對(duì)91個(gè)單細(xì)胞進(jìn)行SMOOTH-seq分析,從中檢測(cè)到4,790 個(gè)缺失事件和5,589個(gè)插入事件,其中87%的缺失片段和91% 的插入片段長(zhǎng)度小于1kb,檢測(cè)到的插入事件DNA片段*長(zhǎng)達(dá)到7.7kb。同時(shí),該研究也在K562細(xì)胞中檢測(cè)到521個(gè)易位事件,包括準(zhǔn)確檢測(cè)到兩對(duì)經(jīng)典融合基因:BCR-ABL 和NUP214-XKR3。SMOOTH-seq技術(shù)對(duì)結(jié)構(gòu)變異的檢測(cè)精度高,當(dāng)使用K562大量細(xì)胞的基因組三代測(cè)序結(jié)果作為比較基準(zhǔn)時(shí),該研究中使用的K562細(xì)胞系的每個(gè)單細(xì)胞中的結(jié)構(gòu)變異檢測(cè)平均**度為75%,特別是在單個(gè)細(xì)胞中檢測(cè)插入事件平均**度為85%。此外,SMOOTH-seq 也可以以1Mb 的分辨率準(zhǔn)確檢測(cè)到兩個(gè)K562克隆之間的不同拷貝數(shù)變異(CNV)事件。
該研究開(kāi)發(fā)的SMOOTH-seq方法能夠在單個(gè)細(xì)胞中高效檢測(cè)染色體外環(huán)形DNA(ecDNA)。已有的研究報(bào)道表明,染色體外環(huán)形DNA在腫瘤發(fā)生中比較常見(jiàn),且致癌基因能夠在染色體外環(huán)形DNA中進(jìn)行大量擴(kuò)增,促進(jìn)腫瘤發(fā)生和轉(zhuǎn)移。SMOOTH-seq技術(shù)產(chǎn)生的長(zhǎng)讀長(zhǎng)數(shù)據(jù),使其能夠被用于在單個(gè)細(xì)胞中精準(zhǔn)捕獲小于10kb的全長(zhǎng)染色體外環(huán)形DNA。本研究同時(shí)開(kāi)發(fā)了用于鑒定K562細(xì)胞系中的染色體外環(huán)形DNA的生物信息學(xué)分析方法。當(dāng)僅有一個(gè)拷貝的Tn5轉(zhuǎn)座酶與一個(gè)染色體外環(huán)形DNA分子結(jié)合時(shí),整個(gè)環(huán)形DNA分子就可被完整擴(kuò)增為一個(gè)線(xiàn)性片段,即單個(gè)讀段即可覆蓋一個(gè)染色體外環(huán)形DNA分子的全長(zhǎng)序列。通過(guò)統(tǒng)計(jì)Tn5插入位置不同但長(zhǎng)度完全相同的一組讀段,即可判斷它們是否來(lái)源于同一個(gè)環(huán)形DNA。同時(shí)該特征可用于幫助精準(zhǔn)區(qū)分染色體外環(huán)形DNA和串聯(lián)重復(fù)序列(如圖3所示)。
該研究開(kāi)發(fā)的SMOOTH-seq方法能以較高準(zhǔn)確度檢測(cè)基因點(diǎn)突變(SNV)。
該研究開(kāi)發(fā)的SMOOTH-seq方法可以在結(jié)直腸癌腫瘤樣本中準(zhǔn)確檢測(cè)出各種基因組結(jié)構(gòu)變異事件。在對(duì)患者結(jié)直腸癌腫瘤樣本的分析中,以在結(jié)直腸癌的至少2個(gè)單細(xì)胞中同時(shí)檢測(cè)到為標(biāo)準(zhǔn),該研究檢測(cè)出8,594個(gè)結(jié)構(gòu)變異事件(4,089個(gè)插入事件,3,852個(gè)缺失事件,341個(gè)易位事件,以及312個(gè)重復(fù)事件)。通過(guò)將結(jié)直腸癌腫瘤樣本和K562細(xì)胞系有的結(jié)構(gòu)變異去除后,該研究共得到3,570個(gè)結(jié)直腸癌腫瘤細(xì)胞特異性的結(jié)構(gòu)變異事件(1,376 插入事件, 1,661 缺失事件, 230 易位事件以及303 重復(fù)事件)。同時(shí),該研究通過(guò)設(shè)置多個(gè)對(duì)照基因組(包括相應(yīng)的腫瘤組織、與腫瘤相鄰的正常組織、GM12878細(xì)胞系和另一個(gè)體的外周血單核細(xì)胞的基因組)對(duì)檢測(cè)出的結(jié)構(gòu)變異事件進(jìn)行了PCR驗(yàn)證。此外,該研究發(fā)現(xiàn)結(jié)直腸癌腫瘤樣本和K562細(xì)胞系有的結(jié)構(gòu)變異在所有被檢測(cè)的多個(gè)人類(lèi)基因組DNA樣品中均存在,說(shuō)明這些結(jié)構(gòu)變異事件實(shí)際上是由于當(dāng)前的人類(lèi)參考基因組不夠完善,缺失了部分關(guān)鍵序列信息引起的。今后三代測(cè)序?qū)⒂兄诮M裝出更完整精準(zhǔn)的人類(lèi)參考基因組序列(生物谷 bioon)