基因組DNA和組蛋白以特定的形式高度折疊在細(xì)胞核中,這一**結(jié)構(gòu)即三維基因組學(xué),對(duì)細(xì)胞核內(nèi)的諸多生命活動(dòng)至關(guān)重要。基于染色質(zhì)構(gòu)象捕獲(3C),尤其是高通量技術(shù)(Hi-C,ChIA-PET)的發(fā)展推動(dòng)了三維基因組的研究,發(fā)現(xiàn)了包括染色質(zhì)拓?fù)湎嚓P(guān)結(jié)構(gòu)域(TAD),染色質(zhì)環(huán)等一系列層次化的結(jié)構(gòu)特征。近年來,單細(xì)胞水平下的Hi-C研究成為三維基因組的重要研究方向。單細(xì)胞Hi-C數(shù)據(jù)對(duì)深入理解染色質(zhì)結(jié)構(gòu)的動(dòng)力學(xué)機(jī)制,建立高分辨率細(xì)胞發(fā)育圖譜都具有重要意義。然而,單細(xì)胞Hi-C數(shù)據(jù)由于極度稀疏,目前主流的Hi-C數(shù)據(jù)分析算法對(duì)其無能為力,而針對(duì)單細(xì)胞Hi-C設(shè)計(jì)的算法亦表現(xiàn)不佳。因此,亟須新的計(jì)算方法來分析鑒定單細(xì)胞內(nèi)的染色質(zhì)**結(jié)構(gòu)。
中國(guó)科學(xué)院北京基因組研究所(國(guó)家生物信息中心)張治華研究組開發(fā)了預(yù)測(cè)單細(xì)胞內(nèi)類TAD結(jié)構(gòu)的算法deTOKI。相關(guān)研究成果以DeTOKI identifies and characterizes the dynamics of chromatin TAD-like domains in a single cell為題,發(fā)表在Genome Biology上。
該研究將deTOKI與適用于低分辨率水平Hi-C數(shù)據(jù)的新算法IS、deDoc、SpectralTAD、GRiNCH,以及先由單細(xì)胞Hi-C實(shí)驗(yàn)數(shù)據(jù)通過預(yù)測(cè)出高分辨率數(shù)據(jù),再由已有算法鑒定類TAD域結(jié)構(gòu)的新算法scHiCluster及Higashi六個(gè)軟件進(jìn)行綜合比較,發(fā)現(xiàn)用deTOKI分析單細(xì)胞Hi-C數(shù)據(jù)結(jié)果優(yōu)于其他六個(gè)軟件。研究比較的內(nèi)容主要基于兩點(diǎn),首先是將高分辨率水平的Hi-C數(shù)據(jù)進(jìn)行下采樣,比較下采樣數(shù)據(jù)和原始數(shù)據(jù)中鑒定的類TAD域結(jié)構(gòu)的相似度,然后對(duì)染色質(zhì)結(jié)構(gòu)進(jìn)行三維建模,對(duì)各個(gè)模型分別生成高分辨率水平和單細(xì)胞水平的模擬Hi-C數(shù)據(jù),比較兩個(gè)數(shù)據(jù)中鑒定的類TAD域結(jié)構(gòu)的相似度。該研究還在已有的單細(xì)胞Hi-C實(shí)驗(yàn)數(shù)據(jù)上使用模塊系數(shù)和結(jié)構(gòu)熵等指標(biāo)來評(píng)價(jià)軟件的表現(xiàn),deTOKI均優(yōu)于其他算法。
新算法deTOKI有助于未來的單細(xì)胞內(nèi)染色質(zhì)**結(jié)構(gòu)的研究,基于deTOKI算法,研究發(fā)現(xiàn)了單細(xì)胞內(nèi)的類TAD域結(jié)構(gòu)和細(xì)胞類型的關(guān)系,以及其與組蛋白修飾、DNA甲基化等多組學(xué)數(shù)據(jù)的關(guān)聯(lián)。該研究豐富了關(guān)于基因組結(jié)構(gòu)和功能關(guān)系的認(rèn)識(shí),為三維基因組學(xué)研究提供了新思路。(生物谷Bioon.com)