
準(zhǔn)確和靈敏地檢測(cè)罕見(jiàn)突變,對(duì)于CRISPR基因組編輯技術(shù)的安全應(yīng)用和癌癥的早期診斷等一系列研究具有重要意義。雖然現(xiàn)有的高通量測(cè)序技術(shù)已經(jīng)有了長(zhǎng)足的進(jìn)步,但是目前由于建庫(kù)和測(cè)序過(guò)程中導(dǎo)致的錯(cuò)誤還是在所難免,所以難以檢測(cè)到大量樣品中的罕見(jiàn)突變【1】。尤其對(duì)于罕見(jiàn)的復(fù)雜結(jié)構(gòu)變異,還沒(méi)有有效的檢測(cè)和定量的方法。納米孔測(cè)序(Nanopore sequencing)的長(zhǎng)讀長(zhǎng)優(yōu)勢(shì),有利于檢測(cè)復(fù)雜的結(jié)構(gòu)變異,但由于其自身的高錯(cuò)誤率(~8%),很難用于罕見(jiàn)突變檢測(cè)。近期研究表明CRISPR/Cas9基因編輯除了會(huì)在目標(biāo)位點(diǎn)導(dǎo)致小范圍的DNA序列突變,也有可能會(huì)產(chǎn)生長(zhǎng)達(dá)數(shù)千堿基的DNA刪除或其它結(jié)構(gòu)變異【2】。這類之前未被重視的復(fù)雜的大范圍變異引發(fā)了對(duì)CRISPR/Cas9基因編輯安全性的質(zhì)疑。但由于其發(fā)生的頻率通常較低且范圍廣,不容易被短讀長(zhǎng)的二代測(cè)序檢測(cè)到,針對(duì)此類突變的研究一度陷入僵局。
2020年8月25日,沙特阿拉伯阿卜杜拉國(guó)王科技大學(xué)(KAUST)生物與環(huán)境科學(xué)工程學(xué)院的李墨(Mo Li)教授和北京大學(xué)生物醫(yī)學(xué)前沿創(chuàng)新中心(BIOPIC)、北京未來(lái)基因診斷高精尖創(chuàng)新中心(ICG)的黃巖誼教授合作在Genome Biology上發(fā)表了題為L(zhǎng)ong-read individual-molecule sequencing reveals CRISPR-induced genetic heterogeneity in human ESCs的文章【3】。該研究提出了一種基于分子標(biāo)簽(unique molecular identifier, UMI)的單分子標(biāo)記技術(shù)(targeted Individual DNA Molecule Sequencing, IDMseq),用于定量的檢測(cè)樣品中的罕見(jiàn)突變,包括單堿基突變以及大范圍的復(fù)雜的結(jié)構(gòu)變異。

研究團(tuán)隊(duì)利用分子標(biāo)簽定向的標(biāo)記樣品中目標(biāo)基因的原始DNA分子,之后利用PCR的方式擴(kuò)增標(biāo)記到的分子用以測(cè)序。該技術(shù)配套的數(shù)據(jù)分析算法VAULT(variant analysis with unique molecular identifier for long-read technology)可以從測(cè)序結(jié)果中發(fā)現(xiàn)并提取分子標(biāo)簽,然后利用分子標(biāo)簽將測(cè)序的數(shù)據(jù)(read)分組。每個(gè)組都代表初始體系中的一個(gè)DNA分子,于是可以利用同一個(gè)組內(nèi)的所有數(shù)據(jù)進(jìn)行測(cè)序糾錯(cuò),從而得到高精度的突變結(jié)果。該技術(shù)廣泛適用于當(dāng)前的主流高通量測(cè)序平臺(tái),包括Illumina, PacBio 和Nanopore。研究表明運(yùn)用該技術(shù)后,高錯(cuò)誤率的Nanopore測(cè)序可以提供媲美Illumina的罕見(jiàn)突變檢測(cè)效果,準(zhǔn)確的檢測(cè)到了預(yù)設(shè)的1:100、1:1000、1:10000的罕見(jiàn)點(diǎn)突變并正確的報(bào)告出該突變的頻率。

研究團(tuán)隊(duì)之后利用該技術(shù)檢測(cè)CRISPR/Cas9基因編輯引起的突變。團(tuán)隊(duì)通過(guò)IDMseq技術(shù)對(duì)Cas9酶切位點(diǎn)附近的7-8kb范圍進(jìn)行測(cè)序。研究表明,在Cas9編輯后的人多顯能胚胎干細(xì)胞(hESC)中, 2.8-5.4% 的DNA分子存在大刪除突變。發(fā)現(xiàn)的最長(zhǎng)刪除的距離超過(guò)5.5kb。其中很多刪除突變發(fā)生在相同的位點(diǎn),表明可能存在這類突變的熱區(qū)。除大范圍的突變外,在基因編輯的區(qū)域DNA點(diǎn)突變數(shù)量增加了三倍。值得注意的是,這些點(diǎn)突變頻率很低(<1%),因而很難被常規(guī)測(cè)序方法捕捉到。研究團(tuán)隊(duì)的這一系列發(fā)現(xiàn),增加了對(duì)CRISPR/Cas9基因編輯安全性的認(rèn)識(shí),同時(shí)也為后續(xù)相關(guān)研究提供了方法支撐。
據(jù)悉,沙特阿拉伯阿卜杜拉國(guó)王科技大學(xué)(KAUST)生物與環(huán)境科學(xué)工程學(xué)院的畢重偉和王琳(現(xiàn)就職于吉林大學(xué)人獸共患病研究所)為本文的共同第一作者。沙特阿拉伯阿卜杜拉國(guó)王科技大學(xué)(KAUST)生物與環(huán)境科學(xué)工程學(xué)院的李墨(Mo Li)教授和北京大學(xué)的黃巖誼教授為本文的共同通訊作者。此研究也得到了阿卜杜拉國(guó)王科技大學(xué)計(jì)算生物學(xué)研究中心的高欣教授的支持。
郵政編碼:200052 電話:021-63800152 傳真:021-63800151 京ICP備15010734號(hào)-10 技術(shù):網(wǎng)至普網(wǎng)站建設(shè)