導(dǎo)致WGBS數(shù)據(jù)偏好產(chǎn)生的原因
隨著WGBS研究的深入,研究人員對(duì)有關(guān)數(shù)據(jù)質(zhì)量的聚合酶也提出了更高的要求。接著將KAPAU放在高背景下進(jìn)行分析,將GC均勻性細(xì)分為G和C兩種堿基,結(jié)果表明,G堿基的情況下,在眾多聚合酶中KAPA U是較均勻的,但C堿基出現(xiàn)了明顯的偏向。那么,真相到底是不是這樣呢?
事實(shí)上,如果從WGBS數(shù)據(jù)中聯(lián)想到高甲基化碎片(C含量高)被過度排序,CpG區(qū)域覆蓋率低的現(xiàn)象,那么很容易看出所有線索都是C堿基的覆蓋率有問題。如果不拘泥于PCR過程,很容易想起真正的元兇。那就是Bisulfite。
研究表明,在Bisulfite的DNA轉(zhuǎn)換過程中,甲基化修飾使C(5mC)更穩(wěn)定、更不容易斷裂,未修飾的C堿更容易破壞(圖8 A)。根據(jù)這一原理,解決了傳統(tǒng)Pre-BS WGBS數(shù)據(jù)的許多疑惑,在Bisulfite處理過程中,C含量高的CpG島地區(qū)的覆蓋率急劇下降,AT-rich的片段被過度排序,而Post-BS WGBS與項(xiàng)低的KAPAU一起使用,想想也覺得對(duì)聚合酶很委屈。事實(shí)上,我們被BISULFITT破壞了,正在放大不再存在的碎片。但是,Post-BS對(duì)聚合酶算是公平的。當(dāng)然,偏好的原因很復(fù)雜,受Bisulfite轉(zhuǎn)換效率、甲基化狀態(tài)等影響。
排序數(shù)據(jù)偏好對(duì)NGS來說是緩慢的煙霧。特別是NGS生產(chǎn)力每次運(yùn)行都能吐出TB級(jí)數(shù)據(jù)的時(shí)候,如果稍不注意,排序方法偏好高,就可以丟棄大量數(shù)據(jù)。因此,深入探索這種偏好的原因是對(duì)研究的責(zé)任,更有利于產(chǎn)業(yè)的長(zhǎng)期健康發(fā)展。
WGBS是NGS的幾個(gè)災(zāi)區(qū)之一,造成甲基化測(cè)序偏好的主要因素有兩個(gè)。一是濃縮眾所周知的文庫部時(shí)使用的PCR技術(shù),二是Bisulfite分解偏好。這個(gè)發(fā)現(xiàn)很有趣。聚丙烯是他長(zhǎng)期的“鍋”。
首先,我們來看一下PCR偏好。俗話說,聚合酶再好的文庫也出不來。(PCR-free忽略小偏題),聚合酶有兩點(diǎn)很重要。一是序列增強(qiáng)偏好,二是增強(qiáng) 效率,甲基化堿基序列分析還需要增加一個(gè)。這是關(guān)于含有dU堿模板的增強(qiáng) 效率。
在全球研究人員的長(zhǎng)期實(shí)測(cè)中,Kapahifiborasil和Pfu Turbo Cx兩種聚合酶引人注目;其中KAPA HiFi Uracil(后藥型KAPA U)聚合酶的GC偏好較低,對(duì)U擴(kuò)增效率也很理想,100ng投入量可以保證WGBS文庫在4個(gè)周期內(nèi)達(dá)到測(cè)序要求。就連Illumina也客觀地推薦了自己的甲基化捕獲試劑盒中的KAPA、HiFi、Uracil。
相關(guān)新聞
復(fù)制成功
×