中大新聞網訊(通訊員駱觀正)目前生物界中已經有超過150多種的RNA修飾堿基被報道,其中N6-甲基腺嘌呤(m6A)在脊椎動物中含量最為豐富,也是被研究得最為透徹的一種修飾堿基。目前檢測m6A主要是基于二代測序的方法,這些方法存在假陽性、操作復雜以及僅限于位點檢測等問題。于是納米孔測序技術(Oxford Nanopore Technologies,ONT)成為了一種理想的取代方法。ONT測序平臺根據監測單個分子在合成聚合物膜嵌入的納米孔中穿過時引起的電流變化直接測序DNA或RNA,修飾堿基穿孔產生的電流可能與對應的經典堿基有所不同,因此可以根據檢測到的電流差異來檢測包括m6A在內的修飾堿基。自那時起,已經有十余種計算工具被開發出來(圖1),用于從直接RNA測序(Direct RNA Sequencing,DRS)中鑒定m6A的位置以及確定其化學計量。
圖1 利用ONT DRS平臺實現m6A檢測的工具、流程以及分類
盡管已開發出許多高度復雜、先進的計算工具來檢測和量化m6A,但目前仍缺乏對這些工具進行徹底評估和比較的研究。為填補這一空白,中山大學生命科學學院駱觀正教授課題組展開相關研究。
本研究利用多物種多重復(小鼠胚胎細胞和擬南芥各兩個重復)樣本為評估數據,以多種驗證集對這些工具進行了全面評估(圖2),包括使用兩個連續評估指標(接受者操作特征(Receiver Operating Characteristic,ROC)和精確度-召回率(Precision Recall,PR)曲線)對它們的性能進行了定量評估,比較了它們檢測出的top位點的精確度,以及它們在最優閾值下檢測出的位點的準確度,召回率以及F1得分。結果發現大多數工具在精確度和召回率之間存在權衡
圖2 檢測m6A的ONT工具能力的性能評價
除此之外,本研究還評估了這些工具在檢測過程中的內在偏差,并證明引入負對照樣本可以提高大多數工具的性能。此外,還發現檢測能力在不同的motif之間存在差異,這是因為在某些序列上,電流差異不容易被檢測到。對于可以對m6A進行定量的工具,在它們的計量估計中觀察到了廣泛的差異,即使在某些motif中可以獲得可接受的結果。測序深度和修飾的化學計量也是另外兩個重要的影響因素(圖3)。
圖3 檢測m6A的ONT工具的進一步分析
綜上所述,研究為目前用于基于ONT DRS數據檢測m6A的計算工具提供了深入的見解,并強調了進一步改進這些工具的潛力,這些可能會成為未來研究的基礎。以上研究成果以“Systematic comparison of tools used for m6A mapping from nanopore direct RNA sequencing”為題,于2023年4月5日在Nature Communications雜志發表。中山大學生命科學學院研究生鐘振東和謝應源為文章的共同第一作者,駱觀正教授和張璋副教授為通訊作者。中山大學生命科學學院為第一作者單位。本工作受到科技部重點研發項目、國家自然科學基金及深圳灣學者項目的資助。