中大新聞網訊(通訊員盧建國)脊椎動物進化中的基因復制事件普遍存在,它們在獲得新基因和新性狀方面發揮著重要作用。而全基因組復制(WGD)可以通過增加基因組的靈活性和復雜性為自然選擇提供重要原料,是基因復制的重要來源之一。此外,WGD也是脊椎動物進化的驅動力,對物種,特別是具有復雜WGD模式的魚類物種多樣性有很大貢獻(圖1)。
圖1 魚類脊椎動物種類及其基因組復制格局
近年來,測序和組裝技術的進步使得魚類物種的全基因組數據呈現出快速增長的趨勢。近5年來(2017-2021),NCBI數據庫中的真骨下綱 (Teleostei) 魚類的基因組裝配(Assembly)數量已從136個增長到1455個,增幅近970%。在數據大爆發的背景下,現有的分析工具和平臺已經無法滿足研究者日益增長的魚類基因組和多倍體化的分析需求。
最近,中山大學海洋科學學院盧建國副教授研究團隊成功構建了基因-基因組共線性和WGD研究DupScan數據庫和一站式分析平臺(https://dupscan.sysumeg.com/)。該數據庫通過整合106個染色體高質量基因組,實現了基因和基因組尺度的共線性區域的可視化分析。此外,DupScan還搭載了全基因組瀏覽器和BLAST功能基因染色體定位,支持包括VGD2(Vertebrate Genome Duplication2)、Ars3R(Acipenser ruthenus specific 3R)、Pss3R(Polyodon-spathula specific 3R)、Ts3R(Teleost specific 3R)、Ss4R(Salmon specific 4R)以及Cs4R(Comon carp specific 4R)等共5類WGD事件分析。用戶可以使用該平臺實現106種全基因組序列的共線性和WGD模式在線分析和預測,為60,000多種世界脊椎動物基因組復制格局提供了高效的在線分析工具(圖2)。
圖2 DupScan數據庫的架構與核心功能
所建立的DupScan庫具有數據規模大、質量高、便捷性和可拓展性好等特點,它不僅可服務于脊椎動物基因組進化和全基因組復制事件研究,而且也可廣泛應用于其他涉及脊椎動物基因組,如染色體結構變異、同源區域(基因)查找、基因家族預測、基因組瀏覽以及KaKs/4DTV查詢等工作。同時,DupScan數據庫不僅可以加深我們對生物進化驅動力、倍性與生物性狀之間以及基因拷貝數與競爭力之間的關系等方面的理解,還可以為經濟魚類分子遺傳育種和品種培育工作提供重要數據平臺。
以上研究成果于2022年8月10日發表在期刊Nucleic Acids Research,題目為“DupScan: Predicting and visualizing vertebrate genome duplication database”,中山大學海洋科學學院盧建國副教授為論文第一作者和通訊作者,碩士研究生黃沛霖為第二作者,南開大學計算機學院劉健教授為共同通訊作者。該研究得到了國家自然科學基金項目和南方海洋科學與工程廣東省實驗室(珠海)創新團隊建設項目的支持。