近年來,腫瘤的研究與診療進入大數據時代,相關大數據庫的開發和應用為揭示腫瘤發生發展的分子機理、探索新的診療手段和實現數據資源的開放共享提供了堅實的基礎。
我校腫瘤防治中心徐瑞華教授團隊近年來著力于建設消化系統腫瘤的大數據平臺,通過整合腫瘤臨床信息、影像數據、生物樣本庫數據、高通量生物多組學的數據,系統地構建消化系統腫瘤大數據,并結合人工智能平臺進行大數據的挖掘與分析。該團隊基于腫瘤大數據平臺開展腫瘤臨床診療的真實世界研究,探索腫瘤的精準診斷、預后預測和耐藥分子機制,取得了一系列的研究成果,相關論文發表在Nature Materials,Gut等一系列國際權威學術期刊上。
最近,徐瑞華教授團隊構建了蛋白質磷酸化定量數據庫qPhos(網址:http://qphos.cancerbio.info)。作為腫瘤大數據平臺的一部分,qPhos數據庫的建立將為腫瘤精準診療研究提供重要的數據資源。
蛋白芯片
蛋白質的動態磷酸化修飾是細胞重要的信號轉導分子機制,調控著廣泛的生物學過程,在腫瘤的發生發展過程中發揮著重要的作用。作為調控磷酸化動態水平的關鍵因子,蛋白激酶和磷酸酶已成為腫瘤精準診療的分子標志物和靶向治療的重要靶點。隨著高通量蛋白質組學技術的發展,既往的研究工作積累了大量的磷酸化組學數據。雖然有數據庫整合了磷酸化位點的信息,但是其動態定量數據卻散落在文獻中而難以被查詢、獲取和利用。因此,收集已發表的定量磷酸化組數據并整合為一個綜合的蛋白磷酸化定量數據庫將為腫瘤和其他疾病相關的磷酸化信號通路研究提供極大的幫助。
自2016年開始,腫瘤防治中心徐瑞華教授團隊開始著手構建磷酸化定量數據庫qPhos。通過收集已發表的定量磷酸化組數據,共整合了199071個磷酸化位點上的3537533個定量磷酸化信息,其中86%的數據來自腫瘤組織樣本及相關細胞系。有關定量實驗的詳細信息,包括實驗條件、實驗所用的細胞系或樣本等數據也納入了數據庫中。對每個磷酸化位點,都注釋了實驗驗證的或潛在的上游激酶,以便理解其分子調控機制。同時,通過整合UniProt,ExPASy和DrugBank等數據庫中的信息,對磷酸化位點所在蛋白質的生化特征、上游激酶的靶向藥物情況進行了詳細的注釋,方便查詢和使用。
此外,數據庫中還開發了qKinAct分析模塊,研究人員可以基于自己的定量磷酸化組數據分析得到相應的激酶活性相關磷酸化位點信息,進而分析異常的磷酸化信號通路。因此,qPhos是首個全面涵蓋腫瘤和疾病相關重要磷酸化修飾動態水平的數據庫,為研究蛋白磷酸化修飾及其動態調控提供了一站式服務。
該項研究結果于北京時間2018年11月1日以題為“qPhos:一個人類蛋白質磷酸化動態修飾的數據庫”的文章發表于生物信息學領域國際頂級學術期刊核酸研究(Nucleic Acid Research,影響因子11.561)上(文章鏈接請點擊文末閱讀原文)。徐瑞華教授和劉澤先副研究員為文章的通訊作者,余凱、張青峰、劉澤坤三位碩士研究生和趙齊博士為共同第一作者。
論文鏈接:https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gky1052/5150235