中大新聞網訊(通訊員呂秋杰)藥物發現是一項高投入、長周期、高風險的系統工程。當分子生物學研究確定了與疾病相關的有效靶點時,后續的藥物發現路徑就變得相對清晰。藥物發現中關鍵任務就是尋找一個具有良好藥理活性、低毒性和適當藥代動力學特性的候選分子。深度神經網絡在加速和改進藥物發現方面取得了令人矚目的進展,但是這些技術依賴于大量的標簽數據才能形成對分子特性的準確預測。然而,在候選分子優化的初始階段,新分子或類似分子并沒有太多真實的理化性質和生物活性記錄。這表明將深度神經網絡應用于小樣本藥物發現仍然是一項科學難題。
中山大學智能工程學院智能醫療研究中心主任陳語謙教授團隊提出了一種具有圖注意力網絡(GAT)的元學習架構(Meta-GAT)去預測低數據藥物發現中的分子特性。圖注意力網絡通過三重注意力機制在原子層面捕獲原子團的局部影響,從而使GAT學習原子團對化合物性質的影響。在分子層面,GAT將整個分子視為連接分子中每個原子的超虛擬節點,隱含地捕捉不同原子團之間的相互作用。雙向循環神經網絡(GRU)側重于將有限的分子信息抽象或轉化為更高層次的特征向量或元知識,提高了GAT感知分子中化學環境和連通性的能力,從而有效降低樣本復雜度。此外,進一步開發了一種基于雙層優化的元學習策略,將元知識從其他屬性預測任務遷移到低數據場景下的目標任務,使模型能夠快速適應樣本少的分子屬性預測。實驗表明,Meta-GAT 在多個公共基準數據集上實現了對少數樣本分子新特性的準確預測。這些優勢表明 Meta-GAT 很可能成為低數據藥物發現的可行選擇。
圖1. 在小樣本藥物發現場景下用于分子特性預測的元學習框架。藍色框和橙色框分別代表訓練階段和測試階段的數據流。
圖2. 基于元學習的圖注意力網絡架構示意圖。
該研究為小樣本藥物發現提供比較可靠的推動力,有助于從根本上解決藥物發現中樣本少的問題。所提出的元學習算法通過多個預測任務訓練一個初始化良好的參數,并在此基礎上進行一步或多步的梯度調整,以達到快速適應新的只有少量數據的任務的目的。論文提出元學習算法用以解決在小樣本數據場景中,對小分子藥物進行提高準確度的預測所需的數據量,這種新的學習范式未來可以應用于小樣本學習的藥物發現領域。
研究成果于2023年3月在國際著名期刊IEEE Transactions on Neural Networks and Learning Systems上發表(IF= 14.2552),題目為“Meta Learning With Graph Attention Networks for Low-Data Drug Discovery”。 中山大學智能工程學院陳語謙教授為該文通訊作者,智能工程學院博士生呂秋杰為第一作者。該項研究受到國家自然科學基金項目的支持。