中大新聞網(wǎng)訊(通訊員呂秋杰)藥物發(fā)現(xiàn)是一項(xiàng)高投入、長(zhǎng)周期、高風(fēng)險(xiǎn)的系統(tǒng)工程。當(dāng)分子生物學(xué)研究確定了與疾病相關(guān)的有效靶點(diǎn)時(shí),后續(xù)的藥物發(fā)現(xiàn)路徑就變得相對(duì)清晰。藥物發(fā)現(xiàn)中關(guān)鍵任務(wù)就是尋找一個(gè)具有良好藥理活性、低毒性和適當(dāng)藥代動(dòng)力學(xué)特性的候選分子。深度神經(jīng)網(wǎng)絡(luò)在加速和改進(jìn)藥物發(fā)現(xiàn)方面取得了令人矚目的進(jìn)展,但是這些技術(shù)依賴于大量的標(biāo)簽數(shù)據(jù)才能形成對(duì)分子特性的準(zhǔn)確預(yù)測(cè)。然而,在候選分子優(yōu)化的初始階段,新分子或類似分子并沒有太多真實(shí)的理化性質(zhì)和生物活性記錄。這表明將深度神經(jīng)網(wǎng)絡(luò)應(yīng)用于小樣本藥物發(fā)現(xiàn)仍然是一項(xiàng)科學(xué)難題。
中山大學(xué)智能工程學(xué)院智能醫(yī)療研究中心主任陳語(yǔ)謙教授團(tuán)隊(duì)提出了一種具有圖注意力網(wǎng)絡(luò)(GAT)的元學(xué)習(xí)架構(gòu)(Meta-GAT)去預(yù)測(cè)低數(shù)據(jù)藥物發(fā)現(xiàn)中的分子特性。圖注意力網(wǎng)絡(luò)通過(guò)三重注意力機(jī)制在原子層面捕獲原子團(tuán)的局部影響,從而使GAT學(xué)習(xí)原子團(tuán)對(duì)化合物性質(zhì)的影響。在分子層面,GAT將整個(gè)分子視為連接分子中每個(gè)原子的超虛擬節(jié)點(diǎn),隱含地捕捉不同原子團(tuán)之間的相互作用。雙向循環(huán)神經(jīng)網(wǎng)絡(luò)(GRU)側(cè)重于將有限的分子信息抽象或轉(zhuǎn)化為更高層次的特征向量或元知識(shí),提高了GAT感知分子中化學(xué)環(huán)境和連通性的能力,從而有效降低樣本復(fù)雜度。此外,進(jìn)一步開發(fā)了一種基于雙層優(yōu)化的元學(xué)習(xí)策略,將元知識(shí)從其他屬性預(yù)測(cè)任務(wù)遷移到低數(shù)據(jù)場(chǎng)景下的目標(biāo)任務(wù),使模型能夠快速適應(yīng)樣本少的分子屬性預(yù)測(cè)。實(shí)驗(yàn)表明,Meta-GAT 在多個(gè)公共基準(zhǔn)數(shù)據(jù)集上實(shí)現(xiàn)了對(duì)少數(shù)樣本分子新特性的準(zhǔn)確預(yù)測(cè)。這些優(yōu)勢(shì)表明 Meta-GAT 很可能成為低數(shù)據(jù)藥物發(fā)現(xiàn)的可行選擇。
圖1. 在小樣本藥物發(fā)現(xiàn)場(chǎng)景下用于分子特性預(yù)測(cè)的元學(xué)習(xí)框架。藍(lán)色框和橙色框分別代表訓(xùn)練階段和測(cè)試階段的數(shù)據(jù)流。
圖2. 基于元學(xué)習(xí)的圖注意力網(wǎng)絡(luò)架構(gòu)示意圖。
該研究為小樣本藥物發(fā)現(xiàn)提供比較可靠的推動(dòng)力,有助于從根本上解決藥物發(fā)現(xiàn)中樣本少的問(wèn)題。所提出的元學(xué)習(xí)算法通過(guò)多個(gè)預(yù)測(cè)任務(wù)訓(xùn)練一個(gè)初始化良好的參數(shù),并在此基礎(chǔ)上進(jìn)行一步或多步的梯度調(diào)整,以達(dá)到快速適應(yīng)新的只有少量數(shù)據(jù)的任務(wù)的目的。論文提出元學(xué)習(xí)算法用以解決在小樣本數(shù)據(jù)場(chǎng)景中,對(duì)小分子藥物進(jìn)行提高準(zhǔn)確度的預(yù)測(cè)所需的數(shù)據(jù)量,這種新的學(xué)習(xí)范式未來(lái)可以應(yīng)用于小樣本學(xué)習(xí)的藥物發(fā)現(xiàn)領(lǐng)域。
研究成果于2023年3月在國(guó)際著名期刊IEEE Transactions on Neural Networks and Learning Systems上發(fā)表(IF= 14.2552),題目為“Meta Learning With Graph Attention Networks for Low-Data Drug Discovery”。 中山大學(xué)智能工程學(xué)院陳語(yǔ)謙教授為該文通訊作者,智能工程學(xué)院博士生呂秋杰為第一作者。該項(xiàng)研究受到國(guó)家自然科學(xué)基金項(xiàng)目的支持。