中大新聞網(wǎng)訊(通訊員張玉琦)人工智能是當(dāng)前推動醫(yī)學(xué)領(lǐng)域研究創(chuàng)新的重要支撐,大模型在醫(yī)學(xué)領(lǐng)域的研究應(yīng)用,為智能醫(yī)學(xué)的發(fā)展提供了新思路和方法。大語言模型通過分析海量文本數(shù)據(jù)來掌握和生成人類語言,而知識圖譜補全則利用這些模型來增強和完善醫(yī)學(xué)領(lǐng)域的知識圖譜,填補其中的信息空白。在醫(yī)學(xué)領(lǐng)域,知識圖譜包含了豐富的醫(yī)學(xué)實體和它們之間的復(fù)雜關(guān)系,支持診斷、治療決策和研究等多種應(yīng)用。通過知識圖譜補全,可以有效擴展醫(yī)學(xué)知識的深度和廣度,提高圖譜的準(zhǔn)確性和覆蓋范圍。這不僅提升了醫(yī)療系統(tǒng)的智能化程度,對提高病例處理效率和精確度,以及促進(jìn)個性化醫(yī)療方案的制定有重要意義。
近日,中山醫(yī)學(xué)院周毅教授團隊在中科院一區(qū)TOP期刊Knowledge-Based Systems在線發(fā)表題為《Enhancing text-based knowledge graph completion with zero-shot large language models: A focus on semantic enhancement》的研究論文。該論文提出了一種新的知識圖譜補全框架CP-KGC,該框架結(jié)合了大語言模型的能力。通過設(shè)計通用的提示(prompts)以適應(yīng)不同數(shù)據(jù)集。CP-KGC框架旨在增強文本語義的表達(dá)能力,大量實驗證明了該框架的有效性。此外,CP-KGC框架還采用了上下文約束策略,有效解決了知識圖譜補全數(shù)據(jù)集中常見的一詞多義問題。即使在對大模型進(jìn)行量化處理后,Qwen-7B-Chat-int4模型仍然提升了基于文本的傳統(tǒng)KGC方法的性能。這項研究不僅突破了現(xiàn)有模型的性能瓶頸,還進(jìn)一步促進(jìn)了知識圖譜與大語言模型的深度融合。通過集成這些先進(jìn)技術(shù),可期待醫(yī)療行業(yè)在處理復(fù)雜病例、提高治療效率和推動定制化醫(yī)療解決方案方面取得顯著進(jìn)展。
該論文中山醫(yī)學(xué)院周毅教授為通訊作者,方立副教授為該論文共同通訊作者。博士研究生楊瑞為本文第一作者。
論文鏈接:https://www.sciencedirect.com/science/article/pii/S0950705124007895