中大新聞網(wǎng)訊(通訊員熊麗娜)在成熟的多細(xì)胞生物體內(nèi),具有特定功能的細(xì)胞群通常源自于一組祖先細(xì)胞。細(xì)胞群體的譜系多樣性是由這些祖細(xì)胞的數(shù)量決定的,因此估計(jì)祖先細(xì)胞群體數(shù)量是發(fā)育生物學(xué)的重要研究問題之一。而傳統(tǒng)的研究手段主要依賴于組織特異性的啟動(dòng)子介導(dǎo)報(bào)告基因的表達(dá),進(jìn)而對(duì)目標(biāo)細(xì)胞群體進(jìn)行計(jì)數(shù)。這一類研究手段的可靠性高度依賴于啟動(dòng)子的選擇,其中,啟動(dòng)子的組織特異性與時(shí)空表達(dá)動(dòng)態(tài)都會(huì)使估計(jì)結(jié)果產(chǎn)生偏差。
2024年2月20日,中山大學(xué)生命科學(xué)學(xué)院賀雄雷課題組在Nature Methods上發(fā)表了一篇題為A statistical method for quantifying progenitor cells reveals incipient cell fate commitments的研究文章。該研究基于近年來逐漸成熟的細(xì)胞譜系追蹤技術(shù)構(gòu)建的發(fā)育細(xì)胞譜系樹 (developmental cell phylogeny),結(jié)合群體遺傳學(xué)的經(jīng)典溯祖理論 (coalescent theory) 思想,建立了一種估計(jì)祖先細(xì)胞群體大小的統(tǒng)計(jì)方法TarCA (targeting coalescent analysis),以此來研究胚胎發(fā)育過程中細(xì)胞群體的動(dòng)態(tài)變化。
給定一顆包含多種細(xì)胞類型的細(xì)胞譜系樹,它的末端節(jié)點(diǎn)代表了被采樣的細(xì)胞,而中間節(jié)點(diǎn)則表示祖先細(xì)胞。如果一個(gè)中間節(jié)點(diǎn)的所有子代細(xì)胞均為相同的細(xì)胞類型,研究人員將其定義為細(xì)胞類型特異的單系分支 (monophyletic clade)。隨后,研究人員根據(jù)單系分支的大小分布計(jì)算出隨機(jī)兩個(gè)細(xì)胞均來自同一單系分支的概率,而該類型細(xì)胞的祖先細(xì)胞群體數(shù)量即為該概率的倒數(shù)(圖1)。
圖1 估計(jì)祖先細(xì)胞數(shù)目的傳統(tǒng)方法與TarCA
通過計(jì)算機(jī)模擬數(shù)據(jù),該研究發(fā)現(xiàn),與對(duì)單系分支進(jìn)行直接計(jì)數(shù)的方法相比,TarCA對(duì)采樣率要求更低,并且在實(shí)驗(yàn)噪音存在時(shí)仍能夠快速收斂。這是因?yàn)樵赥arCA算法中,子代細(xì)胞數(shù)量較少的祖先細(xì)胞權(quán)重較低,從而TarCA能穩(wěn)定地估計(jì)出對(duì)子代細(xì)胞群體做出主要貢獻(xiàn)的祖先細(xì)胞數(shù)量。隨后,研究人員在線蟲、果蠅與小鼠的細(xì)胞譜系數(shù)據(jù)中,驗(yàn)證了TarCA在處理真實(shí)生物學(xué)數(shù)據(jù)中的可靠性。以小鼠為例,研究人員發(fā)現(xiàn)不同組織的祖先細(xì)胞群體數(shù)量在個(gè)體間高度一致。另外,除采樣獲得的終末細(xì)胞類型外,TarCA還能對(duì)發(fā)育初期的胚胎結(jié)構(gòu)(如三胚層及胚外組織等)的祖先細(xì)胞群體數(shù)量進(jìn)行估計(jì),進(jìn)一步證明了TarCA的可靠性與泛用性。
最后,研究人員還將TarCA拓展至早期細(xì)胞命運(yùn)決定過程的研究中。在細(xì)胞命運(yùn)決定的初期,群體內(nèi)部僅有小部分驅(qū)動(dòng)基因的表達(dá)發(fā)生了變化,在全轉(zhuǎn)錄組水平依然保持穩(wěn)定;隨著細(xì)胞命運(yùn)決定的進(jìn)行,細(xì)胞群體內(nèi)逐漸產(chǎn)生全轉(zhuǎn)錄組水平的表達(dá)差異。如何在基因水平,而非全轉(zhuǎn)錄組水平,對(duì)基因表達(dá)在細(xì)胞群體中的異質(zhì)性進(jìn)行檢測,是研究早期細(xì)胞命運(yùn)決定過程的關(guān)鍵難題(圖2)。為此,該研究使用TarCA算法對(duì)基因表達(dá)水平在細(xì)胞譜系樹上的異質(zhì)性進(jìn)行了評(píng)估,識(shí)別出了表達(dá)水平與細(xì)胞分裂歷史事件偶聯(lián)的基因(lineage-specific upregulated genes, LUGs)。以小鼠早期胚胎的腸管細(xì)胞為例,研究人員篩選出了155個(gè)LUGs,其中包含眾多標(biāo)記前、中、后腸的明星基因。根據(jù)LUGs在不同細(xì)胞中的表達(dá)情況,研究人員進(jìn)一步構(gòu)建出小鼠腸管向下游器官分化過程的層級(jí)模型。該模型指出,胰腺、小腸與結(jié)腸間存在共享的祖先狀態(tài),與體外定向分化實(shí)驗(yàn)結(jié)果一致。
圖2 定義細(xì)胞命運(yùn)分配過程中的LUGs
總的來說,該研究開發(fā)的TarCA算法可對(duì)任意細(xì)胞群體估計(jì)祖先細(xì)胞數(shù)目,而無需事先獲得祖細(xì)胞的先驗(yàn)信息,也能推算少數(shù)細(xì)胞中的驅(qū)動(dòng)基因,以此來預(yù)測早期細(xì)胞命運(yùn)的分化傾向。這些發(fā)現(xiàn)說明TarCA能促進(jìn)包括人類在內(nèi)的所有復(fù)雜生物組織的譜系多樣性的量化,對(duì)其建立定量模型至關(guān)重要,可以幫助人們解決個(gè)體發(fā)育可塑性和衰老相關(guān)的組織功能退化的問題。這項(xiàng)工作是經(jīng)典進(jìn)化生物學(xué)與現(xiàn)代細(xì)胞發(fā)育生物學(xué)融合的一個(gè)典范。
中山大學(xué)生命科學(xué)學(xué)院賀雄雷教授為該論文的通訊作者,課題組博士后鄧善俊與博士畢業(yè)生龔晗為共同第一作者。該研究得到了國家重點(diǎn)研發(fā)計(jì)劃與國家自然科學(xué)基金的資助。
論文鏈接:https://www.nature.com/articles/s41592-024-02189-7
TarCA算法工具鏈接:https://github.com/shadowdeng1994/TarCA