發(fā)布時間:2025-07-17
近日,中國科學(xué)院廣州生物醫(yī)藥與健康研究院王杰課題組與廣州國家實驗室李亦學(xué)課題組合作,成功開發(fā)了一種在單細胞水平構(gòu)建調(diào)控網(wǎng)絡(luò)的新工具ScReNI(Single-cell Regulatory Network Inference)。該工具通過整合單細胞轉(zhuǎn)錄組(scRNA-seq)與單細胞染色質(zhì)可及性(scATAC-seq)數(shù)據(jù),實現(xiàn)單細胞精度的基因調(diào)控網(wǎng)絡(luò)推斷。相關(guān)研究成果以題為“ScReNI: Single-cell Regulatory Network Inference Through Integrating scRNA-seq and scATAC-seq Data”的論文形式發(fā)表于國際學(xué)術(shù)期刊《Genomics, Proteomics & Bioinformatics》。
每個細胞都具有獨特的轉(zhuǎn)錄組和染色質(zhì)可及性特征,其內(nèi)在的基因調(diào)控網(wǎng)絡(luò)也呈現(xiàn)出顯著的異質(zhì)性和細胞特異性。然而,目前仍缺乏能夠有效整合單細胞多組學(xué)數(shù)據(jù),構(gòu)建單細胞精度調(diào)控網(wǎng)絡(luò)的方法。scRNA-seq和scATAC-seq技術(shù)分別能夠在單細胞水平上測量基因表達和染色質(zhì)開放區(qū)域,二者的結(jié)合為解析精細的細胞特異性調(diào)控機制提供了新機會。無論是配對還是未配對的單細胞多組學(xué)數(shù)據(jù),都為構(gòu)建單個細胞的調(diào)控網(wǎng)絡(luò)奠定了基礎(chǔ)。盡管已有多種方法可用于推斷細胞類型特異性的調(diào)控網(wǎng)絡(luò),但在單細胞尺度上系統(tǒng)構(gòu)建基因調(diào)控關(guān)系的研究仍十分有限,特別是在整合scRNA-seq與scATAC-seq數(shù)據(jù)方面仍面臨諸多挑戰(zhàn)。
針對上述問題,研究團隊提出了一種創(chuàng)新算法ScReNI,能夠在單細胞水平上整合scRNA-seq與scATAC-seq數(shù)據(jù),實現(xiàn)細胞特異性的調(diào)控網(wǎng)絡(luò)推斷。ScReNI的核心設(shè)計思路包括以下四個關(guān)鍵步驟(圖1):
1.?多組學(xué)數(shù)據(jù)整合:利用Seurat軟件中的加權(quán)最近鄰(weighted nearest neighbor)分析方法,整合配對或未配對的scRNA-seq和scATAC-seq數(shù)據(jù);
2.?確定細胞鄰域集合:為每個細胞識別k個最近鄰細胞,作為后續(xù)調(diào)控網(wǎng)絡(luò)推斷的基礎(chǔ);
3.?在細胞鄰域內(nèi)建立非線性基因調(diào)控關(guān)系:采用改進的隨機森林模型,結(jié)合轉(zhuǎn)錄因子(TFs)活性、基因表達和染色質(zhì)可及性信息,推斷非線性調(diào)控關(guān)系;
4.?識別關(guān)鍵調(diào)控因子:基于細胞特異的調(diào)控網(wǎng)絡(luò),統(tǒng)計識別每個細胞中的富集調(diào)控因子,揭示其在不同生物過程中的潛在作用機制。
ScReNI利用鄰近細胞的信息模擬局部調(diào)控環(huán)境,并通過機器學(xué)習(xí)方法挖掘基因表達與染色質(zhì)可及性之間的復(fù)雜關(guān)聯(lián),從而構(gòu)建個性化的調(diào)控網(wǎng)絡(luò)。評估結(jié)果顯示,ScReNI在調(diào)控關(guān)系預(yù)測和細胞聚類任務(wù)中均表現(xiàn)出優(yōu)異性能,同時還能識別出每個細胞中的關(guān)鍵調(diào)控因子,為深入理解單細胞層面的功能調(diào)控機制提供了有力支持。
中國科學(xué)院廣州生物醫(yī)藥與健康研究院的助理研究員徐雪麗、碩士研究生梁嫣然以及博士研究生湯杪庥為本研究的共同第一作者;廣州國家實驗室李亦學(xué)研究員和中國科學(xué)院廣州生物醫(yī)藥與健康研究院王杰研究員為共同通訊作者。研究工作得到了國家自然科學(xué)基金、國家重點研發(fā)計劃以及廣東省科技研發(fā)專項的支持。
圖1 ?ScReNI流程圖
附件下載: