空间多组学+机器学习模型整合揭示
乳酸驱动肺腺癌肿瘤微环境重编程
肺腺癌(LUAD)是最主要的非小细胞肺癌亚型,其肿瘤微环境复杂且空间异质性显著,导致机制解析与靶点挖掘十分困难。现有研究多聚焦单一细胞或通路,难以系统揭示代谢物、细胞亚型与分子网络的协同调控关系。虽证实乳酸与肿瘤进展相关,但对其空间分布、细胞特异性调控及多技术整合解析等关键问题,仍缺乏全景认知。
小卷今天要解析的这篇研究论文借助单细胞转录组、空间转录组、空间代谢组等多组学技术,结合TCGA生存数据与机器学习模型,揭示乳酸在肺腺癌(LUAD)中的空间异质性及细胞特异性调控作用,阐明乳酸驱动肿瘤微环境重编程的分子网络与关键靶点。
这项研究由中南大学湘雅医学院附属株洲医院、肿瘤免疫代谢研究所(TIMI)等团队联合完成,2025年12月30日发表于《npj Digital Medicine》(IF=15.1)。
1. 样本分层:选取高、低循环乳酸水平的LUAD手术样本,每组3例,进行多平台平行分析;
2. 细胞景观解析:通过单细胞转录组测序明确LUAD肿瘤微环境中的细胞类型组成,对比高/低乳酸组的细胞比例差异与差异基因表达;
3. 关键细胞亚型挖掘:对单核细胞/巨噬细胞、上皮细胞、成纤维细胞、内皮细胞等核心细胞类型进行亚型划分,分析乳酸对各亚型转录特征与分化轨迹的影响;
4. 空间维度验证:利用空间转录组技术定位不同细胞类型的空间分布,结合空间代谢组揭示乳酸及下游代谢物的空间特异性分布;
5. 多组学整合分析:关联转录组与代谢组数据,解析乳酸介导的代谢-转录调控网络;
6. 预后关联探索:结合TCGA-LUAD数据集,分析关键细胞亚型与患者生存的关联;
7. 机器学习验证:通过随机森林、弹性网回归等多种模型,鉴定调控乳酸富集状态的核心细胞类型与基因模块,构建预后相关模型。
1. 技术整合创新:首次将空间多组学技术与机器学习深度结合,实现从代谢物、细胞、分子通路到预后的全维度解析,突破传统单一组学的局限性;
2. 空间特异性突破:明确乳酸在LUAD肿瘤内的非均匀分布特征,揭示不同区域细胞对乳酸的差异化响应,填补乳酸空间调控机制的研究空白;
3. 细胞特异性机制:阐明乳酸对免疫细胞、上皮细胞、成纤维细胞、内皮细胞的精准调控路径,发现各细胞类型独特的功能重编程模式;
4. 标志物挖掘价值:鉴定出与不良预后相关的内皮细胞亚型,为LUAD的预后评估提供全新的分子标志物;
5. 多层面验证体系:通过单细胞、空间、代谢组、临床数据及多种机器学习模型交叉验证,确保研究结论的可靠性与稳健性。
多组学profiling揭示LUAD高/低乳酸组细胞景观差异
展示样本处理流程与多组学整合策略,UMAP聚类显示高/低乳酸组细胞呈现明显聚类差异;鉴定出9种主要细胞类型,高乳酸组上皮细胞、成纤维细胞占比升高,低乳酸组T/NK细胞、单核细胞/巨噬细胞富集;T/NK细胞差异基因富集于应激反应通路,免疫相关功能基因表达下调。
划分10个单核细胞/巨噬细胞亚型,高乳酸组亚型5显著富集,该亚型高表达SPP1、CCL2等促肿瘤基因;功能富集涉及糖酵解与炎症反应,低表达上皮分化及抗炎相关基因;假时间分析显示乳酸改变其分化轨迹,SPP1信号通路在高乳酸组细胞间通讯中显著激活。
鉴定11个上皮细胞亚型,高乳酸组亚型5富集,高表达KRT6A、TXN等基底样特征与应激反应相关基因;功能上增强蛋白合成与线粒体重塑,减弱肺泡分化与免疫原性;KEGG富集涉及铁死亡与p53通路,假时间分析提示乳酸诱导上皮细胞去分化与肿瘤演进相关表型。
划分5个成纤维细胞亚型,高乳酸组亚型1占比显著升高,高表达MMP1、COL11A1等基质重塑与血管生成相关基因;GO富集显示其增强促炎与细胞黏附功能,减弱免疫调控与基质组织功能;NF-κB通路激活,细胞间通讯分析显示SPP1、NOTCH等促肿瘤通路活性增强。
鉴定13个内皮细胞亚型,高乳酸组亚型1富集,高表达HSPA1B、VEGFC等血管生成与应激反应基因;功能富集涉及血管生成与基质组织,蛋白合成及应激相关通路受抑;假时间分析显示乳酸驱动内皮细胞向激活态转变,VEGF、NOTCH等促血管生成通路通讯增强。
空间转录组解析乳酸对LUAD细胞空间分布与基因表达的影响
空间转录组验证高/低乳酸组细胞组成差异,高乳酸区上皮细胞占比更高,低乳酸区成纤维细胞、单核细胞/巨噬细胞更富集;不同细胞类型差异基因涉及炎症、分化与血管生成,内皮细胞高表达血管生成相关基因,低表达分化标志物,与单细胞层面发现一致。
空间代谢组显示高乳酸组乳酸丰度显著高于低乳酸组,内皮细胞乳酸含量反而较低;高乳酸组内皮细胞上调代谢物关联自噬通路,下调代谢物涉及胆碱代谢与突触通路;揭示内皮细胞在乳酸富集环境中通过增强自噬与调整膜代谢实现功能适应。
生存分析显示内皮亚型1和9与LUAD患者不良预后显著相关,亚型1功能偏向血管生成与细胞黏附,亚型9富集应激反应相关基因;免疫荧光染色验证高乳酸组内皮细胞及血管标志物(FN1、ENG、MMP2)表达显著升高,提示乳酸诱导的内皮重编程与肿瘤恶性表型相关。
随机森林模型确认成纤维细胞和内皮细胞是乳酸富集状态的核心贡献者;弹性网回归、SVM等模型筛选出PDHB、HK2等鉴别基因,ANN模型预测AUC达0.926;基于TCGA数据构建的决策树模型可有效区分高/低风险患者,总结乳酸驱动肿瘤微环境重编程的核心网络。
觉得干货有用,点「赞 + 推荐」支持一下
转发给需要的科研伙伴,一起进步