天然产物和中药复方的成分识别一直是一块“硬骨头”。高分辨质谱(HRMS)虽然灵敏度高,但海量的冗余数据、杂质干扰和繁琐的手工注释,常常让科研人员“望谱兴叹”。 近日,权威学术期刊《Microchemical Journal》发表了一项最新研究成果 :研究团队开发了一种基于 Python 的多边形质量亏损过滤(MDF)策略,并结合基于特征的分子网络(FBMN)技术,成功实现了黄芪叶中黄酮和三萜类成分的超高选择性、可视化快速挖掘与鉴定。这一高效工作流为天然产物复杂体系的深度解析提供了全新范式 !科研痛点:数据海量,如何精准挑出目标成分?
在利用 UHPLC-HRMS 进行非靶向代谢组学或成分分析时,原始数据往往包含数千甚至上万个离子信号 。然而:1 基质干扰严重,充斥着大量非目标产物的杂质峰 。2 传统人工注释极其耗时,且极易漏掉潜在的新化合物 3 传统的分子网络(MN)虽然能实现可视化聚类,但如果直接导入未过滤的原始数据,庞大的无效信息会导致网络臃肿,显著降低识别效率。为了打破这一僵局,研究人员巧妙地引入了 Python 编程。核心技术:Python + FBMN 的“双剑合璧”
本研究以黄芪叶(Astragalus membranaceus leaves)为研究对象 ,构建了一套极具创新性的可视化分析工作流 :
第一步:自定义 Python 脚本,构建多边形 MDF 窗
研究团队首先收集了已知黄芪属成分的分子结构,分析其羟基化、脱氢、甲基化等规律 。利用Python 编写程序,在二维坐标系(Integer Mass vs. Decimal Mass)中绘制出精准的多边形 MDF 过滤窗口 。
成果:原始数据中收集到 8362 个前体离子,通过具有 MS/MS 谱图的条件初筛及 Python 多边形 MDF 窗口 + 氮规则的强力洗礼,直接将候选离子精简至 391 个 !直接过滤掉绝大多数杂质干扰 。
第二步:GNPS 分子网络传播与可视化
将过滤后的精简数据上传至 GNPS 平台构建基于特征的分子网络(FBMN)。结构相似的化合物在质谱下具有相似的碎片裂解行为,它们在网络中会自动聚集为“信号簇”(Clusters)。
效率暴增:相比传统未过滤的 FBMN,新策略将化合物的准确鉴定率从 14.5% 飙升至 43.0%! 研究发现:黄芪叶化学谱图大曝光(含95个潜在新化合物!)利用上述高选择性方法,研究团队在黄芪叶中系统解析出 168 个成分,其中包括117 种黄酮类和 51 种三萜类化合物 : 标准品比对与文献匹配:16个黄酮和8个三萜通过对照品彻底明确,另有73个成分与历史文献完美匹配 。 新化合物挖掘:基于分子网络的谱图传播规律,解析出95 个潜在的全新化合物(60个未知黄酮,35个未知三萜)!这项研究证明,“数据学(Python)+ 现代质谱(HRMS)+ 生物信息学(GNPS分子网络)”的跨界融合,能够极大精简天然产物复杂体系的数据处理流程,让未知化合物的发现变得“有迹可循” 。这种高效的工作流不仅适用于中药谱效学研究,还能广泛扩展到环境、食品和生物样本的复杂代谢物鉴定中 。
感兴趣可以私信获取文献
粉丝福利:还在为代谢组学数据发愁?我们帮你搞定!
看到这里,你是不是也想把这项高大上的技术应用到自己的课题中? 别慌!你不需要突击学 Python,也不需要死磕质谱裂解规律!
我们为您提供【天然产物/代谢组学测试分析+GNPS分子网络代做】一条龙全包服务!
欢迎后台留言或扫描下方二维码咨询,获取属于您的专属数据解析方案! (咨询时备注“公众号”可享专属测样/分析优惠哦!)