🧬 AIDD每日论文精选
2026年06月21日 周日 · 共筛选出 5 篇论文
💡 今日摘要:
1️⃣ recount3 Python包为Python用户提供了统一处理的大规模RNA-seq数据的程序化访问接口,有效衔接了公共转录组数据与机器学习生态系统。
2️⃣ CcpNmr AnalysisDynamics提供一个统一的NMR动力学数据分析框架,集成弛豫速率提取、模型分析和结构可视化,支持交换分析和可重现工作流。
3️⃣ 通过共甲基化网络分析,揭示DNA甲基化时钟的CpG位点模块化结构,解释现有时钟相似性并指导构建性能更优、可跨平台的时钟。
4️⃣ 核糖体表面覆盖着一层此前被忽视的、由柔性蛋白质片段构成的功能性外衣,其组成与特性在不同物种间存在系统性差异并适应特定环境。
5️⃣ 本研究揭示果蝇发育中肌醇磷酸网络经历动态重组,这种重组对变态进程和成虫存活至关重要。
今日论文
BIORXIV#1
The recount3 Python package for programmatic access to uniformly processed RNA-seq data
👥 Alsalihi, A., Flight, R. M., Moseley, H. N. B.
摘要 该论文介绍了recount3 Python包,旨在为Python用户提供对recount3在线资源的本地高效访问。recount3资源包含了数万个人类和小鼠经统一处理的RNA-seq样本数据,以往主要依赖于R/Bioconductor生态系统访问。新开发的Python包提供了健壮的API和命令行界面,用于发现、下载并整合这些数据。该软件负责处理URL解析、磁盘持久化缓存,并自动将数据解析为可直接用于分析的数据结构,如Pandas数据框和BiocPy的RangedSummarizedExperiment对象。这一工具显著降低了在Python计算流程中大规模使用RNA-seq数据的门槛,有力促进了大规模公共转录组数据与当代机器学习工具之间的融合。
BIORXIV#2
CcpNmr AnalysisDynamics: a unified framework for NMR dynamics data analysis
👥 Mureddu, L. G., Brooksbank, E. J., Vuister, G. W., Muskett, F. W.
摘要 NMR弛豫实验是研究生物分子动力学的关键技术,但其定量分析往往依赖分散的专业工具,导致流程割裂。CcpNmr AnalysisDynamics作为CcpNmr Analysis套件的最新组件,构建了一个集成框架,统一了弛豫分析、交换感知解释和动力学建模。该平台将弛豫速率提取、诊断验证、模型分析和结构可视化整合到可重现的工作流中,并通过稳健的API和插件架构支持未来扩展。核心创新是引入了ModelAnalysis (ModA)分析引擎,基于Lipari-Szabo形式,实现了优化、不确定性估计和模型选择策略,适用于异质弛豫数据集。框架还支持交换聚焦分析和与外部建模工具的集成,使弛豫异常能从初始检测追踪到详细解释。通过系统性地重新分析和验证生物磁共振数据银行的弛豫数据集,展示了AnalysisDynamics的适用性和可靠性,这些分析评估了数据一致性、动力学参数和模型可靠性,为从NMR弛豫测量到生物分子动力学结构链接解释提供了可重现的途径。
BIORXIV#3
A network approach to DNA methylation clocks
👥 Carcedo, A., Yang, S.-G., Smiljanic, J. … Lizana, L.
摘要 本文针对DNA甲基化时钟预测生物年龄时存在的问题,如不同钟共享CpG位点少、弱年龄关联及跨平台转移性差,采用网络方法进行研究。基于12个人类血液公共数据集,构建共甲基化网络分析年龄相关性强的位点,发现网络包含少数大型模块和多个小模块及单点,模块与CpG岛上下文相关并富集特定生物学功能。将Horvath、Hannum、AltumAge、Skin & Blood和Han五个现有时钟映射到网络,揭示它们选择来自相同模块的CpG,表明时钟间相似性高于表面差异。网络结构启发新时钟构建:一个简单时钟保留每个模块一个CpG,性能匹配现有;另一个基于模块主成分的时钟,在三个验证队列中优于所有现有时钟,且能跨Illumina 450K和EPIC阵列平台转移。整体上,网络视角将注意力从单个CpG转向模块,解释了现有时钟表现良好的原因,并提供更系统的方法开发下一代衰老生物标志物。
BIORXIV#4
Ribosomes are covered by a coat of flexible protein fragments
👥 McGrath, H., Kvasnovsky, R., Kolar, M.
摘要 核糖体表面覆盖着一层此前被忽视的、由柔性蛋白质片段构成的功能性外衣,其组成与特性在不同物种间存在系统性差异并适应特定环境。 本研究对跨越细菌、真核生物及线粒体的36种核糖体进行了分析,发现柔性蛋白质片段在核糖体表面形成了一层不可见的覆盖层。这些在电子密度重建中被平均化而消失的区域,尤其是线粒体核糖体上的片段数量最多、长度最长。结构预测证实这些片段在所有核糖体类型中主要呈无序状态。对这些片段的氨基酸组成与全蛋白质组背景频率的比较揭示出强烈且具有结构域特异性的组成偏差。其中精氨酸与赖氨酸含量的平衡关系,与各类核糖体所接触膜的磷脂成分相呼应。线粒体核糖体柔性片段的精氨酸富集,可能还反映了其组装环境(富含RNA的线粒体RNA颗粒)的选择压力。此外,这些片段普遍缺乏芳香族残基,这削弱了其驱动液-液相分离的能力。综合而言,研究指出这种柔性连接的外衣是所有核糖体一个高度功能化的固有组成部分。
BIORXIV#5
The dynamic inositol phosphate network during development in Drosophila melanogaster
👥 Shukla, A., Busch, M., Haener, M. … Jessen, H.
摘要 本研究揭示果蝇发育中肌醇磷酸网络经历动态重组,这种重组对变态进程和成虫存活至关重要。在果蝇发育过程中,肌醇磷酸(InsPs)和肌醇焦磷酸(PP-InsPs)网络通过同分异构体分辨的毛细管电泳-质谱分析显示广泛重编程:早期阶段低序异构体多样性高,后期富集于Ins(1,3,4,5,6)P5、InsP6和PP-InsPs;变态期间5-PP-InsP5显著增加,成为成虫主要焦磷酸物种。遗传扰动实验证实这种代谢重塑对发育必不可少:IPK2缺失降低InsP5水平并导致变态失败;IPK1缺失延迟发育并诱导InsP5池异构体选择性重分布;IP6K缺失特异性消除5-PP-InsP5产生,损害组织形态发生并引起快速死亡。意外发现,IPK2或IP6K缺失均导致2-PP-InsP5出现。这些发现确立果蝇InsP途径为一个动态调控的发育网络,富含先前未描述的异构体,其阶段特异性代谢重塑与变态、组织成熟及成虫存活密切相关。