当前位置：首页>java>Science | 谁在用AI编程?生成式AI的全球扩散与影响

Science | 谁在用AI编程?生成式AI的全球扩散与影响

2026-02-06 19:24:17

论文导读

2026年1月22日，由奥地利、荷兰、匈牙利等多个国家的研究机构组成的研究团队在《Science》杂志上发表题为《Who is using AI to code? Global diffusion and impact of generative AI》的研究。

该研究基于超过3000万次GitHub代码提交，首次构建可识别AI生成代码的机器学习分类器，揭示了全球六大国家AI编程采用率、扩散路径及其对开发者生产力的差异化影响。

研究背景

生成式人工智能（genAI）在编程领域的应用被广泛认为能显著提升开发效率，但其实际采用情况、全球扩散模式及其对不同层次开发者的影响尚不明确。现有研究多依赖问卷调查或小规模实验，存在自我报告偏差、样本局限等问题，难以客观反映真实世界中的AI使用强度与长期效果。

主要结果

Part.01

AI代码检测器的构建与高精度性能

为克服传统调研方法的局限，研究团队设计了一套基于双LLM合成训练数据的分类器构建流程：先由一模型描述人类编写的Python函数，再由另一模型根据描述生成对应函数，从而构建出功能对齐但文本特征差异化的“人类-AI”配对数据。在此基础上，采用GraphCodeBert模型提取代码的词元、注释与数据流图特征，并训练神经网络进行分类。该方法实现了0.96的ROC AUC分数，显著提升了AI生成代码识别的可靠性与泛化能力。这一技术突破为本研究提供了核心数据基础，使大规模、动态追踪AI使用强度成为可能。

Part.02

美国领跑全球AI采用，但优势逐步收窄

分类器应用于六国开发者数据后发现，美国在AI编程应用上始终处于领先地位，截至2024年底约29%的Python函数由AI生成。德国、法国紧随其后（23–24%），印度快速追赶至20%，而中国和俄罗斯采用率相对滞后。这一梯度分布反映出技术扩散受本地AI生态（如模型可访问性、平台竞争）与需求环境（如政策限制、开发文化）的共同影响。动态曲线进一步显示，美国早期优势正被逐步削弱，暗示全球AI技术扩散可能加速趋同。

Part.03

经验驱动AI效益分化：资深开发者

生产力显著提升

回归分析表明，当AI使用强度从0提升至29%时，开发者整体提交量增加3.6%，但这一增益几乎完全由资深开发者驱动（其提交量提升6.2%），初级开发者则无显著获益。同时，AI采用者更倾向于尝试新库及其组合，表现出向新领域拓展的“探索行为”。这一结果揭示AI并非普惠工具：资深开发者凭借更强的代码审阅、集成与调试能力，更能将AI输出转化为实质性生产力与创新探索；而新手可能陷入对AI生成的依赖，未能同步提升自身设计能力。此发现警示，若缺乏结构化培训机制，AI恐加剧开发者的技能断层与职业路径分化。