Science | 谁在用AI编程?生成式AI的全球扩散与影响
2026年1月22日,由奥地利、荷兰、匈牙利等多个国家的研究机构组成的研究团队在《Science》杂志上发表题为《Who is using AI to code? Global diffusion and impact of generative AI》的研究。
该研究基于超过3000万次GitHub代码提交,首次构建可识别AI生成代码的机器学习分类器,揭示了全球六大国家AI编程采用率、扩散路径及其对开发者生产力的差异化影响。
生成式人工智能(genAI)在编程领域的应用被广泛认为能显著提升开发效率,但其实际采用情况、全球扩散模式及其对不同层次开发者的影响尚不明确。现有研究多依赖问卷调查或小规模实验,存在自我报告偏差、样本局限等问题,难以客观反映真实世界中的AI使用强度与长期效果。
为克服传统调研方法的局限,研究团队设计了一套基于双LLM合成训练数据的分类器构建流程:先由一模型描述人类编写的Python函数,再由另一模型根据描述生成对应函数,从而构建出功能对齐但文本特征差异化的“人类-AI”配对数据。在此基础上,采用GraphCodeBert模型提取代码的词元、注释与数据流图特征,并训练神经网络进行分类。该方法实现了0.96的ROC AUC分数,显著提升了AI生成代码识别的可靠性与泛化能力。这一技术突破为本研究提供了核心数据基础,使大规模、动态追踪AI使用强度成为可能。
分类器应用于六国开发者数据后发现,美国在AI编程应用上始终处于领先地位,截至2024年底约29%的Python函数由AI生成。德国、法国紧随其后(23–24%),印度快速追赶至20%,而中国和俄罗斯采用率相对滞后。这一梯度分布反映出技术扩散受本地AI生态(如模型可访问性、平台竞争)与需求环境(如政策限制、开发文化)的共同影响。动态曲线进一步显示,美国早期优势正被逐步削弱,暗示全球AI技术扩散可能加速趋同。
回归分析表明,当AI使用强度从0提升至29%时,开发者整体提交量增加3.6%,但这一增益几乎完全由资深开发者驱动(其提交量提升6.2%),初级开发者则无显著获益。同时,AI采用者更倾向于尝试新库及其组合,表现出向新领域拓展的“探索行为”。这一结果揭示AI并非普惠工具:资深开发者凭借更强的代码审阅、集成与调试能力,更能将AI输出转化为实质性生产力与创新探索;而新手可能陷入对AI生成的依赖,未能同步提升自身设计能力。此发现警示,若缺乏结构化培训机制,AI恐加剧开发者的技能断层与职业路径分化。
📍参考论文🍃
https://doi.org/10.1126/science.adz9311