Loading...
Loading...

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你有自己的论文要解读,或者推荐论文,请留言。
AI IDEs or Autonomous Agents? Measuring the Impact of Coding Agents on Software Development
Summary
基于大型语言模型(LLM)的编程智能体(coding agents)正越来越多地作为自主贡献者参与软件开发,例如自动生成并合并 Pull Request。然而,与目前广泛使用的IDE 内置 AI 助手相比,这些智能体在真实软件项目中的影响仍不清楚。
我们开展了一项纵向因果研究(longitudinal causal study),分析智能体在开源仓库中的采用效果。研究方法采用分阶段差分中的差分(staggered difference-in-differences)设计,并配合匹配对照组。基于 AIDev 数据集,我们将“采用智能体”定义为仓库首次出现由智能体生成的 Pull Request,并分析仓库按月统计的项目级指标,包括:
开发速度(development velocity)
软件质量(software quality)
研究结果表明:
相比之下,代码质量风险则更加持久。在不同情境下都观察到:
这表明即使开发速度优势逐渐消失,由智能体引入的技术债(technical debt)仍会持续累积。
这些异质性效应表明 AI 辅助开发存在边际收益递减的现象,同时也凸显出以下需求:
本研究为理解智能体式工具(agentic tools)与 IDE AI 助手之间的相互作用提供了实证基础,并推动未来研究探索:在 AI 融合的软件开发流程中,如何在开发效率与可维护性之间取得平衡。
本研究的**可复现代码与数据包(replication package)**已通过论文中的链接公开发布。
原文链接:https://arxiv.org/abs/2601.13597

Seventy3