Loading...
Loading...

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。合作邮箱:zhiwudazhanjiangshi#gmail.com
Agyn: A Multi-Agent System for Team-Based Autonomous Software Engineering
Summary
大型语言模型在处理单个软件工程任务方面展现出了卓越的能力,然而大多数自主系统仍将问题修复视为一个单一的任务或流水线过程。相比之下,现实世界的软件开发是一项由团队按照共享方法论开展的协作活动,具有清晰的角色分工、沟通和评审机制。
在这项工作中,我们展示了一个全自动多智能体系统,该系统明确地将软件工程建模为一个组织过程,复制了工程团队的结构。我们的系统构建于开源智能体团队配置平台 agyn 之上,为不同智能体分配了专门的角色(如协调、研究、实现和评审),为它们提供了用于实验的隔离沙箱,并启用了结构化沟通。该系统遵循一套既定的开发方法论来处理问题,包括分析、任务规范制定、拉取请求(PR)创建以及迭代评审,且无需任何人工干预。
值得注意的是,该系统是为实际生产环境设计的,并未针对 SWE-bench 进行特定调优。在 SWE-bench 500 的事后评估中,它解决了 72.2% 的任务,表现优于使用同类语言模型的单智能体基准测试。我们的研究结果表明,复制团队结构、方法论和沟通机制是自主软件工程的一种强大范式,未来的进展可能同样取决于组织设计和智能体基础设施,而不仅仅是模型本身的提升。
原文链接:https://arxiv.org/abs/2602.01465
No transcript available for this episode.

Seventy3