Loading...
Loading...

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
Scaling Small Agents Through Strategy Auctions
Summary
小语言模型正日益被视为实现智能体 AI(Agentic AI)的一种极具前景且成本效益高的方法,支持者认为它们足以胜任智能体工作流。然而,虽然小型智能体在简单任务上能与大型智能体平分秋色,但目前尚不清楚其性能如何随任务复杂度的增加而变化、何时必须使用大模型,以及如何更好地利用小型智能体处理长时程工作负载。
在本研究中,我们通过实证展示了小型智能体在深度搜索和编程任务上的性能无法随任务复杂度同步提升。为此,我们引入了 SALE(基于工作负载效率的策略拍卖),这是一个受自由职业者市场启发的智能体框架。在 SALE 中,智能体通过简短的战略计划进行投标,这些计划由系统的“成本-价值”机制评分,并通过共享的拍卖记忆进行完善,从而实现逐任务路由(Per-task Routing)和持续自我改进,而无需训练专门的路由模型或运行所有模型直至结束。
在不同复杂度的深度搜索和编程任务中,SALE 将对最大智能体的依赖降低了 53%,总成本降低了 35%,并始终优于最大智能体的 Pass@1 表现,且除执行最终轨迹外,其开销几乎可以忽略不计。相比之下,现有的依赖任务描述的路由器要么性能不如最大智能体,要么无法降低成本(通常两者兼有),凸显了它们与智能体工作流的适配性极差。
这些结果表明,虽然小型智能体可能不足以独立处理复杂负载,但可以通过协调的任务分配和推理时(Test-time)自我改进来有效“扩展”。更广泛地说,这激发了对智能体 AI 的系统级视角:性能提升不再仅仅源于不断增大的单个模型,而是更多地源于受市场启发的协调机制,将异构智能体组织成高效、自适应的生态系统。
原文链接:https://arxiv.org/abs/2602.02751
No transcript available for this episode.

Seventy3