Loading...
Loading...

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。合作邮箱:zhiwudazhanjiangshi#gmail.com
Learning to Rewrite Tool Descriptions for Reliable LLM-Agent Tool Use
Summary
基于大语言模型(LLM)的智能体性能不仅取决于智能体本身,还取决于其所调用的工具接口的质量。尽管此前的工作主要集中在智能体的微调上,但包括自然语言描述和参数模式在内的工具接口很大程度上仍是面向人类设计的,这往往会成为性能瓶颈,尤其是在智能体必须从庞大的候选工具集中进行选择时。
现有的改进工具接口的方法依赖于执行轨迹(execution traces),但在冷启动或受隐私限制的场景中,这些轨迹往往难以获得;此外,这些方法通常独立地优化每个工具,从而限制了其可扩展性以及对未知工具的泛化能力。
我们提出了 Trace-Free+,这是一个课程学习框架,它将监督信号逐步从轨迹丰富的场景迁移到无轨迹的部署环境,旨在鼓励模型抽象出可复用的接口使用模式和工具使用结果。为了支持这一方法,我们利用结构化工作流,针对多样化的工具集合构建了一个高质量工具接口的大规模数据集。
在 StableToolBench 和 RestBench 上的实验表明,该方法在未知工具上取得了持续的增益,表现出极强的跨领域泛化能力,并且在候选工具数量扩展至 100 个以上时仍具有稳健性。这证明了工具接口优化是智能体微调的一种实用且可部署的补充手段。
原文链接:https://arxiv.org/abs/2602.20426
No transcript available for this episode.

Seventy3