Loading...
Loading...

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
A-RAG: Scaling Agentic Retrieval-Augmented Generation via Hierarchical Retrieval Interfaces
Summary
前沿语言模型已展示出强大的推理和长时程工具使用能力。然而,现有的 RAG(检索增强生成)系统未能充分利用这些能力,仍依赖于两种范式:(1) 设计一种单次检索片段并将其拼接至模型输入的算法;(2) 预定义工作流并提示模型逐步执行。这两种范式都无法让模型参与检索决策,从而阻碍了随模型性能提升而实现的高效扩展。
在本文中,我们推出了 A-RAG,这是一个直接向模型开放层级检索接口的智能体 RAG 框架。A-RAG 提供了三种检索工具:关键词搜索、语义搜索和块读取,使智能体能够跨多个粒度自适应地搜索和检索信息。
在多个开放域问答基准测试中的实验表明,A-RAG 在使用相同或更少检索 Token 的情况下,表现始终优于现有方法,证明其能有效利用模型能力并动态适应不同的 RAG 任务。我们进一步系统研究了 A-RAG 如何随模型规模和推理时计算量进行扩展。我们将发布代码和评估套件以促进后续研究。
原文链接:https://arxiv.org/abs/2602.03442
No transcript available for this episode.

Seventy3