【第542期】A-RAG：层次化检索接口驱动的智能体RAG框架

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法、crypto方向，让大家跟着AI一起进步。

如果你想要解读自己的论文，获得更多曝光度。请联系小助手微信：seventy3_podcast 加群。

合作邮箱：zhiwudazhanjiangshi#gmail.com

今天的主题是：

A-RAG: Scaling Agentic Retrieval-Augmented Generation via Hierarchical Retrieval Interfaces

Summary

前沿语言模型已展示出强大的推理和长时程工具使用能力。然而，现有的 RAG（检索增强生成）系统未能充分利用这些能力，仍依赖于两种范式：(1) 设计一种单次检索片段并将其拼接至模型输入的算法；(2) 预定义工作流并提示模型逐步执行。这两种范式都无法让模型参与检索决策，从而阻碍了随模型性能提升而实现的高效扩展。

在本文中，我们推出了 A-RAG，这是一个直接向模型开放层级检索接口的智能体 RAG 框架。A-RAG 提供了三种检索工具：关键词搜索、语义搜索和块读取，使智能体能够跨多个粒度自适应地搜索和检索信息。

在多个开放域问答基准测试中的实验表明，A-RAG 在使用相同或更少检索 Token 的情况下，表现始终优于现有方法，证明其能有效利用模型能力并动态适应不同的 RAG 任务。我们进一步系统研究了 A-RAG 如何随模型规模和推理时计算量进行扩展。我们将发布代码和评估套件以促进后续研究。

原文链接：https://arxiv.org/abs/2602.03442

【第542期】A-RAG：层次化检索接口驱动的智能体RAG框架

About this Episode

今天的主题是：

Hosts & Guests

More from Seventy3

【第551期】AgentSkiller：面向通用智能体的全自动大规模合成数据框架

【第550期】AdaptEvolve：基于置信度自适应选择的进化智能体系统

【第549期】EchoJEPA：超声心动图潜在预测基础模型

【第548期】Agyn：基于多智能体协作的自主软件工程系统