Loading...
Loading...

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
Beyond RAG for Agent Memory: Retrieval by Decoupling and Aggregation
Summary
智能体记忆系统通常采用标准的检索增强生成(RAG)流水线,但其底层假设在此场景下已发生变化。RAG 针对的是大型异构语料库,检索到的片段具有多样性;而智能体记忆是一个有界的、连贯的对话流,其中高度相关的跨度往往是重复的。在这种转变下,固定的 Top-k 相似度检索容易返回冗余上下文,而事后修剪可能会删除正确推理所需的、具有时间连续性的先决条件。
我们认为,检索应当超越相似度匹配,转而在潜分量(Latent Components)上运行,遵循“解耦到聚合”的逻辑:将记忆拆解为语义分量,将其组织成层级结构,并利用该结构驱动检索。
我们提出了 xMemory,它构建了一个完整单元的层级结构,并通过“稀疏性-语义”目标函数引导记忆的拆分与合并,从而维持一个可搜索且忠实的高层节点组织。在推理阶段,xMemory 执行自顶向下的检索,为多事实查询选择精简且多样的主题与语义,并仅在能降低阅读器不确定性时才扩展至具体的片段(Episodes)和原始消息。在 LoCoMo 和 PerLTQA 基准测试中,针对三种最新大语言模型的实验表明,该方法在答案质量和 Token 效率上均有显著提升。
原文链接:https://arxiv.org/abs/2602.02007
No transcript available for this episode.

Seventy3