【第539期】xMemory：超越RAG的智能体解耦与聚合存储系统

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法、crypto方向，让大家跟着AI一起进步。

如果你想要解读自己的论文，获得更多曝光度。请联系小助手微信：seventy3_podcast 加群。

合作邮箱：zhiwudazhanjiangshi#gmail.com

今天的主题是：

Beyond RAG for Agent Memory: Retrieval by Decoupling and Aggregation

Summary

智能体记忆系统通常采用标准的检索增强生成（RAG）流水线，但其底层假设在此场景下已发生变化。RAG 针对的是大型异构语料库，检索到的片段具有多样性；而智能体记忆是一个有界的、连贯的对话流，其中高度相关的跨度往往是重复的。在这种转变下，固定的 Top-k 相似度检索容易返回冗余上下文，而事后修剪可能会删除正确推理所需的、具有时间连续性的先决条件。

我们认为，检索应当超越相似度匹配，转而在潜分量（Latent Components）上运行，遵循“解耦到聚合”的逻辑：将记忆拆解为语义分量，将其组织成层级结构，并利用该结构驱动检索。

我们提出了 xMemory，它构建了一个完整单元的层级结构，并通过“稀疏性-语义”目标函数引导记忆的拆分与合并，从而维持一个可搜索且忠实的高层节点组织。在推理阶段，xMemory 执行自顶向下的检索，为多事实查询选择精简且多样的主题与语义，并仅在能降低阅读器不确定性时才扩展至具体的片段（Episodes）和原始消息。在 LoCoMo 和 PerLTQA 基准测试中，针对三种最新大语言模型的实验表明，该方法在答案质量和 Token 效率上均有显著提升。

原文链接：https://arxiv.org/abs/2602.02007

【第539期】xMemory：超越RAG的智能体解耦与聚合存储系统

About this Episode

今天的主题是：

Hosts & Guests

More from Seventy3

【第551期】AgentSkiller：面向通用智能体的全自动大规模合成数据框架

【第550期】AdaptEvolve：基于置信度自适应选择的进化智能体系统

【第549期】EchoJEPA：超声心动图潜在预测基础模型

【第548期】Agyn：基于多智能体协作的自主软件工程系统