Post

六、长短期 Memory

六、长短期 Memory

核心思想是:小而确定的事实进长期记忆 + 大而临时的对话留在会话历史 + 外部记忆系统做增强检索和同步

长期精选记忆

用内置的memory_tool管理

  • MEMORY.md:agent 自己的长期笔记,比如项目约定、环境事实、工具坑点。
  • USER.md:用户的长期画像,比如偏好、身份、沟通习惯

会话历史回忆

  • 1、用内置session_search_tool全文搜索top50 session
  • 2、截断命中点上下 n 行
  • 3、使用 LLM 并发总结摘要

外部记忆 provider

  • 1、记忆召回:每轮开始前,根据用户输入召回相关记忆
  • 2、会话同步:每轮结束后,把完整对话同步到外部后端

亮点

  • 记忆冻结:如何会话中途,LLM 调用memory_tool增/删/改长期精选记忆,不会在本轮会话生效,下一次 session 才会生效。避免 system prompt 前缀变化,导致缓存命中率下降,成本和延迟都会上升。
  • 会话消息摘要总结:避免大量会话历史打爆上下文和 token 消耗。

参考

This post is licensed under CC BY 4.0 by the author.