六、长短期 Memory
六、长短期 Memory
核心思想是:小而确定的事实进长期记忆 + 大而临时的对话留在会话历史 + 外部记忆系统做增强检索和同步
长期精选记忆
用内置的memory_tool管理
- MEMORY.md:agent 自己的长期笔记,比如项目约定、环境事实、工具坑点。
- USER.md:用户的长期画像,比如偏好、身份、沟通习惯
会话历史回忆
- 1、用内置
session_search_tool全文搜索top50 session - 2、截断命中点上下 n 行
- 3、使用 LLM 并发总结摘要
外部记忆 provider
- 1、记忆召回:每轮开始前,根据用户输入召回相关记忆
- 2、会话同步:每轮结束后,把完整对话同步到外部后端
亮点
- 记忆冻结:如何会话中途,LLM 调用
memory_tool增/删/改长期精选记忆,不会在本轮会话生效,下一次 session 才会生效。避免 system prompt 前缀变化,导致缓存命中率下降,成本和延迟都会上升。 - 会话消息摘要总结:避免大量会话历史打爆上下文和 token 消耗。
参考
This post is licensed under CC BY 4.0 by the author.