上下文工程中间件
抗 Context Rot:六大上下文模块 × 五大策略(Write/Select/Compress/Isolate/Cache),全部落成可叠加的 LangChain middleware,按「先 Cache(省 90%) 后 Isolate」优先级用。
六大模块占满上下文窗口;按课程的「先 Cache 后 Isolate」优先级叠加五大策略,看窗口 token 和相对成本一起降。
本地版本说明
决策优先级、五大策略(Write/Select/Compress/Isolate/Cache)、Compress 子技术、Cache 省 90% 等都来自 Part 9 课件。token / 成本数值为示意。
五大策略给上下文窗口瘦身
六大模块占满窗口,按「先 Cache 后 Isolate」的决策优先级叠加五大策略——窗口和成本一起降。
六大上下文模块
对话历史 + 工具上下文 合计 >50% 窗口(最大的两个「水龙头」)。
有效窗口
180K
相对成本
100%
① Cache 提示缓存
静态前缀缓存命中,cache-read 仅 10%(省 90% 成本),首日就能上
② Compress 工具结果清除
清掉冗长的原始工具输出,只留「决策 + 为什么」,零成本
③ Compress 观察遮蔽 + trim
遮蔽旧观察 + trim_messages 硬截断对话历史
④ Isolate 子 Agent 隔离
SubAgentMiddleware 把外部知识检索丢进独立上下文
⑤ Write + Select
任务状态 offload 到 scratchpad,记忆 JIT 检索
建议体验
叠加策略,看窗口逐模块缩小。
注意 Cache 最先用(省 90%,首日),系统提示前缀变成 cached。
看 Isolate 只在按需时把外部知识检索丢进子 Agent 上下文。
这个试玩能说明什么
你理解 Context Rot——更大窗口 ≠ 更好——并主动管理。
你能说清每个模块、选对策略,并落成可叠加的 LangChain middleware。
你按成本排序:零成本(Cache / 工具结果清除)先上,复杂(Isolate / Write)按需。
框架
六大模块 × 五大策略(Write/Select/Compress/Isolate/Cache)
中间件
trim_messages · SummarizationMiddleware · SubAgentMiddleware(deepagents)
成本杠杆
Prompt cache:cache-read 仅 10%(省 90%),前缀逐字节稳定