Agent 四种设计模式 电脑版发表于:2025/8/22 10:56  >#Agent 四种设计模式 [TOC] 什么是 Agent ------------  tn2>具有复杂推理能力、记忆和执行任务手段的自主代理; Agent = 规划 + 记忆 + 工具 + 行动 ### 规划模块  tn2>一般过程为:你提需求 → 小助手分解任务(任务分解) → 一个个执行 → 整理结果 → 给你答案。 在一个个执行中又回有如下执行步骤: ReAct → 边想边做 Reflexion → 做完总结经验 Chain of Thought → 按步骤推理 Graph of Thought → 多路径思考、对比选择 ### 记忆模块  tn2>记忆其实很像我们平常学习的习惯。 短期记忆就像考前临时抱佛脚,把知识点都塞进脑子里,但过了考试很快就忘光了。 长期记忆就像平时做读书笔记,把重要的内容写下来,反复复习,以后随时都能翻出来用。 AI 的记忆也是一样: 它会先记住对话里的“上下文”,这就是短期记忆,但能记的内容有限。 如果把信息存到“数据库”或者“对话历史”里,就成了长期记忆,下次再聊的时候也能被唤醒。 一句话总结:短期记忆是临时的,长期记忆是持久的,就像考试临时背书和做笔记的区别。 ### 工具模块 tn2>AI 助手(Agent)不是全能的,它自己不会做所有事情,但它会“合理用工具”来帮你完成问题。  tn2>流程大概是这样: 你提问题(Question) 比如你问:“帮我写一段 Python 代码画个柱状图。” Agent(智能助手)思考 它会决定自己能不能直接回答,还是要借助工具。 调用工具(Tools) 工具可以有很多种: 搜索:去网上找信息。 RAG(检索增强生成):从知识库里找资料。 代码解释器:运行一段代码,拿到结果。 数学计算:算一道复杂公式。 其他 API 服务:比如查天气、发邮件、调用数据库等等。 这一步就是 Agent 发出行动(Action)→ 工具执行 → 返回观察结果(Observation)。 得到结果(Output) 工具执行完,Agent 整理结果,最终给你答案。 ### 为什么要使用Agent?  tn2>大模型就像人的大脑一样,如果你没有手脚和记忆,大脑无法独立行动; 将大模型视为大脑,Agent视为完整的身体。 ### 以RAG为例理解Agent  tn2>传统RAG流程(左图):从向量数据库检索文档相关内容后直接回答问题。 RAGAgent流程(右图):从向量数据库检索文档后,进一步检查文档内容跟问题是否匹配,如果匹配则回答问题,如果不匹配,则改写问题重新检索,循环往复。 Agent四种设计模式 ------------ tn2>1.反馈(Reflection) 2.工具调用(Tools) 3.规划(Planning) 4.多智能体协作(Multi-agentCollaboration) ### 反馈(Reflection)模式 tn2>定义:让AI模型自我反思和自我迭代,不断优化输出,提高任务准确率<br/> 例子: 1.Q:给X任务写一段代码 2.A:deftask():xxx 3.Reflection1:代码中第3行有bug,正在修复中4.A:deftask2():xxx 5.Reflection1:代码中第10行有bug,正在修复中6.A:deftask3():xxx 7.Reflection1:未发现错误 8.A:最终代码为deftask3():xxx >优点: ?提高准确性和质量 缺点: ?多次迭代和反馈耗时更长,成本更高 ?反馈机制设计较为复杂 ### 工具调用(Tools)模式 tn2>定义:让AI模型通过调用外部工具增强任务执行能力<br/> 例子: ?代码解释器 ?搜索 ?浏览网页 ?发送邮件 ?日历事件 ?文生图 >优点: ?对于数学计算场景,通过代码解释器极大提高准确性 ?扩充了模型能力范围 缺点: ?模型产生了新的外部依赖,故障概率可能变高 ?多种工具协作增加了系统复杂性 ### 规划(Planning)模式 tn2>定义:让AI模型将复杂任务拆解为多个更小的步骤<br/> 例子: ?生成一张图,一个小女孩坐在沙发上看书,姿势和示例图的男孩一样 ?规划拆解 ?检查示例图姿势,并生成骨架图 ?应用骨架图,生成目标图像 >优点: ?简化复杂任务 ?提升复杂任务的准确性 >缺点: ?依赖性过强,下一步依赖于上一步的准确性 ?增加了任务时长和资源 ### 多智能体协作模式  tn2>定义:让多个Agent分工协作提高任务执行效率和准确性. >优点: ?提高任务效率 ?应对复杂任务 缺点: ?协调多智能体设计复杂 ?增加了任务时长和资源