agent实习都干什么？什么是ReAct和Planning & Extractor？

在构建AI Agent（智能体）时，如何引导大模型有效完成复杂任务是一个核心问题。当前主流范式主要有两种：ReAct（推理+行动） 和 Planning & Extractor（规划+提取器）。它们都旨在增强模型的自主性和任务执行能力，但在工作流程和适用场景上存在显著差异。本文将通过实例对比两者的异同，帮助企业根据实际需求选择合适范式。

一、ReAct范式

ReAct由Shunyu Yao等人提出，其核心思想是让模型在生成过程中交替进行“推理”和“行动”。模型会先思考当前状态（Reasoning），然后决定采取什么行动（Acting），如调用工具、查询知识库，之后根据行动结果再次推理，直至完成任务。这种动态循环使模型能够根据环境反馈实时调整策略，特别适合需要多步交互、结果不确定的任务。

实例：旅游出行建议助手

用户提问：“明天北京天气如何？适合去长城吗？”

假设模型具备天气查询工具get_weather(city, date)和地图工具get_distance(location1, location2)。

ReAct执行过程模拟：

思考1：用户想知道北京明天的天气，以及是否适合去长城。我需要先查询天气。
行动1：调用 get_weather(city="北京", date="明天")
观察1：天气晴朗，气温15-25℃，微风。

思考2：天气很好，适合户外活动。但还需要考虑长城的具体位置和交通情况。查询从市区到长城的距离。
行动2：调用 get_distance("北京市中心", "八达岭长城")
观察2：距离约70公里，车程约1.5小时。

思考3：天气晴朗，距离适中，适合前往。但需提醒用户注意交通和防晒。
最终回答：明天北京天气晴朗，气温15-25℃，非常适合游览长城。从市区到八达岭约70公里，建议早点出发并做好防晒。

特点：每一步思考都基于前一步的观察，推理和行动紧密耦合，模型自主决定下一步动作。

二、Planning & Extractor范式

Planning & Extractor范式采用分阶段处理的方式。首先由模型（或规则）对任务进行规划，分解为一系列有序步骤；然后依次执行这些步骤（可能调用工具）；最后通过一个提取器（可以是模型或代码）从执行结果中抽取出关键信息，生成最终答案。该范式强调任务的分解和结果的精炼，适用于流程相对固定、输出格式要求明确的场景。

实例：同样的旅游出行建议助手

Planning & Extractor执行过程模拟：

规划阶段：步骤1：查询北京明天的天气。步骤2：查询北京到长城的距离。步骤3：根据天气和距离，综合判断是否适合去长城。
执行阶段（按顺序执行）：执行1：调用 get_weather(city="北京", date="明天") → 结果：晴朗，15-25℃执行2：调用 get_distance("北京市中心", "八达岭长城") → 结果：70公里，1.5小时
提取与生成阶段：提取器接收执行结果，分析：天气晴朗，温度适宜；距离70公里，属于可接受范围。生成最终回答：“明天北京天气晴朗，适合户外活动。长城距离市区约70公里，车程1.5小时，建议前往，注意防晒和补水。”

特点：规划与执行分离，执行结果被统一交给提取器处理，提取器可专门针对输出格式进行优化（如结构化数据、摘要等）。

三、异同对比

工作流程	推理-行动循环，动态迭代	规划 → 执行 → 提取，线性阶段
决策灵活性	高，可根据中间结果调整后续动作	低，计划一旦制定，执行相对固定
工具调用次数	不确定，由模型动态决定	确定，由计划步骤决定
输出生成方式	在循环中逐步构建，最终整合	由提取器统一处理执行结果后生成
适用场景	开放式探索、需多步推理的任务（如科研助手、复杂问答）	流程清晰、输出结构化的任务（如报表生成、信息抽取）
实现复杂度	需要设计循环机制和停止条件	相对简单，各阶段可独立优化
典型应用	AutoGPT、BabyAGI等自主智能体	数据ETL流程、标准化报告生成