你问ChatGPT一个问题,它给你答案。你问Agent一个问题,它开始计划。这就是全部的区别。一个会自己拆解任务的程序去年有个程序员在推特上发了张截图。他让GPT-4帮他订机票,模型回复了一段完美的攻略,步骤清晰,逻辑严密。然后他又让一个Agent做同样的事,结果Agent打开了浏览器,搜索了航班,比对了价格,甚至尝试进入支付页面,最后因为没有绑定信用卡才停下来。这个差异来自Agent的核心架构。斯坦福大学在2023年的论文《Generative Agents》里把它拆成了三个部分,感知模块Perception、记忆模块Memory、行动模块Action。普通LLM只有一个推理引擎,你给它输入...