Agent 工程化介绍

这个系列讨论如何把 AI Agent 从概念、Demo 和单点能力，推进到真实产品和生产系统。它关注 Agent 工程里反复出现的核心问题：目标定义，系统拆分，能力组合，风险控制，效果评估，产品上线Trace等，会从基础能力讲到框架选型，再进入典型产品拆解，最后收束到产品化、落地经验和上线清单。读完以后，你应该能判断一个 Agent 项目是否值得做，第一版系统应该怎么搭，哪些能力必须自己掌握，哪些部分可以交给框架和平台。

适合谁

这个专栏适合已经开始关注 Agent 落地的人，它默认你不满足于看一个演示效果，而是想知道 Agent 落地过程的风险控制、上线后的持续迭代等。

想把 AI Agent 做成真实产品的工程师。你会理解 Agent 的核心组件、执行链路、工程边界和上线要求。
需要为团队选型和搭系统的架构师。你会建立框架选型、工作流设计、记忆系统、工具调用和评估体系的判断标准。
希望理解 Agent 能力边界和落地路径的 AI 产品负责人。你会看清 Agent 适合解决什么问题，产品化过程中需要哪些兜底和体验设计。
正在做 AI 应用落地的团队负责人。你可以用这套文章检查目标、数据、流程、成本、风险和团队协作是否准备好。

解决什么问题

这个专栏围绕 Agent 工程的主线问题展开。它不会只停留在概念解释，也不会只介绍框架 API，而是把能力、架构、评估和产品化放到一起讨论。

Agent 产品和传统软件产品有什么差异。专栏会从 Agent 开发范式、Prompt 自主优化、状态管理和工具调用等多维度解释 Agent 系统的特征。
一套生产级 Agent 系统需要哪些核心组件。专栏会拆解 Prompt、记忆、工具、推理框架、执行权限、可观测性和评估体系多个方面。
如何选择合适 Agent 架构和框架。专栏会比较 Workflow、Minimal Agent、Harness Framework 等区别，单 Agent 和多 Agent 的选择权衡，并对 LangGraph、Pi 等框架思路进行分析。
怎样把 Agent 从想法推进到上线。专栏会围绕目标定义、评估集设计、MVP 开发上线、数据监控、迭代等多个环节进行讲解。
为什么 Demo 容易，产品化困难。专栏会讨论稳定性、可控性、知识治理、数据闭环、用户体验和组织协作的实际门槛。

专栏目录

Open 专栏目录

第一部分：基础能力

这一部分建立 Agent 工程的基础组件认知。读完以后，你应该能判断一个 Agent 系统由哪些能力组成，以及每个能力在生产环境里承担什么职责。

第一篇：Agent 如何重塑软件开发范式：建立 Agent 工程化的基础认知，说明 Agent 为什么会改变软件开发方式，以及它和传统软件工程的差异。
第二篇：Prompt 是 Agent 系统的行为控制入口：讨论 Prompt 在 Agent 系统里的工程作用，包括输出格式约束、Prompt 自动优化、提示缓存、各种应用场景下的提示框架等。
第三篇：Agent 的记忆系统应该怎么设计：拆解 Agent 的记忆系统，覆盖上下文窗口、RAG、三层记忆模式、经验沉淀、记忆整理与评估。
第四篇：Agent 如何调用工具连接真实世界：讨论 Function Calling、MCP、代码执行、沙箱、Browser Use、Skills 和安全边界话题。
第五篇：怎样让 Agent 具备真正的推理能力：讲任务分解、思维链、自我一致性、Reflexion、ReAct、Plan-and-Execute 等。

第二部分：框架与控制

这一部分讨论 Agent 执行框架和控制方式。重点是理解不同框架如何处理状态、工作流、长任务、工具调用和可控性，框架 API 只是实现细节。

第六篇：Agent 框架应该怎么选：建立执行框架选型方法，讨论如何根据任务复杂度、可靠性要求和团队能力选择控制方式。
第七篇：LangGraph 框架解析：用 LangGraph 解释可控 Agent 工作流，重点关注状态图、节点、边、路由、持久化和可观察性。
第八篇：Pi 框架解析：讨论极简 Agent 框架 Pi，说明在什么场景下小框架比复杂编排更合适，如何按需扩展。
第九篇：如何让 Agent 执行长程任务：拆解执行长程任务（Long Horizon Task）的经验，关注计划、人机协同、文件系统、执行状态和任务恢复。
第十篇：如何搭建 Agent 可观测与评估体系：讨论 Trace、日志、评估集、在线反馈、失败样本回流和持续优化机制。

第三部分：产品案例

这一部分把前面的能力放进具体产品形态里，拆解通用任务 Agent、研究型 Agent 和社媒运营 Agent 的产品实现。

第十一篇：如何构建一个类 Manus 产品：把前面的能力组合到通用 Agent 产品中，拆解类 Manus 产品（Claude Cowork、MiniMax Agent Desktop、扣子空间等）的工作机制。
第十二篇：如何构建一个类 Deep Research 产品：讨论研究型 Agent 产品，重点关注搜索、规划、资料阅读、多源整合、引用和报告生成。
第十三篇：如何构建一个社媒运营 Agent 产品：构建社媒运营 Agent，覆盖热点监测、品牌匹配、内容生成、素材制作、发布等。

第四部分：产品化与上线

这一部分讨论如何从可运行系统走向真实产品，重点是用户体验、可控性、工程教训和上线检查。

第十四篇：Agent 从概念走向产品：讨论 Agent 产品化，重点关注用户体验、可控性、成本、灰度上线和商业价值验证。
第十五篇：构建 Agent 工程的教训：持续记录 Agent 从架构设计、团队协作到产品化落地过程中的工程教训。
第十六篇：一份 Agent 上线自检清单：把目标定义、评估集设计、架构选型、可观测性建设等组成上线检查表。

特别篇

特别篇用于补充主线之外的关键工程方法，适合在做架构评审、复杂任务设计和团队共识建设时对照阅读。

上下文工程：LangChain & Manus 五大策略与实践：集中讨论上下文工程，适合在学习记忆系统、长任务执行和多 Agent 协作时反复对照。
Harness 工程：OpenAI & Martin Fowler 定义 Agent 工程新范式：讨论 Harness Engineering，重点是文件系统、沙箱环境、知识管理、架构约束等。
构建可靠 Agent 工程的 12 条原则：总结可靠 Agent 工程的关键原则，适合在做架构评审、上线评审和团队共识建设时使用。

阅读建议

如果你刚开始系统学习 Agent 工程，可以按 1 到 6 篇顺序阅读，先建立基础能力和架构判断。接着阅读 7 到 9 篇，理解不同框架背后的控制方式。然后阅读 10 到 13 篇，把评估体系和典型产品形态连接起来。最后阅读 14 到 16 篇，进入产品化、工程教训和上线自检。

如果你已经在做 Agent 项目，可以先看第十篇、第十五篇和第十六篇，用评估、教训和上线清单检查当前系统。遇到具体问题时，再回到 Prompt、记忆、工具、推理和框架对应章节。

这套专栏最终想回答一个问题：怎样把 Agent 做成可评估维护、可持续迭代的产品，只有系统架构、业务判断和工程能力一起成立，Agent 才能从演示走向真实业务。