这个系列讨论如何把 AI Agent 从概念、Demo 和单点能力,推进到真实产品和生产系统。它关注 Agent 工程里反复出现的核心问题:目标定义,系统拆分,能力组合,风险控制,效果评估,产品上线Trace等,会从基础能力讲到框架选型,再进入典型产品拆解,最后收束到产品化、落地经验和上线清单。读完以后,你应该能判断一个 Agent 项目是否值得做,第一版系统应该怎么搭,哪些能力必须自己掌握,哪些部分可以交给框架和平台。
适合谁
这个专栏适合已经开始关注 Agent 落地的人,它默认你不满足于看一个演示效果,而是想知道 Agent 落地过程的风险控制、上线后的持续迭代等。
- 想把 AI Agent 做成真实产品的工程师。你会理解 Agent 的核心组件、执行链路、工程边界和上线要求。
- 需要为团队选型和搭系统的架构师。你会建立框架选型、工作流设计、记忆系统、工具调用和评估体系的判断标准。
- 希望理解 Agent 能力边界和落地路径的 AI 产品负责人。你会看清 Agent 适合解决什么问题,产品化过程中需要哪些兜底和体验设计。
- 正在做 AI 应用落地的团队负责人。你可以用这套文章检查目标、数据、流程、成本、风险和团队协作是否准备好。
解决什么问题
这个专栏围绕 Agent 工程的主线问题展开。它不会只停留在概念解释,也不会只介绍框架 API,而是把能力、架构、评估和产品化放到一起讨论。
- Agent 产品和传统软件产品有什么差异。专栏会从 Agent 开发范式、Prompt 自主优化、状态管理和工具调用等多维度解释 Agent 系统的特征。
- 一套生产级 Agent 系统需要哪些核心组件。专栏会拆解 Prompt、记忆、工具、推理框架、执行权限、可观测性和评估体系多个方面。
- 如何选择合适 Agent 架构和框架。专栏会比较 Workflow、Minimal Agent、Harness Framework 等区别,单 Agent 和多 Agent 的选择权衡,并对 LangGraph、Pi 等框架思路进行分析。
- 怎样把 Agent 从想法推进到上线。专栏会围绕目标定义、评估集设计、MVP 开发上线、数据监控、迭代等多个环节进行讲解。
- 为什么 Demo 容易,产品化困难。专栏会讨论稳定性、可控性、知识治理、数据闭环、用户体验和组织协作的实际门槛。
专栏目录
Open 专栏目录
第一部分:基础能力
这一部分建立 Agent 工程的基础组件认知。读完以后,你应该能判断一个 Agent 系统由哪些能力组成,以及每个能力在生产环境里承担什么职责。
- 第一篇:Agent 如何重塑软件开发范式:建立 Agent 工程化的基础认知,说明 Agent 为什么会改变软件开发方式,以及它和传统软件工程的差异。
- 第二篇:Prompt 是 Agent 系统的行为控制入口:讨论 Prompt 在 Agent 系统里的工程作用,包括输出格式约束、Prompt 自动优化、提示缓存、各种应用场景下的提示框架等。
- 第三篇:Agent 的记忆系统应该怎么设计:拆解 Agent 的记忆系统,覆盖上下文窗口、RAG、三层记忆模式、经验沉淀、记忆整理与评估。
- 第四篇:Agent 如何调用工具连接真实世界:讨论 Function Calling、MCP、代码执行、沙箱、Browser Use、Skills 和安全边界话题。
- 第五篇:怎样让 Agent 具备真正的推理能力:讲任务分解、思维链、自我一致性、Reflexion、ReAct、Plan-and-Execute 等。
第二部分:框架与控制
这一部分讨论 Agent 执行框架和控制方式。重点是理解不同框架如何处理状态、工作流、长任务、工具调用和可控性,框架 API 只是实现细节。
- 第六篇:Agent 框架应该怎么选:建立执行框架选型方法,讨论如何根据任务复杂度、可靠性要求和团队能力选择控制方式。
- 第七篇:LangGraph 框架解析:用 LangGraph 解释可控 Agent 工作流,重点关注状态图、节点、边、路由、持久化和可观察性。
- 第八篇:Pi 框架解析:讨论极简 Agent 框架 Pi,说明在什么场景下小框架比复杂编排更合适,如何按需扩展。
- 第九篇:如何让 Agent 执行长程任务:拆解执行长程任务 (Long Horizon Task)的经验,关注计划、人机协同、文件系统、执行状态和任务恢复。
- 第十篇:如何搭建 Agent 可观测与评估体系:讨论 Trace、日志、评估集、在线反馈、失败样本回流和持续优化机制。
第三部分:产品案例
这一部分把前面的能力放进具体产品形态里,拆解通用任务 Agent、研究型 Agent 和社媒运营 Agent 的产品实现。
- 第十一篇:如何构建一个类 Manus 产品:把前面的能力组合到通用 Agent 产品中,拆解类 Manus 产品(Claude Cowork、MiniMax Agent Desktop、扣子空间等)的工作机制。
- 第十二篇:如何构建一个类 Deep Research 产品:讨论研究型 Agent 产品,重点关注搜索、规划、资料阅读、多源整合、引用和报告生成。
- 第十三篇:如何构建一个社媒运营 Agent 产品:构建社媒运营 Agent,覆盖热点监测、品牌匹配、内容生成、素材制作、发布等。
第四部分:产品化与上线
这一部分讨论如何从可运行系统走向真实产品,重点是用户体验、可控性、工程教训和上线检查。
- 第十四篇:Agent 从概念走向产品:讨论 Agent 产品化,重点关注用户体验、可控性、成本、灰度上线和商业价值验证。
- 第十五篇:构建 Agent 工程的教训:持续记录 Agent 从架构设计、团队协作到产品化落地过程中的工程教训。
- 第十六篇:一份 Agent 上线自检清单:把目标定义、评估集设计、架构选型、可观测性建设等组成上线检查表。
特别篇
特别篇用于补充主线之外的关键工程方法,适合在做架构评审、复杂任务设计和团队共识建设时对照阅读。
- 上下文工程:LangChain & Manus 五大策略与实践:集中讨论上下文工程,适合在学习记忆系统、长任务执行和多 Agent 协作时反复对照。
- Harness 工程:OpenAI & Martin Fowler 定义 Agent 工程新范式:讨论 Harness Engineering,重点是文件系统、沙箱环境、知识管理、架构约束等。
- 构建可靠 Agent 工程的 12 条原则:总结可靠 Agent 工程的关键原则,适合在做架构评审、上线评审和团队共识建设时使用。
阅读建议
如果你刚开始系统学习 Agent 工程,可以按 1 到 6 篇顺序阅读,先建立基础能力和架构判断。接着阅读 7 到 9 篇,理解不同框架背后的控制方式。然后阅读 10 到 13 篇,把评估体系和典型产品形态连接起来。最后阅读 14 到 16 篇,进入产品化、工程教训和上线自检。
如果你已经在做 Agent 项目,可以先看第十篇、第十五篇和第十六篇,用评估、教训和上线清单检查当前系统。遇到具体问题时,再回到 Prompt、记忆、工具、推理和框架对应章节。
这套专栏最终想回答一个问题:怎样把 Agent 做成可评估维护、可持续迭代的产品,只有系统架构、业务判断和工程能力一起成立,Agent 才能从演示走向真实业务。