这套专栏讨论如何把 AI Agent 从概念、Demo 和单点能力,推进到真实产品和生产系统。它关注 Agent 工程里反复出现的核心问题:目标定义,系统拆分,能力组合,风险控制,效果评估,产品上线Trace。
Agent 和传统软件、普通 LLM 应用都有明显差异,传统软件依赖确定流程,普通 LLM 应用多停留在一次输入和一次输出,Agent 则需要在目标、上下文、工具、记忆、推理和反馈之间持续决策,只要系统开始调用工具、跨步骤执行、保留状态并根据反馈调整路径,它就进入了工程化难度更高的区域。
这个系列会从基础能力讲到框架选型,再进入典型产品拆解,最后收束到产品化、工程教训和上线清单。读完以后,你应该能判断一个 Agent 项目是否值得做,第一版系统应该怎么搭,哪些能力必须自己掌握,哪些部分可以交给框架和平台。
适合谁
| 读者 | 你会得到什么 |
|---|---|
| 想把 AI Agent 做成真实产品的工程师 | 理解 Agent 的核心组件、执行链路、工程边界和上线要求 |
| 需要为团队选型和搭系统的架构师 | 建立框架选型、工作流设计、记忆系统、工具调用和评估体系的判断标准 |
| 希望理解 Agent 能力边界和落地路径的 AI 产品负责人 | 看清 Agent 适合解决什么问题,产品化过程中需要哪些兜底和体验设计 |
| 正在做 AI 应用落地的团队负责人 | 用一套清单检查目标、数据、流程、成本、风险和团队协作是否准备好 |
解决什么问题
| 问题 | 专栏里的回答 |
|---|---|
| Agent 和传统软件、纯 LLM 应用有什么差异 | 从软件开发范式、Prompt 控制、状态管理和工具调用解释 Agent 的系统特征 |
| 一套生产级 Agent 系统需要哪些核心组件 | 拆解 Prompt、记忆、工具、推理、执行框架、可观测性和评估体系 |
| 如何选择 Agent 架构和框架 | 比较 Minimal Agent、Workflow、Dynamic Planning,以及 LangGraph、Claude Code、Pi 等框架思路 |
| 怎样把 Agent 从想法推进到上线 | 从目标定义、评估集、MVP、灰度、监控、复盘和团队能力建设逐步推进 |
| 为什么 Demo 容易,产品化困难 | 讨论稳定性、可控性、知识治理、数据闭环、用户体验和组织协作的实际门槛 |
专栏目录
Open 专栏目录
第一篇:Agent 如何重塑软件开发范式
这一篇建立 Agent 工程化的基础认知,说明 Agent 为什么会改变软件开发方式,以及它和传统软件工程的差异。
第二篇:Prompt 是 Agent 系统的行为控制入口
这一篇讨论 Prompt 在 Agent 系统里的工程作用,包括角色设定、示例约束、输出格式、工具调用和稳定性控制。
第三篇:Agent 的记忆系统应该怎么设计
这一篇拆解 Agent 的记忆系统,覆盖上下文窗口、RAG、三层记忆、经验沉淀、记忆整理与评估。
第四篇:Agent 如何调用工具连接真实世界
这一篇讨论 Function Calling、MCP、代码执行、沙箱、Browser Agent、Skills 和工具调用安全边界。
第五篇:怎样让 Agent 具备真正的推理能力
这一篇讲任务分解、思维链、自我一致性、Reflexion、ReAct、Plan-and-Execute 和代码推理。
第六篇:Agent 框架应该怎么选
这一篇建立执行框架选型方法,讨论如何根据任务复杂度、可靠性要求和团队能力选择控制方式。
第七篇:LangGraph 框架解析
这一篇用 LangGraph 解释可控 Agent 工作流,重点关注状态图、节点、边、路由、持久化和可观察性。
第八篇:Claude Code 解析
这一篇拆解长任务 Agent 的运行方式,关注计划、工具、浏览器、文件系统、执行状态和任务恢复。
第九篇:Pi 框架解析
这一篇讨论极简 Agent 框架的价值,说明在什么场景下小框架比复杂编排更合适。
第十篇:如何搭建 Agent 可观测与评估体系
这一篇讨论 Trace、日志、评估集、在线反馈、失败样本回流和持续优化机制。
第十一篇:如何构建一个类 Manus 产品
这一篇把前面的能力组合到通用任务 Agent 中,拆解类 Manus 产品需要的核心系统。
第十二篇:如何构建一个类 Deep Research 产品
这一篇讨论研究型 Agent 产品,重点关注搜索、规划、资料阅读、多源整合、引用和报告生成。
第十三篇:如何构建一个社媒运营 Agent 产品
这一篇拆解社媒运营 Agent,覆盖热点监测、品牌匹配、内容生成、素材制作、发布互动和数据复盘。
第十四篇:Agent 从概念走向产品
这一篇讨论 Agent 产品化,重点关注用户体验、可控性、成本、灰度上线和商业价值验证。
第十五篇:构建 Agent 工程的教训
这一篇持续记录 Agent 从架构设计、团队协作到产品化落地过程中的工程教训。
第十六篇:一份 Agent 上线自检清单
这一篇把目标定义、评估集、架构选型、工具记忆、可观测性、产品化和团队建设收束成上线检查表。
特别篇
上下文工程:LangChain & Manus 五大策略与实践
这一篇集中讨论上下文工程,适合在学习记忆系统、长任务执行和多 Agent 协作时反复对照。
Harness 工程:OpenAI & Martin Fowler 定义 Agent 工程新范式
这一篇讨论 Harness Engineering,重点是文件系统、沙箱环境、知识管理、架构约束和工程化执行环境。
构建可靠 Agent 工程的 12 条原则
这一篇总结可靠 Agent 工程的关键原则,适合在做架构评审、上线评审和团队共识建设时使用。
阅读建议
如果你刚开始系统学习 Agent 工程,可以按 1 到 6 篇顺序阅读,先建立基础能力和架构判断。接着阅读 7 到 9 篇,理解不同框架背后的控制方式。然后阅读 10 到 13 篇,把评估体系和典型产品形态连接起来。最后阅读 14 到 16 篇,进入产品化、工程教训和上线自检。
如果你已经在做 Agent 项目,可以先看第十篇、第十五篇和第十六篇,用评估、教训和上线清单检查当前系统。遇到具体问题时,再回到 Prompt、记忆、工具、推理和框架对应章节。
这套专栏最终想回答一个问题:怎样把 Agent 做成可运行、可评估、可维护、可持续迭代的产品。只有系统能力、产品判断和工程纪律一起成立,Agent 才能从演示走向真实业务。