Vol.100 Agent走向生产：GPT-5.5、DeepSeek V4、Kimi K2.6与智能体基础设施爆发

⼤家好，Weekly Gradient第 100 期已送达，本期内容聚焦AI模型与Agent基础设施的集中爆发，涵盖OpenAI GPT-5.5、DeepSeek V4的1M上下文、Kimi K2.6长程编码与Agent集群，以及智能体云、Harness Engineering、Token Maxing等前沿议题。

AI 商业

聚焦 AI 行业的商业化路径、市场竞争格局和商业模式创新，包含投资趋势、GTM 策略、SaaS 转型等商业话题。

1.Sam Altman + Greg Brockman - 关于 OpenAI 的重大重置（Core Memory Podcast）

OpenAI 联合创始人 Sam Altman 与 Greg Brockman 在 Core Memory 播客中罕见同台，深度复盘了公司从早期实验室向行业引领者的进化历程。对话核心揭示了 OpenAI 的战略转型：从「模型即产品」转向构建智能体基础设施。Greg 详细解释了为何优先发展 Codex 以处理繁琐的「计算机工作」，并为此战略性推迟 Sora 等项目。两人还探讨了个人 AGI 的愿景，即 AI 将进化为具备深度上下文感知、能代表用户执行任务的直观界面。面对与埃隆·马斯克的法律纠纷与行业动荡，他们重申了算力普惠对缓解社会不平等的重要性。

2.科技爱好者周刊（第 394 期）：第二次 API 开放浪潮（阮一峰的网络日志）

如果你还在纠结要不要开放API，这篇文章可能会让你后背一凉。2011年那波API浪潮让平台们尝到了数据共享的甜头，但2025年的第二次浪潮完全不同——AI智能体正在成为新的用户入口，不开放API或MCP接口的平台，将直接被智能体忽略，沦为数字孤岛。文章用两个时间节点的对比，犀利点出API已经从“可选项”变成了“生存门票”，尤其对内容平台和工具类产品来说，开放接口不再是锦上添花，而是避免被AI时代抛弃的底线。读完你会明白，为什么说AI的核心不是生成内容，而是让内容能通过API被自动化工作流调用。

AI 产品

探索 AI 原生产品的设计范式与用户体验革新，强调产品哲学、交互模式、Agent 产品设计等。

1.GPT-5.5 发布（OpenAI Blog）

OpenAI 刚发布的 GPT-5.5 可不是简单的版本升级，它标志着大模型从聊天机器人真正迈向了能自主干活的智能体。响应速度和前代一样快，但推理更深、执行更高效，尤其在写代码、操控电脑和搞科研这些复杂任务上，直接刷新了多个基准测试的纪录。更让人放心的是，它加入了更严的安全机制和信任访问计划，处理高风险任务时靠谱多了。这次升级，感觉 AI 离真正帮我们干活又近了一大步。

2.DeepSeek-V4 预览版：迈入百万上下文普惠时代（DeepSeek）

DeepSeek-V4 预览版来了，直接标配 1M 上下文，还开源了两个版本：Pro 和 Flash。Pro 版在代码生成上已经能跟顶级闭源模型掰手腕，Agent 能力和推理性能也很强；Flash 版则主打速度和性价比。技术上用了 DSA 稀疏注意力和 token 压缩，把长文本处理的计算和显存开销降了下来。如果你需要处理海量文档或者搭建复杂自动化工作流，这个模型值得关注。

3.这就是 ChatGPT 图像 2.0（OpenAI）

ChatGPT Images 2.0 不再只是玩艺术，而是真正能帮你干活的工具。它学会了“思考”和联网搜索，确保生成的图像准确无误，还能搞定精准排版、复杂图表甚至数学证明。最厉害的是，它支持多语言和成套图像连贯生成，杂志排版、家装设计、漫画创作都能一键自动化。如果你需要2K高清细节和结构化设计，这个模型从视觉到落地一步到位，生产力直接拉满。

4.工作区智能体（OpenAI Blog）

OpenAI 新发布的工作区智能体，让你能构建可重复的业务工作流，把 AI 无缝嵌入日常协作。它整合了触发器、专业技能和第三方工具，能处理比传统 API 更复杂的概率性任务。文章给出了信息简报、任务分发、数据分析等典型模式，帮你从零到一实现自动化转型，团队协作效率直接拉满。

5.Anthropic 产品团队如何比任何人都快 | Cat Wu（Claude Code 产品负责人）（Lenny’s Podcast）

Anthropic 的 Claude Code 产品负责人 Cat Wu 分享了一个让人震惊的事实：他们的发布周期可以缩短到 1 天。这背后是彻底的去流程化思维——砍掉不必要的流程，让团队像初创公司一样快速迭代。在 LLM 能力飞速提升的当下，传统的长期规划已经失效，PM 必须转型为靠“产品品味”做决策的人，而不是依赖 roadmap 和文档。更值得关注的是，工程师和 PM 的职能正在融合，未来最稀缺的能力可能是“自动化一切”。如果你想在 AI 时代保持竞争力，这篇文章会给你一剂强心针。

AI 工程

涵盖 AI 工程技术实现与场景化开发的全流程，包含 Agent 工程架构、工具实践、上下文工程等核心技术话题。

1.Kimi K2.6 发布并开源，全面精进代码和 Agent 集群能力（月之暗面 Kimi）

月之暗面刚发布的Kimi K2.6模型，在代码和Agent集群上又往前迈了一大步。它通过强化学习把逻辑推理和工程能力拉高了不少，能连续编码13小时不停歇，还能调动300个智能体并行干活。多模态编程能力也让人眼前一亮，能直接生成带专业交互设计的Web应用，在SWE-Bench Pro等测试里甚至超过了部分主流闭源模型。如果你在关注AI编程或Agent协作，这个模型值得仔细看看。

2.AI 如何改变软件工程：与 Gergely Orosz (@pragmaticengineer) 的对话（AI Engineer）

Gergely Orosz 在对话中揭露了大厂内部一个有趣的现象：工程师为了应付绩效考核，开始虚报 AI 使用量，他称之为「Token Maxing」。这背后是软件工程师角色正在从写代码的人变成 AI 智能体的系统编排者。他还分享了 Uber 和 Shopify 如何自己动手搭建定制化的 AI 基础设施和 MCP 网关，而不是盲目套用现成工具。整篇对话非常务实，既讲了 AI 对生产力的真实影响，也点出了组织层面的挑战，技术管理者和工程师都值得一读。

3.构建智能体云：我们在 2026 年智能体周期间发布的一切（The Cloudflare Blog）

Cloudflare 在 Agents Week 上放了个大招，正式推出专为 Agent 负载设计的智能体云，宣告进入 Cloud 2.0 时代。这次更新覆盖了全栈能力：支持 Git 的 Artifacts 存储、持久化 Sandbox 环境、Managed OAuth 身份验证，还有 Mesh 私有联网技术。最亮眼的是 Unweight 压缩技术和 Agent Memory，前者大幅降低推理成本，后者让 Agent 拥有长期记忆。这篇文章系统梳理了如何把实验性原型变成规模化生产应用，是理解未来智能体网络基础设施的必读内容。

4.使用 MCP 构建能够接入生产系统的智能体 | Claude（Claude Blog）

想把AI智能体接入生产系统？这篇文章对比了三种路径：直接调API、用CLI、以及MCP协议。随着智能体往云端迁移，MCP成了解决集成难题的关键，SDK月下载量都破3亿了。作者分享的实战经验很实在：建议按“意图”组织工具，而不是按API端点；复杂接口就用代码编排。对想构建可扩展智能体生态的开发者来说，这些一线洞察值得细读。

5.智能体技术栈的押注（Elevate）

智能体从演示到生产，需要四大支柱：独立身份、通用上下文、持久化运行和标准化平台。别再重复造轮子了，用成熟平台处理业务逻辑，才能构建可靠、可治理的AI系统。

6.从第一性原理思考 Agentic Engineering（腾讯云开发者）

当大家都在追逐 vibe coding 的随性时，这篇文章却反其道而行之，呼吁在 AI 协作中回归工程纪律。它从第一性原理出发，直面大语言模型的概率性本质和人类认知资源的有限性，提出了一套降低信息损耗、打破知识孤岛的工程方法论。核心实践包括 Context Engineering、Spec-First 流程和基于 Skill 的模块化框架，并且已经落地为开源工具。如果你正在为如何让 AI 在复杂系统中稳定可靠地提升研发效能而头疼，这篇深度指南会给你非常务实的启发。

7.从提需求到部署发布，全 AI 全自动化后，研发效能全面跃升（腾讯技术工程）

腾讯审核团队分享了一套从需求到部署全链路AI自动化的实践，不只是写代码，而是把流程标准化、知识库和核心技能都打通了。他们提出的Harness Engineering框架和“交付+治理”双轮驱动模式，能帮企业在复杂场景下把研发效率提升一个量级，值得每个搞工程的人看看。

8.从玩具到生产力：用真实项目讲透 AI Agent 的 Harness Engineering（阿里云开发者）

别再迷信prompt了！在企业级AI应用中，靠调prompt根本管不住大模型的随机性。这篇文章提出一个硬核思路：用物理控制面（Harness）来约束AI，就像给野马套上缰绳。核心三板斧是Spec驱动开发、执行前Checkpoint和基于证据的验证，确保智能体不跑偏。程序员不再是写代码的工具人，而是升级成定义目标和掌控节奏的控盘者。想从“被AI支配”变成“支配AI”？这篇值得细读。

9.Garry Tan 的 Claude Code 设置内幕（Y Combinator）

YC总裁Garry Tan亲自演示如何用开源工具GStack把Claude Code升级成全能智能体工程团队。这个工具模拟了YC经典的Office Hours流程，让你在写代码前先打磨好产品策略和商业模式。视频里还展示了对抗性审查、自动化UI设计和Playwright浏览器测试等硬核技能。Garry认为软件开发已经进入智能体时代，管理好并行会话和自动化工作流，一个人就能干出一个团队的活。

10.138. 对罗福莉 3.5 小时访谈：AI 范式已然巨变！OpenClaw、Agent 范式很吃后训练、卡的分配、组织平权（张小珺Jùn｜商业访谈录）

小米大模型负责人罗福莉在3.5小时的深度访谈中，揭示了2026年AI范式的根本转变：从预训练主导转向后训练主导的Agent时代。OpenClaw和Claude 4.6等技术突破，让算力分配开始向后训练倾斜，顶尖团队甚至达到1:1的平衡。RL Scaling成为Agent能力跃升的关键，而Agent框架编排让研究效率从“周”缩短到“小时”。如果你关心模型架构演进、研发管理或AI组织转型，这篇访谈绝对值得一读。

11.Shopify 的 AI 相变：2026 年使用量激增，无限的 Opus-4.6 Token 预算，Tangle，Tangent，SimGym —— 对话 Shopify CTO Mikhail Parakhin（Latent Space）

Shopify CTO Mikhail Parakhin 透露，公司内部 AI 采用率已超 90%，背后靠三大系统支撑：Tangle 实现可重复的机器学习工作流，Tangent 自动优化科研，SimGym 用历史数据模拟顾客行为。访谈还聊到非 Transformer 架构 Liquid AI 在低延迟搜索中的表现，以及 AI 编程的瓶颈已从代码生成转向审查和发布稳定性。这些细节展示了 Shopify 如何把 AI 深度嵌入工程实践，而不是停留在概念层面。

12.当我们在讨论 Harness 的时候，我们在讨论什么 | 深度对谈: MiniMax × Hermes Agent（十字路口Crossing）

如果你还在纠结Agent到底能不能落地，这篇MiniMax和Hermes开发者的深度对谈可能会刷新你的认知。他们复盘了Agent领域的范式变迁，核心亮点是Hermes通过记忆系统实现了自我进化，而Harness作为「挽具」能释放模型潜能。更关键的是，多智能体协作在解决长程任务上已经积累了实战经验。文章还大胆预测：通用Agent终将内化垂直能力，而人类在高复杂度工作中的角色将从执行转向「审美」和目标定义。对于关注Agent Infra和未来生产力重构的你，这绝对是值得细读的趋势预测。

其他

行业前沿与开源生态，整合行业深度洞察与开源技术动态的复合型主题，技术哲学、AGI 讨论、领袖观点。

1.OpenAI 联合创始人 Greg Brockman 谈 AI 竞赛、Sam Altman 解雇风波与 AGI 未来（The Knowledge Project Podcast）

OpenAI联合创始人Greg Brockman在播客中深度复盘了公司从非营利转向营利的战略，并首次披露Sam Altman被罢免时团队内部的博弈与惊人忠诚度。从Dota实验到GPT-4的算力演进，他解释了强化学习如何让AI从预测跨越到推理，并预言未来经济将由80亿个个人Agent驱动。这场访谈信息量极大，适合想了解OpenAI内幕和AGI未来的人。