⼤家好,Weekly Gradient第 100 期已送达,本期内容聚焦AI模型与Agent基础设施的集中爆发,涵盖OpenAI GPT-5.5、DeepSeek V4的1M上下文、Kimi K2.6长程编码与Agent集群,以及智能体云、Harness Engineering、Token Maxing等前沿议题。
AI 商业
聚焦 AI 行业的商业化路径、市场竞争格局和商业模式创新,包含投资趋势、GTM 策略、SaaS 转型等商业话题。
1.Sam Altman + Greg Brockman - 关于 OpenAI 的重大重置(Core Memory Podcast)
OpenAI 联合创始人 Sam Altman 与 Greg Brockman 在 Core Memory 播客中罕见同台,深度复盘了公司从早期实验室向行业引领者的进化历程。对话核心揭示了 OpenAI 的战略转型:从「模型即产品」转向构建智能体基础设施。Greg 详细解释了为何优先发展 Codex 以处理繁琐的「计算机工作」,并为此战略性推迟 Sora 等项目。两人还探讨了个人 AGI 的愿景,即 AI 将进化为具备深度上下文感知、能代表用户执行任务的直观界面。面对与埃隆·马斯克的法律纠纷与行业动荡,他们重申了算力普惠对缓解社会不平等的重要性。
2.科技爱好者周刊(第 394 期):第二次 API 开放浪潮(阮一峰的网络日志)
如果你还在纠结要不要开放API,这篇文章可能会让你后背一凉。2011年那波API浪潮让平台们尝到了数据共享的甜头,但2025年的第二次浪潮完全不同——AI智能体正在成为新的用户入口,不开放API或MCP接口的平台,将直接被智能体忽略,沦为数字孤岛。文章用两个时间节点的对比,犀利点出API已经从“可选项”变成了“生存门票”,尤其对内容平台和工具类产品来说,开放接口不再是锦上添花,而是避免被AI时代抛弃的底线。读完你会明白,为什么说AI的核心不是生成内容,而是让内容能通过API被自动化工作流调用。
AI 产品
探索 AI 原生产品的设计范式与用户体验革新,强调产品哲学、交互模式、Agent 产品设计等。
1.GPT-5.5 发布(OpenAI Blog)
OpenAI 刚发布的 GPT-5.5 可不是简单的版本升级,它标志着大模型从聊天机器人真正迈向了能自主干活的智能体。响应速度和前代一样快,但推理更深、执行更高效,尤其在写代码、操控电脑和搞科研这些复杂任务上,直接刷新了多个基准测试的纪录。更让人放心的是,它加入了更严的安全机制和信任访问计划,处理高风险任务时靠谱多了。这次升级,感觉 AI 离真正帮我们干活又近了一大步。
2.DeepSeek-V4 预览版:迈入百万上下文普惠时代(DeepSeek)
DeepSeek-V4 预览版来了,直接标配 1M 上下文,还开源了两个版本:Pro 和 Flash。Pro 版在代码生成上已经能跟顶级闭源模型掰手腕,Agent 能力和推理性能也很强;Flash 版则主打速度和性价比。技术上用了 DSA 稀疏注意力和 token 压缩,把长文本处理的计算和显存开销降了下来。如果你需要处理海量文档或者搭建复杂自动化工作流,这个模型值得关注。
3.这就是 ChatGPT 图像 2.0(OpenAI)
ChatGPT Images 2.0 不再只是玩艺术,而是真正能帮你干活的工具。它学会了“思考”和联网搜索,确保生成的图像准确无误,还能搞定精准排版、复杂图表甚至数学证明。最厉害的是,它支持多语言和成套图像连贯生成,杂志排版、家装设计、漫画创作都能一键自动化。如果你需要2K高清细节和结构化设计,这个模型从视觉到落地一步到位,生产力直接拉满。
4.工作区智能体(OpenAI Blog)
OpenAI 新发布的工作区智能体,让你能构建可重复的业务工作流,把 AI 无缝嵌入日常协作。它整合了触发器、专业技能和第三方工具,能处理比传统 API 更复杂的概率性任务。文章给出了信息简报、任务分发、数据分析等典型模式,帮你从零到一实现自动化转型,团队协作效率直接拉满。
5.Anthropic 产品团队如何比任何人都快 | Cat Wu(Claude Code 产品负责人)(Lenny’s Podcast)
Anthropic 的 Claude Code 产品负责人 Cat Wu 分享了一个让人震惊的事实:他们的发布周期可以缩短到 1 天。这背后是彻底的去流程化思维——砍掉不必要的流程,让团队像初创公司一样快速迭代。在 LLM 能力飞速提升的当下,传统的长期规划已经失效,PM 必须转型为靠“产品品味”做决策的人,而不是依赖 roadmap 和文档。更值得关注的是,工程师和 PM 的职能正在融合,未来最稀缺的能力可能是“自动化一切”。如果你想在 AI 时代保持竞争力,这篇文章会给你一剂强心针。
AI 工程
涵盖 AI 工程技术实现与场景化开发的全流程,包含 Agent 工程架构、工具实践、上下文工程等核心技术话题。
1.Kimi K2.6 发布并开源,全面精进代码和 Agent 集群能力(月之暗面 Kimi)
月之暗面刚发布的Kimi K2.6模型,在代码和Agent集群上又往前迈了一大步。它通过强化学习把逻辑推理和工程能力拉高了不少,能连续编码13小时不停歇,还能调动300个智能体并行干活。多模态编程能力也让人眼前一亮,能直接生成带专业交互设计的Web应用,在SWE-Bench Pro等测试里甚至超过了部分主流闭源模型。如果你在关注AI编程或Agent协作,这个模型值得仔细看看。
2.AI 如何改变软件工程:与 Gergely Orosz (@pragmaticengineer) 的对话(AI Engineer)
Gergely Orosz 在对话中揭露了大厂内部一个有趣的现象:工程师为了应付绩效考核,开始虚报 AI 使用量,他称之为「Token Maxing」。这背后是软件工程师角色正在从写代码的人变成 AI 智能体的系统编排者。他还分享了 Uber 和 Shopify 如何自己动手搭建定制化的 AI 基础设施和 MCP 网关,而不是盲目套用现成工具。整篇对话非常务实,既讲了 AI 对生产力的真实影响,也点出了组织层面的挑战,技术管理者和工程师都值得一读。
3.构建智能体云:我们在 2026 年智能体周期间发布的一切(The Cloudflare Blog)
Cloudflare 在 Agents Week 上放了个大招,正式推出专为 Agent 负载设计的智能体云,宣告进入 Cloud 2.0 时代。这次更新覆盖了全栈能力:支持 Git 的 Artifacts 存储、持久化 Sandbox 环境、Managed OAuth 身份验证,还有 Mesh 私有联网技术。最亮眼的是 Unweight 压缩技术和 Agent Memory,前者大幅降低推理成本,后者让 Agent 拥有长期记忆。这篇文章系统梳理了如何把实验性原型变成规模化生产应用,是理解未来智能体网络基础设施的必读内容。
4.使用 MCP 构建能够接入生产系统的智能体 | Claude(Claude Blog)
想把AI智能体接入生产系统?这篇文章对比了三种路径:直接调API、用CLI、以及MCP协议。随着智能体往云端迁移,MCP成了解决集成难题的关键,SDK月下载量都破3亿了。作者分享的实战经验很实在:建议按“意图”组织工具,而不是按API端点;复杂接口就用代码编排。对想构建可扩展智能体生态的开发者来说,这些一线洞察值得细读。
5.智能体技术栈的押注(Elevate)
智能体从演示到生产,需要四大支柱:独立身份、通用上下文、持久化运行和标准化平台。别再重复造轮子了,用成熟平台处理业务逻辑,才能构建可靠、可治理的AI系统。
6.从第一性原理思考 Agentic Engineering(腾讯云开发者)
当大家都在追逐 vibe coding 的随性时,这篇文章却反其道而行之,呼吁在 AI 协作中回归工程纪律。它从第一性原理出发,直面大语言模型的概率性本质和人类认知资源的有限性,提出了一套降低信息损耗、打破知识孤岛的工程方法论。核心实践包括 Context Engineering、Spec-First 流程和基于 Skill 的模块化框架,并且已经落地为开源工具。如果你正在为如何让 AI 在复杂系统中稳定可靠地提升研发效能而头疼,这篇深度指南会给你非常务实的启发。
7.从提需求到部署发布,全 AI 全自动化后,研发效能全面跃升(腾讯技术工程)
腾讯审核团队分享了一套从需求到部署全链路AI自动化的实践,不只是写代码,而是把流程标准化、知识库和核心技能都打通了。他们提出的Harness Engineering框架和“交付+治理”双轮驱动模式,能帮企业在复杂场景下把研发效率提升一个量级,值得每个搞工程的人看看。
8.从玩具到生产力:用真实项目讲透 AI Agent 的 Harness Engineering(阿里云开发者)
别再迷信prompt了!在企业级AI应用中,靠调prompt根本管不住大模型的随机性。这篇文章提出一个硬核思路:用物理控制面(Harness)来约束AI,就像给野马套上缰绳。核心三板斧是Spec驱动开发、执行前Checkpoint和基于证据的验证,确保智能体不跑偏。程序员不再是写代码的工具人,而是升级成定义目标和掌控节奏的控盘者。想从“被AI支配”变成“支配AI”?这篇值得细读。
9.Garry Tan 的 Claude Code 设置内幕(Y Combinator)
YC总裁Garry Tan亲自演示如何用开源工具GStack把Claude Code升级成全能智能体工程团队。这个工具模拟了YC经典的Office Hours流程,让你在写代码前先打磨好产品策略和商业模式。视频里还展示了对抗性审查、自动化UI设计和Playwright浏览器测试等硬核技能。Garry认为软件开发已经进入智能体时代,管理好并行会话和自动化工作流,一个人就能干出一个团队的活。
10.138. 对罗福莉 3.5 小时访谈:AI 范式已然巨变!OpenClaw、Agent 范式很吃后训练、卡的分配、组织平权(张小珺Jùn|商业访谈录)
小米大模型负责人罗福莉在3.5小时的深度访谈中,揭示了2026年AI范式的根本转变:从预训练主导转向后训练主导的Agent时代。OpenClaw和Claude 4.6等技术突破,让算力分配开始向后训练倾斜,顶尖团队甚至达到1:1的平衡。RL Scaling成为Agent能力跃升的关键,而Agent框架编排让研究效率从“周”缩短到“小时”。如果你关心模型架构演进、研发管理或AI组织转型,这篇访谈绝对值得一读。
11.Shopify 的 AI 相变:2026 年使用量激增,无限的 Opus-4.6 Token 预算,Tangle,Tangent,SimGym —— 对话 Shopify CTO Mikhail Parakhin(Latent Space)
Shopify CTO Mikhail Parakhin 透露,公司内部 AI 采用率已超 90%,背后靠三大系统支撑:Tangle 实现可重复的机器学习工作流,Tangent 自动优化科研,SimGym 用历史数据模拟顾客行为。访谈还聊到非 Transformer 架构 Liquid AI 在低延迟搜索中的表现,以及 AI 编程的瓶颈已从代码生成转向审查和发布稳定性。这些细节展示了 Shopify 如何把 AI 深度嵌入工程实践,而不是停留在概念层面。
12.当我们在讨论 Harness 的时候,我们在讨论什么 | 深度对谈: MiniMax × Hermes Agent(十字路口Crossing)
如果你还在纠结Agent到底能不能落地,这篇MiniMax和Hermes开发者的深度对谈可能会刷新你的认知。他们复盘了Agent领域的范式变迁,核心亮点是Hermes通过记忆系统实现了自我进化,而Harness作为「挽具」能释放模型潜能。更关键的是,多智能体协作在解决长程任务上已经积累了实战经验。文章还大胆预测:通用Agent终将内化垂直能力,而人类在高复杂度工作中的角色将从执行转向「审美」和目标定义。对于关注Agent Infra和未来生产力重构的你,这绝对是值得细读的趋势预测。
其他
行业前沿与开源生态,整合行业深度洞察与开源技术动态的复合型主题,技术哲学、AGI 讨论、领袖观点。
1.OpenAI 联合创始人 Greg Brockman 谈 AI 竞赛、Sam Altman 解雇风波与 AGI 未来(The Knowledge Project Podcast)
OpenAI联合创始人Greg Brockman在播客中深度复盘了公司从非营利转向营利的战略,并首次披露Sam Altman被罢免时团队内部的博弈与惊人忠诚度。从Dota实验到GPT-4的算力演进,他解释了强化学习如何让AI从预测跨越到推理,并预言未来经济将由80亿个个人Agent驱动。这场访谈信息量极大,适合想了解OpenAI内幕和AGI未来的人。