Vol.104 自动化加速，人类专家价值飙升：AI Agent工程体系化与产业变革

⼤家好，Weekly Gradient第 104 期已送达，本期内容聚焦AI自动化加速下人类专家价值上升的悖论，涵盖Gemini 3.5、Qwen3.7-Max等模型突破，Agent工程体系化（记忆、梦想、对抗式评估），以及AI原生创业与硬件趋势。

AI 商业

聚焦 AI 行业的商业化路径、市场竞争格局和商业模式创新，包含投资趋势、GTM 策略、SaaS 转型等商业话题。

1.AI 硬件浪潮才刚刚开始：来自 Apple、Meta、OpenAI 一线的产业判断（Lenny’s Podcast）

AI硬件可不是简单的耳机或眼镜，一场由苹果、Meta和OpenAI内部人士参与的对谈，直接抛出了不少硬核判断：具身智能会比想象中更快落地，终端侧推理才是让设备真正聪明的关键，硬件形态也在快速演进。别被那些虚头巴脑的趋势分析带偏，听听一线操盘手怎么拆解，能帮你更清醒地看清AI硬件接下来的牌局。

2.当软件容易被创作，新时代的产品长什么样？ | 对谈 Albert（42章经）

这期42章经和Albert聊了个很实在的话题：当AI让写软件变得跟说话一样简单，创业空间到底在哪？他们提到模型厂商正在挤压创业者的生存空间，团队两个月试了几十个项目，最后发现真正的机会可能不在技术本身，而是品牌溢价、长尾消费和平台型产品。Albert的新产品merging.live就是给新一代maker提供反馈和连接的地方。如果你关心AI创业、vibe coding或者独立产品怎么做，这期很值得听。

3.创始人手册：打造 AI 原生初创公司（宝玉的分享）

如果你正在或打算进入AI创业领域，这本创始人手册就像一本实战地图。它从团队搭建、产品策略到工程实现，给出了整套可落地的框架，而不是零散的观点。无论你是技术背景还是初次创业，都能找到自己的定位和下一步行动指南。

AI 产品

探索 AI 原生产品的设计范式与用户体验革新，强调产品哲学、交互模式、Agent 产品设计等。

1.Gemini 3.5：具备行动能力的前沿智能（DeepMind Blog）

DeepMind 最新发布的 Gemini 3.5 Flash 真的太顶了！它不只是个聪明的大脑，还能动手干活——在代理和编码任务上表现炸裂，处理复杂长期任务又快又便宜。现在已经有个人 AI 助手和企业方案在用，感觉智能代理的黄金时代真要来了。

2.Introducing Composer 2.5 · Cursor（Cursor Blog）

Cursor 终于发布了 Composer 2.5，作为 AI 编码领域的头部产品，这次更新带来了代码助手能力的显著升级。如果你想第一时间了解新版本的能力边界和产品方向，这篇文章来自官方博客，信息量直接且关键。

3.Notion 创始人 Ivan Zhao：重塑公司的艺术（Sequoia Capital）

Notion 创始人 Ivan Zhao 分享了一套很酷的公司管理哲学：把组织变成爵士乐队，让每个人高度自治、即兴创作。他还提到 AI 产品开发要从‘造桥’变成‘酿酒’，意思是别硬规划，要慢慢发酵。最有趣的是‘杠铃式人才模型’——一边是极少数资深专家，一边是大量灵活执行者，中间层被 AI 替代，就像用 AI 当‘结构钢’来保持公司既大规模又敏捷。

AI 工程

涵盖 AI 工程技术实现与场景化开发的全流程，包含 Agent 工程架构、工具实践、上下文工程等核心技术话题。

1.选择正确模型：LLM Evals 与优化的数据驱动指南（Claude）

别再迷信公共基准了，你的业务场景和别人的不一样。这篇指南手把手教你搭建自己的评估框架，怎么选模型、怎么优化，全看数据说话。还有杀手锏——提示缓存和上下文工程，能省下不少成本还提升推理准确性，挺实用的干货。

2.Qwen3.7-Max 重新定义 AI Agent 基座（通义大模型）

Qwen3.7-Max在多个权威评测中拿到国内第一，最硬核的是它通过了35小时连续自主执行、1158次工具调用零中断的极限测试，长程智能体的稳定性和深度推理能力让人印象深刻。这篇博文把它的核心亮点和复杂任务中的工程实践讲得很透，如果你正在找靠谱的智能体方案，里面有不少实打实的参考。

3.Google Cloud 在 I/O ‘26 上为智能体开发者带来的新动态（Google Cloud Blog）

Google Cloud 在 I/O ‘26 上亮出了智能体开发栈的四层架构：Agent Studio、Managed Agents API、Antigravity 2.0 和 ADK 2.0。如果你正在纠结从哪个层级入手，这篇文章给你提供了一个从低代码到代码优先、从快速试验到工程治理的选择框架，能帮你和团队快速定位最适合的切入点。不管你是刚接触智能体还是已有工程体系，都能从中找到自己的位置。

4.用于自学习自主 Agents 的 Memory 与 Dreaming（Claude）

Anthropic 给自主 Agent 加上了两个新技能：记忆和梦想。记忆就像个虚拟文件系统，让 agent 能随时调用知识；梦想则像脱机优化循环，全局统筹记忆状态。两者结合让 agent 持续自我改进——Rakuten 用这套方案后，首次执行错误率狂降 97%，企业自动化效率飞升。

5.构建能持续运行数小时的智能体：Anthropic 工程师揭秘对抗式生成-评估架构（AI Engineer）

Anthropic工程师在AI Engineer大会上分享了一个超实用的干货：怎么让智能体稳定运行几个小时？他们搞了个“对抗式生成-评估”架构——用一个模型专门挑另一个模型的刺，这样在长任务链中质量就不容易崩。这可是目前生产级Agent最头疼的问题之一，一手经验加架构拆解，读起来很过瘾。

6.别构建垃圾：AI 智能体成熟度的四个层级（AI Engineer）

别被那些花里胡哨的智能体叙事骗了——Ara Khan 的分享直接把你拉回工程现实：状态机、提示词剪枝、集成循环、架构边界和云端部署，全是硬仗。他提出的四级成熟度框架和看板式并发管理，对正在从原型往生产爬、害怕堆出“智能体垃圾代码库”的团队来说，简直是救命指南。

7.重新定义 Skill 开发：保姆级教程&一站式开发助手发布（阿里云开发者）

如果你正在做 Agent 或 Skill 开发，这篇就是为你量身定制的补课材料。它不像那些只讲概念的泛泛而谈，而是从触发规则、目录结构到写作规范，一路打通发布、调试和跨平台迁移。更棒的是，它把版本管理、热加载、评测这些工程痛点串成一条完整流水线，还附带了 skill-dev-aio 这个一站式工具。读完你就能把个人经验变成可复用的 Agent 能力，少走不少弯路。

8.从 0 开发大模型的 17 种 Agent 架构演进详细拆解（腾讯技术工程）

如果你在搭建大模型应用时对Agent架构如何选型感到头秃，腾讯技术工程团队这篇从零开始的拆解简直救星。他们梳理了17种Agent架构的演进路线，从最简单的单步执行到复杂的多智能体协作全覆盖。和那些泛泛而谈的文章不同，这篇真的聚焦工程实现，直接告诉你每种架构适合什么场景、有哪些坑。开发者朋友们可以拿来当架构设计参考手册，挺实在的。

9.CIO 正在抛弃 AI 生码率：一场关于什么才算产研提效的实践复盘（InfoQ 中文）

如果你正在用AI编码工具，但发现程序员们花大量时间修修补补AI生成的代码，那这篇文章能解释你的困惑。InfoQ这篇复盘戳破了一个流行假象：AI生码率高不等于提效。CIO们开始意识到，只看代码生成量反而会让研发团队陷入虚假繁荣。文章提供了更务实的评估框架，帮你真正衡量AI对生产力提升的实际贡献。

10.将 AI 用作大规模工程系统的思考伙伴（InfoQ）

这篇文章把AI定位成资深工程师的思考伙伴，不是取代你，而是帮你扮演讲故事里的五个角色：考古学家（挖出历史代码的上下文）、实验者（快速模拟设计方案）、评论家（挑出漏洞和逻辑矛盾）、合著者（一起写代码和注释）和审阅者（自动查错）。听着很理想？但作者很清醒：AI能加速大量机械劳动，但在关键判断、项目级理解和直觉上，你才是不可替代的那个。如果你是写大规模系统的老手，这里有个新视角——把AI当成团队成员，而不是工具。

其他

行业前沿与开源生态，整合行业深度洞察与开源技术动态的复合型主题，技术哲学、AGI 讨论、领袖观点。

1.Erdős 突破：OpenAI 模型首次实现重大 AI 数学发现（OpenAI）

OpenAI的AI模型刚刚在数学界搞了个大新闻——它首次独立解决了一个组合几何领域的长期难题，这可是AI自己发现规律并证明的，不是简单算算数。以前大家觉得AI顶多是个运算工具，现在它开始真正做科研了，从辅助变成自主发现，这转折点意义重大。别以为这只是数学圈的事，这种能力一旦成熟，工程、物理、生物各种基础科学都可能被AI捅出新洞见。关心AI怎么改变世界的人，这篇值得细看。

2.自动化之后（Every）

AI把很多技能变得廉价，但人类专家的价值反而更高了？这篇文章用「框架」和「芝诺悖论」来解释，为什么我们总能在AI逼近时设定新基准。关键在于「能动性」——给自己设定目标的能力，这是AI代理做不到的。如果你担心被取代，这篇会让你看到自己的不可替代性。

3.谷歌 AI 的 14 年、Gemini 翻身之战，与视觉理解模型：专访 DeepMind 前核心科学家 Andrew Dai｜Neolabs 特辑（硅谷101）

一位在谷歌AI待了14年的核心科学家Andrew Dai，不仅启发过OpenAI的GPT，还主导了Gemini的翻身仗，最近离职创办了Elorian AI，专注语言和视觉推理，一出手就融了5500万美元。这篇文章和他聊了聊谷歌AI的发展史，以及Neolabs在AGI探索上的新思路，信息量很大，值得一读。