跳转到正文
莫尔索随笔
返回

Vol.104 自动化加速,人类专家价值飙升:AI Agent工程体系化与产业变革

预计 10 分钟
AI 周刊 编辑此页

⼤家好,Weekly Gradient第 104 期已送达,本期内容聚焦AI自动化加速下人类专家价值上升的悖论,涵盖Gemini 3.5、Qwen3.7-Max等模型突破,Agent工程体系化(记忆、梦想、对抗式评估),以及AI原生创业与硬件趋势。

AI 商业

聚焦 AI 行业的商业化路径、市场竞争格局和商业模式创新,包含投资趋势、GTM 策略、SaaS 转型等商业话题。

1.AI 硬件浪潮才刚刚开始:来自 Apple、Meta、OpenAI 一线的产业判断(Lenny’s Podcast)

AI硬件可不是简单的耳机或眼镜,一场由苹果、Meta和OpenAI内部人士参与的对谈,直接抛出了不少硬核判断:具身智能会比想象中更快落地,终端侧推理才是让设备真正聪明的关键,硬件形态也在快速演进。别被那些虚头巴脑的趋势分析带偏,听听一线操盘手怎么拆解,能帮你更清醒地看清AI硬件接下来的牌局。

2.当软件容易被创作,新时代的产品长什么样? | 对谈 Albert(42章经)

这期42章经和Albert聊了个很实在的话题:当AI让写软件变得跟说话一样简单,创业空间到底在哪?他们提到模型厂商正在挤压创业者的生存空间,团队两个月试了几十个项目,最后发现真正的机会可能不在技术本身,而是品牌溢价、长尾消费和平台型产品。Albert的新产品merging.live就是给新一代maker提供反馈和连接的地方。如果你关心AI创业、vibe coding或者独立产品怎么做,这期很值得听。

3.创始人手册:打造 AI 原生初创公司(宝玉的分享)

如果你正在或打算进入AI创业领域,这本创始人手册就像一本实战地图。它从团队搭建、产品策略到工程实现,给出了整套可落地的框架,而不是零散的观点。无论你是技术背景还是初次创业,都能找到自己的定位和下一步行动指南。

AI 产品

探索 AI 原生产品的设计范式与用户体验革新,强调产品哲学、交互模式、Agent 产品设计等。

1.Gemini 3.5:具备行动能力的前沿智能(DeepMind Blog)

DeepMind 最新发布的 Gemini 3.5 Flash 真的太顶了!它不只是个聪明的大脑,还能动手干活——在代理和编码任务上表现炸裂,处理复杂长期任务又快又便宜。现在已经有个人 AI 助手和企业方案在用,感觉智能代理的黄金时代真要来了。

2.Introducing Composer 2.5 · Cursor(Cursor Blog)

Cursor 终于发布了 Composer 2.5,作为 AI 编码领域的头部产品,这次更新带来了代码助手能力的显著升级。如果你想第一时间了解新版本的能力边界和产品方向,这篇文章来自官方博客,信息量直接且关键。

3.Notion 创始人 Ivan Zhao:重塑公司的艺术(Sequoia Capital)

Notion 创始人 Ivan Zhao 分享了一套很酷的公司管理哲学:把组织变成爵士乐队,让每个人高度自治、即兴创作。他还提到 AI 产品开发要从‘造桥’变成‘酿酒’,意思是别硬规划,要慢慢发酵。最有趣的是‘杠铃式人才模型’——一边是极少数资深专家,一边是大量灵活执行者,中间层被 AI 替代,就像用 AI 当‘结构钢’来保持公司既大规模又敏捷。

AI 工程

涵盖 AI 工程技术实现与场景化开发的全流程,包含 Agent 工程架构、工具实践、上下文工程等核心技术话题。

1.选择正确模型:LLM Evals 与优化的数据驱动指南(Claude)

别再迷信公共基准了,你的业务场景和别人的不一样。这篇指南手把手教你搭建自己的评估框架,怎么选模型、怎么优化,全看数据说话。还有杀手锏——提示缓存和上下文工程,能省下不少成本还提升推理准确性,挺实用的干货。

2.Qwen3.7-Max 重新定义 AI Agent 基座(通义大模型)

Qwen3.7-Max在多个权威评测中拿到国内第一,最硬核的是它通过了35小时连续自主执行、1158次工具调用零中断的极限测试,长程智能体的稳定性和深度推理能力让人印象深刻。这篇博文把它的核心亮点和复杂任务中的工程实践讲得很透,如果你正在找靠谱的智能体方案,里面有不少实打实的参考。

3.Google Cloud 在 I/O ‘26 上为智能体开发者带来的新动态(Google Cloud Blog)

Google Cloud 在 I/O ‘26 上亮出了智能体开发栈的四层架构:Agent Studio、Managed Agents API、Antigravity 2.0 和 ADK 2.0。如果你正在纠结从哪个层级入手,这篇文章给你提供了一个从低代码到代码优先、从快速试验到工程治理的选择框架,能帮你和团队快速定位最适合的切入点。不管你是刚接触智能体还是已有工程体系,都能从中找到自己的位置。

4.用于自学习自主 Agents 的 Memory 与 Dreaming(Claude)

Anthropic 给自主 Agent 加上了两个新技能:记忆和梦想。记忆就像个虚拟文件系统,让 agent 能随时调用知识;梦想则像脱机优化循环,全局统筹记忆状态。两者结合让 agent 持续自我改进——Rakuten 用这套方案后,首次执行错误率狂降 97%,企业自动化效率飞升。

5.构建能持续运行数小时的智能体:Anthropic 工程师揭秘对抗式生成-评估架构(AI Engineer)

Anthropic工程师在AI Engineer大会上分享了一个超实用的干货:怎么让智能体稳定运行几个小时?他们搞了个“对抗式生成-评估”架构——用一个模型专门挑另一个模型的刺,这样在长任务链中质量就不容易崩。这可是目前生产级Agent最头疼的问题之一,一手经验加架构拆解,读起来很过瘾。

6.别构建垃圾:AI 智能体成熟度的四个层级(AI Engineer)

别被那些花里胡哨的智能体叙事骗了——Ara Khan 的分享直接把你拉回工程现实:状态机、提示词剪枝、集成循环、架构边界和云端部署,全是硬仗。他提出的四级成熟度框架和看板式并发管理,对正在从原型往生产爬、害怕堆出“智能体垃圾代码库”的团队来说,简直是救命指南。

7.重新定义 Skill 开发:保姆级教程&一站式开发助手发布(阿里云开发者)

如果你正在做 Agent 或 Skill 开发,这篇就是为你量身定制的补课材料。它不像那些只讲概念的泛泛而谈,而是从触发规则、目录结构到写作规范,一路打通发布、调试和跨平台迁移。更棒的是,它把版本管理、热加载、评测这些工程痛点串成一条完整流水线,还附带了 skill-dev-aio 这个一站式工具。读完你就能把个人经验变成可复用的 Agent 能力,少走不少弯路。

8.从 0 开发大模型的 17 种 Agent 架构演进详细拆解(腾讯技术工程)

如果你在搭建大模型应用时对Agent架构如何选型感到头秃,腾讯技术工程团队这篇从零开始的拆解简直救星。他们梳理了17种Agent架构的演进路线,从最简单的单步执行到复杂的多智能体协作全覆盖。和那些泛泛而谈的文章不同,这篇真的聚焦工程实现,直接告诉你每种架构适合什么场景、有哪些坑。开发者朋友们可以拿来当架构设计参考手册,挺实在的。

9.CIO 正在抛弃 AI 生码率:一场关于什么才算产研提效的实践复盘(InfoQ 中文)

如果你正在用AI编码工具,但发现程序员们花大量时间修修补补AI生成的代码,那这篇文章能解释你的困惑。InfoQ这篇复盘戳破了一个流行假象:AI生码率高不等于提效。CIO们开始意识到,只看代码生成量反而会让研发团队陷入虚假繁荣。文章提供了更务实的评估框架,帮你真正衡量AI对生产力提升的实际贡献。

10.将 AI 用作大规模工程系统的思考伙伴(InfoQ)

这篇文章把AI定位成资深工程师的思考伙伴,不是取代你,而是帮你扮演讲故事里的五个角色:考古学家(挖出历史代码的上下文)、实验者(快速模拟设计方案)、评论家(挑出漏洞和逻辑矛盾)、合著者(一起写代码和注释)和审阅者(自动查错)。听着很理想?但作者很清醒:AI能加速大量机械劳动,但在关键判断、项目级理解和直觉上,你才是不可替代的那个。如果你是写大规模系统的老手,这里有个新视角——把AI当成团队成员,而不是工具。

其他

行业前沿与开源生态,整合行业深度洞察与开源技术动态的复合型主题,技术哲学、AGI 讨论、领袖观点。

1.Erdős 突破:OpenAI 模型首次实现重大 AI 数学发现(OpenAI)

OpenAI的AI模型刚刚在数学界搞了个大新闻——它首次独立解决了一个组合几何领域的长期难题,这可是AI自己发现规律并证明的,不是简单算算数。以前大家觉得AI顶多是个运算工具,现在它开始真正做科研了,从辅助变成自主发现,这转折点意义重大。别以为这只是数学圈的事,这种能力一旦成熟,工程、物理、生物各种基础科学都可能被AI捅出新洞见。关心AI怎么改变世界的人,这篇值得细看。

2.自动化之后(Every)

AI把很多技能变得廉价,但人类专家的价值反而更高了?这篇文章用「框架」和「芝诺悖论」来解释,为什么我们总能在AI逼近时设定新基准。关键在于「能动性」——给自己设定目标的能力,这是AI代理做不到的。如果你担心被取代,这篇会让你看到自己的不可替代性。

3.谷歌 AI 的 14 年、Gemini 翻身之战,与视觉理解模型:专访 DeepMind 前核心科学家 Andrew Dai|Neolabs 特辑(硅谷101)

一位在谷歌AI待了14年的核心科学家Andrew Dai,不仅启发过OpenAI的GPT,还主导了Gemini的翻身仗,最近离职创办了Elorian AI,专注语言和视觉推理,一出手就融了5500万美元。这篇文章和他聊了聊谷歌AI的发展史,以及Neolabs在AGI探索上的新思路,信息量很大,值得一读。


编辑此页