Vol.65 AI Agent技术前沿与创业策略:企业应用、手机端创新与安全挑战

⼤家好,Weekly Gradient第 65 期已送达,本期内容深入探讨AI Agent技术在企业级Web自动化、手机端应用的最新进展,分析创业公司如何避开巨头竞争,同时关注上下文工程、RAG系统优化及编程智能体安全挑战,为企业数字化转型提供实践指导。

✉️ 免费订阅更新

订阅我的免费通讯,第一时间获取生成式 AI 领域优质内容

我承诺保护您的隐私,不会向第三方分享您的信息。
您可以随时取消订阅。

AI 商业化

聚焦AI行业的商业化路径、市场竞争格局和商业模式创新,包含投资趋势、GTM策略、SaaS转型等商业分析

1.企业级 Web Agent 来了,华人团队融资 4700 万美元,让 AI 替企业”搬砖”赚大钱(深思圈)

华人团队TinyFish刚刚拿下4700万美元融资,他们的企业级Web Agent正在帮大公司解决自动化难题。传统爬虫面对动态网页经常失灵,但AgentQL直接用自然语言描述网页元素,基于DOM分析实现大规模可靠操作。Google、DoorDash这些财富500强已经在用他们的方案做酒店库存聚合和价格监控,实实在在创造了业务价值。投资者特别看好这种专业化、高可靠性的企业级AI方案,认为它能在AI淘金热中持续领先,不过技术挑战和竞争压力也不小。

2.AI巨头布局Agent:创业公司如何避开正面竞争?(宝玉(@dotey))

AI巨头们正亲自下场做Agent产品,不再满足于API收费模式,因为他们不愿看到前端应用利用自己的模型赚钱。Claude Code的快速增长就是成功案例,说明基础模型公司向前整合价值链的威力。现在行业里既有ChatGPT这样的横向全家桶,也有Google Gemini生态这样的纵向垂直整合,创业公司的生存空间被挤压得越来越小。面对OpenAI、Google、Anthropic这些巨头的激烈竞争,创业公司需要找到像黄铮那样拥有深刻非共识洞见和自洽逻辑的破局者,才能避开正面竞争,找到新的增长机会。

3.半年融资 3 亿后,VBot 造出了第一台无遥控的具身智能|和维他动力联创赵哲伦聊 WRC、技术路线选择和创业路程(十字路口Crossing)

维他动力联创赵哲伦从特斯拉、理想汽车出来创业,半年就融了3亿,专注做无遥控的消费级机器狗。他分享了机器人行业正进入融合大模型、自动驾驶和本体技术的新阶段,维他动力选择从机器狗切入C端,不是为了做玩具,而是真刀真枪解决续航、噪音、质量和摆脱遥控这些用户痛点。创业路上软硬件协同特别难,但中国市场有机会孕育独特的机器人文化,未来5-10年机器人会深度融入生活,提升我们的物理世界幸福感。虽然行业现在有点热,甚至有泡沫,但长远看价值巨大。

4.Vol.67|对话他山科技马扬:从出货几十套到出货上万套,机器人触觉传感器领域发生了什么?(开始连接LinkStart)

这期播客聊得太有意思了!他山科技的马扬分享了触觉传感器如何让机器人真正’有感觉’——从只能出货几十套到现在上万套,背后是电容式芯片的技术突破,把成本从几万美金降到几百人民币。原来机器人触觉现在只有人类60%的水平,但已经在工业采摘、养老陪伴这些场景找到用武之地。最让人兴奋的是国内供应链的快速迭代能力,头部客户每周都在更新产品,这种速度海外根本比不了。未来5-10年,机器人肯定会更普及,而且会融合嗅觉、听觉等多模态感知,想想就觉得很酷!

5.AI 创业,需要重读 Paul Graham 的「创业 13 条」(Founder Park)

还记得 Paul Graham 那套经典的创业 13 条吗?在 AI 创业火热的今天,这篇文章通过两位资深创业者的对谈,重新审视这些原则的价值。他们强调,创业本质上是反直觉的探索,尤其在 AI 领域,选对联合创始人、快速发布产品、深度理解用户痛点这些老道理依然管用。创始人亲自做客服能建立超强用户忠诚度,实现‘泡面盈利’则让你在投资人面前更有底气。保持专注和坚韧毅力更是应对波动不可或缺的品质。说到底,AI 创业成功的关键,可能就藏在这些被时间验证过的智慧里。

6.拾象 AGI 观察:LLM 路线分化,AI 产品的非技术壁垒,Agent“保鲜窗口期”(海外独角兽)

最近硅谷的大模型公司们路线开始分化了!OpenAI和Google还在追求通用能力,但Anthropic已经专注在Coding和Agent领域,Thinking Machines Lab则在探索多模态。有意思的是,ChatGPT的成功其实更多靠的是品牌和用户心智这些非技术壁垒,技术反而不是决定性因素。现在AI产品的保鲜期越来越短,巨头们加速布局Agent产品,创业公司好不容易靠模型能力溢出获得的红利窗口期被大幅挤压。好消息是,L4级别的Agent体验已经在信息搜索和软件开发领域实现了,ChatGPT的Deep Research和Claude Code都提供了端到端的魔法时刻,这让我们看到了Agent在语言和代码领域的巨大潜力。

7.如何用 AI 做营销:问题不是如何提效,而是底层打法变了(Founder Park)

AI正在彻底改变营销的游戏规则,远不止是帮你写写文案那么简单。它从品牌定位到客户管理,整个营销链条都在被重构——传统SEO变成了GEO搜索,内容策略必须更直接关联产品,AI还能自动化生成网页和进行个性化沟通。不过别担心,人类在创意和情感连接上的优势依然无法替代,只是营销团队需要重新定义角色,学会和AI协作。如果你想知道具体怎么转型,这篇文章的Playbook给出了从策略到执行的完整路径。

8.The CFO is Dead, Long Live the Chief Automation Officer: What OpenAI, Rippling, and Gorgias Got Right (and Wrong) About AI(SaaStr)

嘿,这文章真有意思!讲的是OpenAI、Rippling这些AI先锋公司怎么用人工智能彻底改造财务部门——比如OpenAI用Python脚本把原本要15天的GPU成本报告压缩到几秒钟完成,SnapLogic用AI代理做订单对账,连隐藏收入都能挖出来。但别以为AI就是万能药,文章也狠狠吐槽了这些公司犯的错:OpenAI太迷信技术却忽略合规风险,SnapLogic光顾着产品思维忘了财务专业性,Gorgias可能数据团队搞得太庞大了。最关键的是,财务团队那种‘怕犯错’的文化才是最大拦路虎,CFO现在得既当传统管家又当自动化推手,平衡风险和创新。如果你在琢磨怎么让AI真正落地业务,这篇绝对值得细读!

9.美国知名风投 BVP 年度 AI 报告:Memory 和 Context 将是新的护城河(Founder Park)

BVP 这份年度 AI 报告太有料了!它告诉我们 AI 创业已经告别了早期野蛮生长阶段,现在速度和方向精准度同样重要。报告特别强调记忆和上下文将成为 AI 应用的新护城河,那些能跨时间记忆、个性化适应的系统才能真正留住用户。垂直领域 AI 正在爆发,特别是在医疗、法律这些传统上抗拒技术的行业,通过解决高价值痛点提供 10 倍效率提升。下一代 AI 浏览器将成为核心交互界面,嵌入操作层 AI 实现多步自动化。对企业来说,AI 落地要从性能转向可信度,评估和数据溯源成为关键要求。最后还预测行业将迎来并购潮,传统 SaaS 企业会通过收购 AI 初创公司来应对颠覆。这份报告简直就是 AI 创业者和投资者的必读指南!

10.112. 和广密聊大模型季报:分化与收敛、全家桶与垂直整合、L4 体验与挖矿窗口(张小珺Jùn|商业访谈录)

这期季报聊得真带劲!大模型市场正在上演一场分化与收敛的大戏:OpenAI和Google拼命搞通用能力,Anthropic这些玩家却专注在编码、Agent这些细分领域深耕,差异化竞争越来越明显。现在光有技术可不够,关键是怎么把模型能力变成让人惊艳的L4级产品体验——就像ChatGPT的Deep Research那样,直接戳中用户痛点,才能把技术红利变成真正的商业价值。创业公司面对巨头们的全家桶策略确实头疼,但换个角度想,这反而是机会:避开正面刚,去垂直领域或者创新产品形态里找非共识机会,说不定能杀出一条血路。投资人也得跟上节奏,技术变化太快了,不能再玩人海战术,得精准押注那些对产业有深刻洞见的顶尖团队。整体来看,AI行业正在从纯技术探索转向产品化和用户体验的实战阶段,特别有意思!

11.MIT 华人辍学生 22 岁拿下 2100 万美元,录个屏就能生成 AI 员工(白鲸出海)

MIT华人辍学生创立的Sola公司真是让人眼前一亮,22岁就拿下2100万美元融资,靠的就是那个‘录个屏就能生成AI员工’的神奇平台。传统RPA工具动不动就崩溃,界面稍微改一下就得重新编程,维护成本高得吓人。Sola用计算机视觉和视觉语言模型彻底改变了游戏规则,让AI能像真人一样理解任务意图,自动适应各种界面变化,连异常情况都能智能处理。最厉害的是业务专家自己就能操作,完全不需要写代码,这在物流、医疗、金融这些传统行业里简直是降本增效的神器。Andreessen Horowitz这些顶级风投都抢着投,说明AI正在从打杂的‘助手’变成能独立干活的‘员工’,未来每个领域可能都会有自己的超级智能代理,这波变革真的来了。

12.AI 创业,小团队、第一天就出海,如何做到 500 万 ARR?(Founder Park)

嘿,你知道吗?现在AI创业真的不一样了!小团队也能玩转全球市场,第一天就出海,还能做到500万ARR,简直太酷了!这些成功案例告诉我们,别再只卖工具了,直接帮客户搞定结果才是王道——比如GrowthX按效果收费营销,Pump.co集体议价省云成本,实实在在让客户看到价值。他们超级会利用AI工具,用AI Agent自动化广告投流和监控,人力成本压到最低,效率却爆表。小团队反而优势多多:没内斗、管理简单、转身快,在AI这片红海里灵活得像条鱼。新一代创业者也变了,不盲目追融资和上市,更看重盈利和掌控权,追求的是可持续的高质量增长。看看Hanabi AI、Higgsfield这些例子,真的给想入局AI的朋友们指了条明路!

AI 产品设计

探索AI原生产品的设计范式与用户体验革新,强调产品哲学、交互模式、Agent设计等

1.ChatGPT Introduces Project-Scoped Memory Feature(Simon Willison(@simonw))

ChatGPT刚刚推出了一个超实用的新功能——项目范围记忆!现在AI可以记住特定项目里的对话内容,但不会和其他项目搞混,这对处理复杂项目的开发者和用户来说简直是福音。Simon Willison都忍不住点赞,说这就是他一直期待的功能。有了这个功能,AI互动变得更准确、更专注,再也不用担心上下文混乱的问题了。

2.DeepSeek Introduces V3.1 with Hybrid Inference for Agent Era(DeepSeek(@deepseek_ai))

DeepSeek刚刚发布了V3.1版本,这次升级真的挺有意思的!他们搞了个创新的’思考&非思考’混合推理机制,让模型能根据实际需求灵活切换模式,既保证效率又不失深度。相比之前的R1-0528,V3.1推理速度更快,代理能力也大幅提升,特别是在工具调用和多步骤复杂任务上表现更出色。这被看作是DeepSeek迈向’代理时代’的重要一步,现在你甚至可以直接在聊天平台上点击那个’DeepThink’按钮亲自体验这些新功能,感觉AI正在变得越来越聪明实用了呢!

3.谷歌 Pixel 发布汇总:硬件与软件全面 AI 化,那谁你就学叭(歸藏的AI工具箱)

谷歌这次发布会真是把AI玩出了新高度!Pixel全系列产品都深度集成了Gemini AI,从手机到手表再到耳机,每个设备都变得超级智能。最吸引人的是那个AI健康教练,能根据你的身体状况定制专属的健身和睡眠计划,简直像有个私人教练随时在身边。拍照也变得超简单,直接用自然语言告诉AI怎么修图,它就能帮你搞定复杂的编辑操作。Pixel 10系列还搭载了Tensor G5芯片,本地运行Gemini Nano模型,实时翻译通话内容、增强照片细节都不在话下,既快又保护隐私。智能家居控制也升级了,用语音就能操控各种设备,多模态交互让生活更便捷。谷歌这次真是把AI融入了每一个细节,让人忍不住想体验这些黑科技!

4.Agent Infra 的创业浪潮来了,我们访谈了一位字节系创业者|对谈 MemU 创始人陈宏(十字路口Crossing)

嘿,你知道吗?现在AI产品最头疼的就是记不住事儿,用户聊着聊着就忘了之前说过什么,体验特别割裂。MemU这家公司想了个绝招,把AI记忆变成类似电脑文件系统那样管理,还专门配了个记忆管理员Agent来负责调用,不仅召回更准更快,成本还降了一大截。他们专门做情感陪伴场景,让AI能真正理解你的情绪和需求,就像有个懂你的老朋友一样。创始人从字节出来创业,发现大家都不愿意啃记忆这块硬骨头,干脆自己下场做底层服务。随着AI Agent越来越普及,这种专门给Agent提供记忆能力的第三方服务绝对是个大市场,小团队反而能靠创新弯道超车呢。

5.从内容消费到内容创作,中间可能只差一个 AI |对话 YouMind 创始人玉伯(AI炼金术)

这期播客太有料了!语雀和YouMind的创始人玉伯亲自分享,原来AI工具已经能帮我们搞定找资料和写稿子这些头疼事,YouMind就是把这两件事无缝整合的神器。最颠覆的是创作理念的转变——别再只囤积知识了,要用项目管理的思路来驱动内容产出,设定明确目标和deadline才能真正高效。不过AI也不是万能的,想让它模仿你的独特文风?目前还差得远呢,深度理解和个性化表达依然是巨大挑战。但人机协同绝对是未来方向,AI当助手处理重复劳动,人类专注品味和创意判断。玉伯还分享了超实用的创业心法:产品打磨要耐心,市场策略要激进,这种‘快而不及’的平衡智慧特别值得创业者借鉴。如果你也在做内容创作或者AI产品,这期绝对能给你一堆启发!

6.Z Product|Product Hunt 最佳产品(8.11-17),95 后华人 AI 助手创新玩法登顶 Top1(Z Potentials)

这周Product Hunt的AI产品榜单太精彩了!95后华人团队开发的Macaron AI直接登顶,它能记住你的偏好还能生成微应用,简直像有个懂你的AI伙伴。榜单里还有智能知识库、AI视频导师这些提升效率的神器,以及无代码平台和开发工具让技术门槛大大降低。看得出来现在的AI产品越来越懂用户,都在往个性化和易用性方向发展,而且华人开发者的表现真的让人骄傲!

7.实测智谱“首个手机 agent”:有新思路,但一到真实世界全是无力感(硅星人Pro)

智谱搞了个挺有意思的AutoGLM 2.0,号称是首个手机agent,想法确实挺新颖——直接在云端给你弄个标准化的手机和电脑环境,想避开现实世界那些乱七八糟的兼容性问题。但实测下来发现,理想很丰满现实很骨感啊!国内这些App的登录验证简直要命,扫码、人脸识别根本搞不定,动不动就弹广告打断操作,用户体验直接崩盘。更别说处理复杂指令了,订个机票连日期范围都理解得机械死板,做好的文件找不到也传不上去。虽然标准化思路解决了部分问题,但现实世界的动态复杂性还是把agent按在地上摩擦,离真正的万能助手还差得远呢。

8.130: 手机 Agent 大幕拉开!从刚上线的 AutoGLM 2.0 聊起,大模型如何改造手机|Agent#4(晚点聊 LateTalk)

嘿,这期内容太有意思了!智谱AI刚发布的AutoGLM 2.0直接把AI Agent带到了手机上,不用邀请码还免费,点外卖、订票、工作提效都能搞定。手机端市场潜力巨大,成了大厂必争之地,但隐私安全和跨应用操作真是个大挑战。强化学习让Agent能像人一样学习用手机,通过试错完成复杂任务。未来Agent会和APP厂商、手机厂商既竞争又合作,GUI和API模式共存,生态越来越复杂。想想AI Agent全天候在后台运行,连接更多终端,离AGI又近了一步,行业真得一起努力共建生态啊!

9.深度|Perplexity CEO:我们的目标是打造一个新的生态:一种“agent 浏览器”的全新产品(Z Potentials)

Perplexity 的 CEO 分享了一个超酷的愿景:他们不是在和 Google 抢搜索市场,而是要创造一种全新的‘agent 浏览器’Comet。这玩意儿更像是一个 AI 操作系统,能无缝运行 AI agent,帮你自动完成订票、购物这些繁琐的数字任务,简直是把‘自动驾驶’搬到了电脑上!背后离不开他们强大的 AI 研究和工程团队,能快速解决技术难题。商业模式也很有意思,用户可能更愿意为‘办事’付费,订阅、按使用量收费甚至企业抽成都可能成为收入来源。在巨头环伺的 AI 战场,初创公司就得靠这种创新产品和快速迭代杀出重围,Perplexity 显然找到了自己的打法。

AI 工程实践

涵盖AI系统技术实现与场景化开发的全流程,包含工程架构、工具链实践、提示工程等核心技术环节

1.DeepSeek V3.1 领衔,万字长文 CodeBuddy AI Coding 企业落地实践思考(腾讯技术工程)

如果你正在为研发团队效率低下而头疼,这篇文章简直就是及时雨!它深入剖析了AI编程工具在企业落地的真实挑战,特别是腾讯自研的CodeBuddy如何通过四大智能体覆盖从需求规划到交付部署的全流程。最让人兴奋的是那个‘文档驱动’的理念——通过标准化需求文档和技术方案,让AI真正理解上下文,实现人机高效协作。文章里还有超多具体案例,比如AI如何帮你生成PRD和设计稿,看完绝对能让你对AI赋能研发有个全新的认知!

2.从需求到研发全自动:如何基于 Multi-Agent 架构打造 AI 前端工程师(阿里云开发者)

蚂蚁消金团队搞了个超酷的Multi-Agent平台’天工万象’,用LangGraph做底层,每个Agent都能自己思考规划工具使用。这架构比传统统一型Agent强太多了,分布式处理任务还不怕上下文爆炸,扩展性拉满!ReAct范式让AI能动态决策自我修正,代码生成准确率飙升。最厉害的是他们发现直接生成React/HTML代码比搞低代码JSON更靠谱,大大减少了AI胡编乱造的问题,生成的页面真的能直接用上生产线。跨Agent记忆共享和Zcache技术还解决了长周期任务的连贯性难题,这波操作确实把AI前端工程师的自动化推到了新高度。

3.从“数据拼凑”到“精准断案”:深度剖析 RAG 系统中信息完整性的关键作用(阿里云开发者)

搞RAG系统时最头疼的就是LLM瞎编数据!原来问题出在索引阶段——结构化元数据(比如缺陷ID、模块版本)和文本块被拆开了,导致模型拿到的上下文支离破碎,只能靠猜。解决方案其实很直接:确保每个文本块都带着完整的原始记录信息,让LLM能一次性看到所有相关数据。这再次证明,AI系统的可靠性关键在数据工程,光靠调Prompt根本不够用。

4.从 Prompt 到 Context:为什么 Think Tool 是形式化的必然?(阿里云开发者)

嘿,如果你正在搞AI开发,这篇文章绝对值得一读!它把AI编程的演进比作编译原理的发展,从最初随意的Prompt Engineering到更结构化的Context Engineering,再到Anthropic的Think Tool,每一步都在追求更高的可靠性和可追踪性。想想看,Context Engineering通过工具集成和记忆管理,让LLM不再是黑箱,而是可控的组件;而Think Tool更是把推理过程显式化、模块化,让模型能自我纠错、可审计,这对高风险应用太关键了。说到底,AI编程正在走向严格的形式化,就像编译器需要正确性证明一样,未来部署自主智能体会更安全、更透明。

5.AIBrix v0.4.0 发布:P/D 解耦与专家并行支持、KVCache v1 连接器、KV 事件同步与多引擎支持(字节跳动技术团队)

AIBrix v0.4.0这次更新真是干货满满!它通过P/D分离架构把推理的预填充和解码阶段拆开,配合前缀缓存感知路由,大幅提升了TTFT和吞吐量,高负载场景下表现特别亮眼。对MoE模型的支持也更强了,专家并行能力让DeepSeek这类模型部署更高效,预填充和解码吞吐量分别提升了30%和3.8倍,编排能力确实厉害。KV缓存方面优化了v1连接器,引入PrisDB作为二级缓存后端,高并发下TTFT降低明显,还有KV事件订阅系统来同步缓存状态。最酷的是现在支持多引擎了,vLLM、SGLang和xLLM都能在同一个集群里跑,给基准测试和生产部署带来了巨大灵活性,真是构建高性能推理基础设施的利器!

6.AI 基础知识从 0.6 到 0.7—— 彻底拆解深度神经网络训练的五大核心步骤(阿里云开发者)

如果你一直好奇深度学习模型到底是怎么训练出来的,这篇文章简直就是为你量身定做的!它用一个超接地气的手写数字识别代码当例子,把整个训练过程拆解得明明白白。从数据怎么一层层往前传,到损失怎么算、梯度怎么反向传播,再到参数怎么更新优化,每一步都讲得特别透彻。最棒的是,那些听起来高大上的概念——比如ReLU激活函数防止模型太死板、Dropout避免过拟合、BatchNorm让训练更稳定——全都用大白话解释清楚了。看完你不仅能看懂代码,还能真正理解为什么这些技术如此重要,简直像打通了任督二脉!

7.腾讯的这款 AI 数据智能体工具 Lumos,颠覆了传统的数据分析(腾讯技术工程)

腾讯的Lumos真是把数据分析的门槛彻底打穿了!它用多智能体架构来拆解复杂任务,让Master Agent规划、Executor Agents执行,既专业又灵活。最厉害的是那个分级计算框架,亿级数据都能秒级响应,结合预计算、内存数据库和Python加速,查询效率直接拉满。绘图功能也玩得很溜,优先用稳定工具,不够就上AI Coding来定制,还有反馈机制不断优化。更关键的是建立了全面的测评体系,确保Agent能力持续提升,避免在LLM方案里打转。Lumos真正做到了让非技术用户也能轻松玩转大数据分析,人机协同的体验太丝滑了!

8.解锁 AI 潜力:如何高效运用 Claude 进行复杂任务处理(阿里云开发者)

如果你正在用Claude处理复杂任务却总觉得输出不够精准,这篇文章简直是及时雨!它手把手教你Anthropic官方推荐的七大核心策略,比如用XML标签结构化提示词让模型理解更清晰,通过思维链和提示链把大任务拆解成小步骤,还能利用长上下文和Extended Thinking功能处理海量信息。代码示例和图示都很实用,看完绝对能大幅提升和Claude打交道的效率。

9.Spatial Joins in DuckDB(Simon Willison’s Weblog)

DuckDB最近在空间查询性能上实现了巨大飞跃!处理纽约市Citi Bike行程数据时,原本需要30分钟的复杂空间计算,现在只需要30秒就能完成。1.2.0版本通过分段合并连接技术,用边界框快速过滤无效数据,把时间缩短到107秒;1.3.0版本更厉害,自动构建内存R树索引,让查询速度直接飙到30秒。这种性能提升简直让人惊叹,意味着处理大规模地理数据时再也不用苦苦等待了。

10.轻量高效,8B 性能强劲书生科学多模态模型 Intern-S1-mini 开源(魔搭ModelScope社区)

上海人工智能实验室刚刚开源了Intern-S1-mini这个超酷的多模态模型,别看它只有8B参数,性能却强得惊人!在化学、材料这些专业科学领域表现特别突出,还在多个权威基准测试中达到了同量级领先水平。最厉害的是它采用了创新的‘通专融合路线’,完美解决了轻量模型在多技能学习中的数据冲突问题,实现了通用能力和专业能力的极致平衡。更贴心的是,文章提供了超级详细的推理、部署和微调指南,支持Transformers、lmdeploy、vllm、sglang、ollama等多种框架,还有基于ms-swift的微调代码示例,让开发者能快速上手使用和定制,真的太适合科研、开发和教学场景了!

11.可灵 2.1 首尾帧藏师傅外挂教程:两张图→大片,附万能提示词(歸藏的AI工具箱)

如果你还在为AI视频生成头疼素材和提示词,这篇教程简直是救星!歸藏分享了三种超实用的首尾帧图片获取方法,从简单生成相似图片到用FLUX Kontext精细控制材质背景,甚至能动态变化文字。最厉害的是那个万能提示词,它能自动分析图片差异,智能选择原地演变或运镜转场策略,帮你生成超有画面感的转场描述。看看那些狐狸化龙、Logo材质变幻的案例,效果真的惊艳。更重要的是,它教你把这些操作流程变成可复用的资产,把单纯的特效升级为有因果关系的叙事,让你的视频不仅有技术含量,更有故事灵魂和商业价值。

12.DeepLearning.AI’s The Batch: AI-Assisted Coding & Key Industry News(DeepLearning.AI(@DeepLearningAI))

这期The Batch真是干货满满!Andrew Ng团队刚办完Buildathon活动,看到参与者用AI辅助的自主代理编码快速开发应用,感觉软件开发真的要变天了。还有几个行业大新闻:中国在重新评估美国AI处理器政策,阿里巴巴发布了Wan 2.2这个开放权重的混合专家模型视频生成器,OpenAI居然转向Oracle寻求计算资源支持,还有关于大语言模型记忆的新研究发现。这些动态都在推动AI工程实践的边界呢。

13.DeepSeek-V3.1 发布,迈向 Agent 时代的第一步(魔搭ModelScope社区)

DeepSeek-V3.1这次升级真的挺给力的!它搞了个混合推理架构,让模型能在思考和非思考模式之间灵活切换,不仅效率更高,还省了不少token。Agent能力也大幅提升,编程和搜索任务表现特别亮眼,代码修复、命令行操作这些复杂活儿都能搞定。API方面支持128K上下文和Function Calling,还兼容Anthropic格式,开发者用起来更方便了。最棒的是模型已经开源,价格还做了调整,门槛降低了不少,感觉离真正落地应用又近了一步!

14.DeepSeek-V3.1 发布,迈向 Agent 时代的第一步(DeepSeek)

DeepSeek刚刚发布了V3.1版本,这次更新真的挺让人兴奋的!新模型采用了创新的混合推理架构,可以在思考模式和非思考模式之间自由切换,就像给AI装了个智能开关一样。最厉害的是,它在编程和搜索任务中的表现大幅提升,代码修复和复杂搜索都变得更聪明了。更让人惊喜的是,思考模式下输出token减少了20%-50%,响应速度更快还能省成本。API也同步升级到128K上下文,支持严格Function Calling,而且基础模型和后训练模型都已经开源了。不过要注意的是,API价格将在明年9月调整,虽然取消了夜间优惠,但服务资源扩容了,整体来说对开发者更友好了。

15.Qwen-Image-Edit:全能图像编辑,驱动内容创作提质增效(魔搭ModelScope社区)

通义千问团队这次开源了个超厉害的图像编辑模型Qwen-Image-Edit,直接把AI修图带到了新高度!它不仅能像PS一样做增删改修这些基础操作,还能玩转语义层面的高级编辑,比如把一张图变成不同风格、转换视角,甚至生成虚拟形象。最惊艳的是它的文字编辑能力,中英文都能精准修改,还能保持原来的字体风格不变,做海报修图简直神器。开发者们有福了,官方提供了完整的推理代码和微调教程,用LoRA就能定制自己的模型,门槛低到感人。这绝对是内容创作者和开发者的宝藏工具!

16.Claude Code 究竟牛在哪里?(以及如何在你的 AI 智能体中复刻它的魔法!)(宝玉的分享)

想知道为什么Claude Code用起来这么顺手吗?原来它的秘诀就是’大道至简’——不搞花里胡哨的多智能体系统,也不用复杂的RAG搜索,而是让模型专注做自己最擅长的事。文章拆解了四个核心设计:用单一主循环保持系统简单可调试,靠详尽的提示词和XML标签精准控制模型行为,设计三层工具组合让LLM自己搜索代码库,再加上明确的语气指南和强调词来引导交互风格。最妙的是大量使用小模型处理辅助任务,成本低效果还好,这种设计思路完全可以复制到你的AI项目里!

17.我所知道的优秀系统设计的一切(宝玉的分享)

嘿,如果你正在构建或维护复杂的软件系统,这篇文章简直就是宝藏!作者用资深工程师的视角告诉你,真正优秀的系统设计根本不需要花里胡哨的技术堆砌,反而应该追求那种‘看起来平平无奇’的稳定感。核心挑战在于状态管理——尽量减少有状态组件,集中由单一服务处理,这样才能避免系统陷入糟糕状态。数据库优化是关键,从模式设计到索引、读写分离都得精心打磨。慢操作和快操作一定要分开,后台任务处理耗时工作,保证用户体验流畅。缓存、事件流、推拉模式这些工具确实好用,但千万别滥用,得清楚它们的适用场景和风险。最后别忘了熔断开关、重试机制和优雅降级,这些都是系统韧性的保障。记住,成熟工具+避免过度设计才是王道,别总想着炫技!

18.#207. Chroma 创始人:别再迷信 RAG 了,上下文工程才是 AI 应用的底层逻辑(跨国串门儿计划)

Chroma 创始人 Jeff Huber 这次真的戳破了 RAG 的神话泡泡!他直言不讳地指出 RAG 这个概念被过度简化了,检索、增强和生成混为一谈反而误导了开发者。他首次系统性地提出了“上下文工程”这个核心理念——真正顶尖的 AI 应用不是靠堆砌上下文长度,而是靠精心设计和管理 LLM 的上下文窗口内容。更震撼的是,Chroma 团队的研究发现了“上下文腐烂”现象:当上下文 Token 数量过多时,模型的关注能力和推理能力会显著下降,这直接挑战了业界对百万级上下文窗口的盲目乐观。Jeff 还分享了如何把 AI 应用开发从碰运气的“炼金术”变成可预测的“工程学”,包括构建现代化搜索基础设施、注重极致开发者体验,以及用高质量小数据集和生成式基准测试来优化系统。对于创业公司,他坚持要缓慢挑剔地组建团队,打造零配置的云产品来吸引志同道合的人才。这期内容简直是给 AI 工程师和产品经理的一剂清醒剂!

19.这篇超有用!手把手教你搭建 AI 产品 Evals(Founder Park)

现在做AI产品,光会调Prompt可不够了!评估环节才是真正的胜负手,就像给AI系统考驾照一样严格。文章手把手教你三种评估方法,特别是用大模型当裁判的自动化方案,成本低效果又好。从数据收集到生产监控,完整流程帮你避开常见坑,确保你的AI产品持续创造价值。

20.”RAG is Dead, Context Engineering is King” — with Jeff Huber of Chroma(Latent Space)

嘿,最近读到一篇超有料的访谈,Chroma 的 CEO Jeff Huber 直接放话 ‘RAG 已死’,说现在得靠 ‘上下文工程’ 称王了!随着 AI 从简单聊天机器人进化成复杂代理,光检索信息根本不够用,必须把上下文管理玩出花来。他可不是空谈,直接甩出五个实用检索技巧,还详细拆解了怎么搭建高效的摄取和查询管道,比如混合召回和重排序这些硬核操作。最戳中我的是他强调 ‘上下文腐烂’ 问题——堆再多数据不如把上下文整得紧凑又结构化,这才是提升 LLM 性能的关键。如果你也在折腾 AI 应用,这篇绝对能帮你从玄学炼金术升级到系统化工程,靠谱!

21.大语言模型 + 编程智能体 = 安全噩梦(宝玉的分享)

大语言模型和编程智能体的结合正在打开一个潘多拉魔盒,安全风险比我们想象的更可怕。这些智能体被赋予了高权限和工具访问能力,但LLM本身的不可预测性和幻觉问题让它们很容易被恶意操控。攻击者现在可以通过白色背景上的白色文本、GitHub仓库里的隐藏空格,甚至ASCII走私技术,把恶意指令悄悄塞进去,最终实现远程控制你的系统。更吓人的是,像CodeRabbit这样的AI开发工具本身都可能成为攻击入口,黑客已经成功获取了百万级GitHub仓库的访问权限。虽然专家建议限制权限、增加护栏,但面对无穷无尽的攻击变种,这些防御措施显得杯水车薪。或许真该把这些编程智能体当成’懒惰、喝醉了的机器人’来对待,而不是什么超级智能系统。

其他

行业前沿与开源生态,整合行业深度洞察与开源技术动态的复合型主题,技术哲学、AGI讨论、领袖观点

1.萨姆·奥特曼访谈精华:从GPT-5风波到AI未来战略(宝玉(@dotey))

萨姆·奥特曼这次访谈信息量太大了!他不仅坦诚GPT-5发布确实搞砸了,但用户增长依然强劲,还透露OpenAI正在疯狂扩张——从消费硬件到脑机接口,甚至考虑收购Chrome浏览器。最震撼的是他预测AI市场存在泡沫但技术价值巨大,OpenAI准备砸数万亿美元建数据中心。他还特别强调ChatGPT要保持中立,不让AI变得政治正确,但也很担心用户和AI建立不健康关系。最后那个玩笑细思极恐:几年后CEO可能是AI本人。这绝对是了解AI行业未来走向必读的深度访谈!

2.好的软件设计,看起来平平无奇(宝玉的分享)

你有没有觉得那些真正靠谱的软件系统,表面看起来反而特别普通?这篇文章就戳破了这个秘密:好的设计根本不是追求酷炫复杂,而是在一开始就把各种可能出问题的地方给提前消灭掉。比如把那些容易出错的组件从核心流程里挪出去,或者干脆简化整个系统结构,用静态网站替代复杂的文档管理系统。还有啊,集中管理数据确保只有一个真相来源,避免数据打架。最聪明的是直接借用那些久经考验的成熟技术,比如Ruby的Unicorn服务器,靠Linux底层原语来保证稳定。说到底,优秀的设计往往显得枯燥无味,但它能让你睡个安稳觉,不用半夜被报警叫起来修bug。

3.#209. 如何避免成为那个“为了工作而工作”的产品经理?(跨国串门儿计划)

最近裁员潮让很多产品团队都挺焦虑的,这期播客请来了资深产品领导者马特·勒梅,专门聊聊怎么避免变成那种‘为了工作而工作’的产品经理。他提出了一个特别实用的三步法:团队目标要和公司顶层目标最多只差一个层级,别让目标在层层传递中脱节;做产品决策时每一步都要优先考虑价值;每项具体工作都得和可衡量的价值挂钩,不能光看抽象分数。他还强调产品经理要有‘CEO视角’,敢于挑战那些低价值任务,哪怕面对高管压力也得坚持。通过具体案例展示了怎么通过做减法来达成目标,把商业限制变成机会而不是阻碍。听完真的觉得,现在这种环境下,产品团队要是还陷在低价值循环里,确实挺危险的。

4.How To Transition from Founder-Led Sales: Why Most Get It Wrong and How to Get It Right(SaaStr)

哎呀,创始人主导销售这事儿真是让人又爱又恨!很多公司急着把销售交给专业团队,结果反而搞砸了。文章说千万别太早放手,特别是垂直SaaS公司,不到1000万美元ARR之前,创始人的市场洞察和可信度简直是无价之宝。建议先招两个能打的中层销售,验证流程后再考虑销售VP。最妙的是,就算找了销售负责人,创始人还得亲自盯大单子——毕竟CEO出面谈生意,那种说服力别人真比不了。说到底,销售转型得一步步来,急不得!

5.#206. 我的创业公司在 7 次失败尝试后成功进入 Y Combinator(跨国串门儿计划)

天呐,连续七年申请YC都被拒是什么体验?Close.com创始人Steli Efti用亲身经历告诉你,失败七次后终于逆袭,公司年收入超过五千万美元!他毫不留情地剖析了自己的七宗罪:没有成功履历、光说不练不做MVP、用户交流浮于表面、没挖到惊喜洞察、行动太慢、缺乏韧性,还有最致命的一点——过度依赖YC。这简直就是创业者的血泪教科书啊!关键是什么?YC最看重的是你能快速把想法变成产品,用MVP验证市场;和用户聊透,找到那些反直觉的真相;还得有打不死的小强精神,证明自己离开加速器也能成。别空谈,动手干;别表面,挖深度;别依赖,靠自己——这才是通往成功的硬核路径。

Vol.65 AI Agent技术前沿与创业策略:企业应用、手机端创新与安全挑战

https://liduos.com/the-weekly-gradient-65.html

作者

莫尔索

发布于

2025-08-24

更新于

2025-08-27

许可协议

评论