第一时间捕获有价值的信号
⼤家好,Weekly Gradient第 92 期已送达,本期内容涵盖AI行业重大融资事件、Anthropic与五角大楼伦理冲突、智能体技术演进、开源模型进展及AI工程化实践,全面解析当前AI发展趋势与挑战。
AI 商业
聚焦 AI 行业的商业化路径、市场竞争格局和商业模式创新,包含投资趋势、GTM 策略、SaaS 转型等商业话题。
1.Anthropic 和五角大楼这周彻底闹翻了。五角大楼要求 Claude 向军方开放所有合法用途,不(宝玉(@dotey))
这周AI圈炸了锅!Anthropic和美国五角大楼彻底闹掰了,军方想让他们的Claude AI开放所有合法军事用途,但Anthropic死活不同意,坚持不碰大规模监控和自主致命武器这两条红线。结果呢?2亿美元的合同眼看就要黄了,特朗普还下令联邦机构停用Anthropic。最让人感动的是整个AI行业的反应——OpenAI的Sam Altman公开声援,OpenAI和Google的员工联名签署公开信,连Ilya Sutskever都站出来点赞,说这是行业领导者在关键时刻放下分歧、坚守底线的典范。这件事可不只是商业纠纷,它关系到AI技术到底该往哪儿走,企业如何在利益和伦理之间做选择。
2.Gemini Seizes the Lead, Investors Panic Over Agentic AI, Optimism at Global AI Summit, and more…(deeplearning.ai)
嘿,这期内容信息量真不小!Google的Gemini 3.1 Pro用实际表现告诉我们,提升AI性能不一定非得靠堆算力,算法优化同样能带来巨大突破,而且成本控制得相当不错。全球AI讨论的风向也在变,大家开始更关注AI怎么真正帮到经济发展,而不仅仅是空谈风险,印度这次峰会就挺有代表性的。最让人紧张的是,智能体AI工具的出现,比如Claude Cowork,直接动摇了传统SaaS的根基,投资者都慌了,软件公司不赶紧转型成AI原生恐怕真要掉队。还有个挺有意思的趋势,把AI计算从云端搬到本地设备上越来越可行了,研究说本地效率这几年飙升,能省下超多能源,看来混合模式要成主流了。
3.Block 大裁员:Jack Dorsey 砍掉近半员工,称 AI 改变了公司运营方式 Block((宝玉(@dotey))
Block(前Square)CEO Jack Dorsey刚刚宣布了一个重磅消息:公司要裁掉近一半员工,大约4000人,从万人规模直接缩减到6000人以下。这可不是因为经营出了问题,而是一次彻底的转型。Jack认为,AI工具配合扁平化的团队结构,正在从根本上改变公司的运作方式。他明确表示,Block未来将以AI为核心重建,甚至允许客户利用AI能力自行构建功能。这可能是目前科技行业里规模最大、也最具代表性的‘AI驱动组织瘦身’案例了,看来AI不仅改变产品,连公司结构都要重塑了。
4.[AINews] OpenAI closes $110B raise from Amazon, NVIDIA, SoftBank in largest startup fundraise in history @ $840B post-money(Latent Space)
这期内容太重磅了!OpenAI刚刚拿下了1100亿美元的历史性融资,估值冲到8400亿美元,背后是亚马逊、英伟达和软银这些巨头在撑腰。这笔钱不仅是为了烧到2028年,更关键的是OpenAI要把整个基础设施都搬到AWS上,这可能会动摇它和微软的合作关系。另一边,Sakana AI搞出了个叫Doc-to-LoRA的黑科技,用超网络瞬间把文档知识‘编译’进模型权重里,处理超长文本又快又准,成本还低。Anthropic那边也不太平,因为拒绝帮美国国防部搞大规模监控和自主武器,直接被贴上了‘供应链风险’的标签,AI安全和国家安全之间的冲突越来越尖锐了。技术层面也有亮点,vLLM现在对AMD GPU的支持大幅提升,解码速度快了4倍多,英伟达的软件优势正在被追赶。Databricks还推出了新的强化学习方法,训练推理模型时需要的生成次数直接减到三分之一,运营复杂度大大降低。这波AI浪潮真是又烧钱又拼技术,还处处是伦理雷区。
5.What is Perplexity Computer?(Greg Isenberg)
如果你还在用AI聊天机器人一问一答,那可能已经落后了。现在有个叫Perplexity Computer的工具,每月200美元,直接给你一个云端虚拟环境,能同时指挥多个AI子智能体干活。创始人Greg Isenberg展示了几个让人眼前一亮的用法:比如让AI自动研究潜在客户的最新动态,然后生成超个性化的Gmail邮件,完全避开模板的机械感;或者设置24/7全天候监控竞争对手,价格一有变动就立刻通知你;它还能像初级分析师一样,把网上杂乱的信息整理成风投管线电子表格,甚至生成带数据可视化的专业投资备忘录。这工具的核心是推动工作流从“聊天”转向“智能体化”,让个人创始人也能轻松管理以前需要整个团队才能完成的营销、情报、财务等任务,简直是“一人十亿美元公司”梦想的加速器。
6.#437.对话 Elad Gil:AI 时代的 SaaS 变局、增长神话与防御心法(跨国串门儿计划)
最近听了场超有料的对话,传奇投资人Elad Gil和Sarah Guo聊透了AI对SaaS行业的冲击。别被那些‘SaaS大灾难’的论调吓到,Elad直接点破:复杂的企业软件比如车队管理系统,可不是随便写几行AI代码就能替代的——大公司买软件不光看功能,更看重背后的变更管理、安全合规和销售支持这些‘软实力’。但另一边,AI实验室的增长速度简直像坐火箭,OpenAI们从10亿冲到100亿营收只用了一年左右,比Salesforce当年快了近十倍!更夸张的是,Token成本在21个月内降了150倍,这种被压缩的增长曲线彻底改变了游戏规则。Elad给创业者的建议很犀利:别再死守SaaS时代那种‘单点产品’思维了,现在得靠多产品‘捆绑包’建立护城河,不然单一功能分分钟被大模型的新能力吞噬。最扎心的是,他还提醒创始人必须冷静面对现实——技术周期从10年缩短到2年,意味着每年都得在董事会上‘不带感情色彩’地讨论退出策略,在价值最高点做出理智决策,否则可能因为过度坚持而错失时机。这期对话把AI时代的商业逻辑拆解得明明白白,既有数据震撼又有实战心法,值得反复琢磨。
7.OpenClaw 是一个信号|2026 Long-Horizon Agent 投资地图(海外独角兽)
嘿,最近看到一篇挺有意思的分析,讲的是AI Agent领域一个根本性的转变。它不再只是帮我们提高效率的工具了,而是正在变成能直接交付结果的“数字劳动力”。这意味着什么?意味着整个市场的想象空间一下子从几千亿美元的软件支出,跳到了13万亿美元的劳动支出,这个变化太惊人了。文章里详细拆解了这种转变背后的四大投资逻辑,比如支撑Agent长时间稳定运行的基础设施、基于实际执行过程积累的独特数据壁垒,还有按结果收费这种全新的商业模式。最让我觉得有启发的是,它认为未来Agent的核心竞争力不再是单纯的“聪明”,而是在特定场景下积累的“经验”——那些只有人类专家才懂的隐性知识和操作流程。文章最后还画了一张产业地图,把编程、企业系统、语音交互这些赛道都梳理了一遍,看完感觉对整个Agent领域的未来图景清晰了不少。
8.国产模型春节大考:来自 MiniMax、GLM、Seedance 开发者的一线复盘|Best Ideas(海外独角兽)
最近一场国内AI顶尖研究员的闭门讨论透露了不少干货。最让人兴奋的是,国产开源模型在OpenRouter这类平台已经占据主导地位,中美技术差距正在以月为单位快速缩小。模型能力正在发生关键转变,从数学、代码这些有明确答案的“可验证任务”,进化到深度研究、商业计划这类更开放、更依赖判断的“模糊任务”。竞争的核心也从拼算力转向了拼数据质量,谁能更好地获取、清洗和挖掘数据,谁就能拉开差距,而中国在劳动力组织上似乎有天然优势。具体到产品,Seedance 2.0把视频生成从“抽卡碰运气”带入了“工业化可用”阶段,通过微观纹理和物理逻辑建模,效率提升了10-20倍,单次生成的视频就能达到商用门槛。MiniMax M2则聪明地平衡了性能与成本,用200B总参数但只激活10B的特殊架构,瞄准了顶尖模型“好用但用不起”的痛点,为Agent全天候运行铺平了道路。智谱的GLM-5坚持“工程师路线”,专注解决实际编程问题,用DeepSeek Sparse Attention架构大幅降低了长代码处理的推理成本。最后,讨论还预判到2026年Token消耗将指数级增长,中国厂商有望通过ToC产品出海和推理效率优化,在全球竞争中建立优势。这波技术迭代和商业思考,确实让人看到了国产AI从跟随到并跑甚至领跑的可能。
AI 产品
探索 AI 原生产品的设计范式与用户体验革新,强调产品哲学、交互模式、Agent 产品设计等。
1.[AINews] Nano Banana 2 aka Gemini 3.1 Flash Image Preview: the new SOTA Imagegen model(Latent Space)
嘿,这期内容可太有料了!Google 刚扔出个王炸叫 Nano Banana 2,它在图像生成排行榜上直接登顶,关键是价格还特别香,差不多是竞争对手的一半,每千张图只要67美元,还自带搜索增强和多主体一致性这些高级功能,简直是性价比之王。另一边,智能体编程也悄悄升级了,现在能更靠谱地帮你处理一些基础任务,但专家们也开始担心,过度依赖AI会不会让代码变得一团糟,以后离了AI就没人能维护了。Perplexity 也没闲着,它正忙着和三星深度合作,把搜索功能塞进手机系统里,还开源了自己的嵌入模型,明显是想打造一个从底层到界面的完整生态。最让人揪心的是 Anthropic 和美国国防部那档子事,AI公司公开拒绝军事监控和自动化武器,伦理和国家安全正面撞上了,这种僵局恐怕只是个开始。
2.一百个 OpenClaw 产品涌来,我们最近推荐这几款(Founder Park)
最近OpenClaw生态真是热闹,各种产品像雨后春笋一样冒出来。这篇文章帮我们理清了头绪:一方面,像Kimi Claw这样的云端方案让普通用户也能轻松用上AI Agent,不用再为API密钥和服务器配置头疼;另一方面,桌面端的MonsterClaw直接把Agent变成了开箱即用的软件,能帮你自动抓取评论、整理新闻,真正融入了日常工作流。最让人兴奋的是EvoMap提出的GEP协议——Agent完成任务的经验现在可以像基因一样被封装和继承,这意味着我们不用每次都从头训练,整个生态正在从简单的工具集成进化成能自我学习的系统。
3.How I use Obsidian + Claude Code to run my life(Greg Isenberg)
最近看到 Greg Isenberg 分享了一个特别酷的玩法,他把 Obsidian 笔记工具和 Claude Code 智能体结合起来,直接让 AI 接管了日常工作和思考流程。这可不是简单的聊天机器人,而是让 Claude 通过命令行直接读取你所有的本地笔记,那些双向链接的思维图谱全成了 AI 的导航地图。最厉害的是,AI 不再需要你反复交代背景,它能从你的历史笔记里自动识别思维模式,甚至用 /challenge 这样的命令来挑战你的固有观念,帮你发现认知偏差。现在写 Markdown 笔记就像在编程自己的专属智能体,笔记库成了 AI 决策的“事实来源”,这种把知识管理和 AI 执行深度绑定的思路,简直是把个人生产力工具带到了另一个维度。
AI 工程
涵盖 AI 工程技术实现与场景化开发的全流程,包含 Agent 工程架构、工具实践、上下文工程等核心技术话题。
1.AI 工程化落地实践:推翻”完美架构”,回归提示词本质(腾讯云开发者)
腾讯云团队分享了一个挺有意思的转变:他们发现之前搞的那些复杂的多智能体编排和工作流,反而让开发变得更麻烦了。现在他们换了个思路,回归到最本质的东西——文本。他们把项目规范、操作流程都写成文档,比如一份AGENTS.md文件,既给新人看,也给AI看,人机共用一套知识体系,省心多了。为了解决AI容易“失忆”的问题,他们用文件系统来存档任务进度,下次接着干。还把所有的配置和经验都放在一个Git仓库里,团队每个人都能受益,经验越攒越多。最核心的观点是,别一上来就写复杂的代码架构,先从写好提示词开始,让架构自然地长出来。
2.AI Agent 系列|深入解析 Function Calling、MCP 和 Skills 的本质差异与最佳实践(阿里云开发者)
如果你正在构建AI Agent,肯定纠结过工具调用到底该怎么设计。这篇文章把Function Calling、MCP和Skills这三个核心概念讲透了——原来Function Calling是让AI理解人类指令并转换成机器能懂的结构化请求的底层基础;MCP则像给不同系统装上了统一插头,让AI能快速接入各种数据源,省去了重复写代码的麻烦;而Skills更神奇,直接用文字就能定义复杂任务流程,让AI在执行时能灵活应变。最精彩的是作者指出了MCP和Skills之间的路线之争:一个靠标准化协议加代码逻辑,一个靠命令行调用加文字流程,这背后其实是两种不同的技术哲学。最后还给出了实战建议:真正的Agent应该坚持“一切皆函数”,能无缝嵌入现有业务系统,而不是困在对话框里。读完你会对Agent架构有全新的认识。
3.It’s time to start tracking this. https://t.co/AS(Latent.Space(@latentspacepod))
嘿,最近编程圈有个挺火的话题,有人建了个网站专门记录2025年软件行业的大变局。核心是Andrej Karpathy那个刷屏的观点:大概从2024年底开始,AI智能体突然变得真正能用了。这意味着什么?开发者以后可能不用再埋头写代码了,而是转向管理和审查AI智能体。这种转变被称作“智能体工程”,它不只是换个工具那么简单,而是整个工作流程的根本性颠覆,相当于把编程抽象到了更高的层次。感觉就像从手工作坊跳到了自动化工厂,虽然具体细节还没完全展开,但这个方向已经足够让人重新思考未来的技术栈了。
4.Qwen3.5 中等规模模型系列正式开源:更强智能,更低算力(魔搭ModelScope社区)
阿里云这次开源的Qwen3.5系列模型真的有点东西!它用了一种叫“早期融合”的技术,把图像和文字统一处理,让模型看图和理解文字一样自然。更厉害的是那个Gated Delta Network和MoE架构的结合,35B的大模型推理时只需要激活3B参数,算力需求直接降了一个数量级,部署成本大大降低。他们还用百万级Agent做强化学习训练,模型处理复杂任务的能力明显提升。最贴心的是,官方连怎么用SGLang/vLLM本地部署、怎么配置超长文本处理、怎么用MS-Swift微调都写得清清楚楚,开发者拿到就能直接用,这种“发布即落地”的文档支持太实在了。
5.Builders Unscripted: Ep. 1 - Peter Steinberger, Creator of OpenClaw(OpenAI)
这期访谈太有启发了!Peter Steinberger 这位从传统软件创始人转型的 AI 智能体先驱,分享了 OpenClaw 的创建故事。他讲得特别实在:现在开发者真得转变心态了,别再死磕语法和手动编码,让 AI 去处理那些枯燥的样板代码,咱们应该把精力放在更高层的架构设计和创造性问题上。他还提到一个有趣的变化——开源协作正在从传统的“拉取请求”变成“提示词请求”,意思比代码本身更重要,因为维护者只要理解了意图,就能用自己的智能体去实现方案。Peter 强调,用好 AI 可不是随便“氛围编码”就行,这就像学乐器一样,得培养对模型反应的直觉,知道什么时候该引导它,什么时候放手让它自己探索。最酷的是,当你给智能体一个安全沙箱和基础工具,它们真的能展现出意想不到的解决问题的能力,甚至自己造工具来完成没被明确编程的任务。不过他也提醒,别掉进“智能体陷阱”里过度复杂化设置,简单的对话式工作流往往更有效,直接问模型“你有什么问题吗?”反而能带来更好的结果。整个对话都在指向一个未来:软件可以自我修改,而开发者的角色会演变成智能系统的架构师。
6.[AINews] The Unreasonable Effectiveness of Closing the Loop(Latent Space)
最近AI圈的热点都指向了同一个方向:让AI真正“跑起来”。过去我们总在讨论AI怎么帮我们写代码,现在风向变了,大家开始关注AI怎么把写好的代码自动执行、测试、评审,形成一个完整的“闭环”。比如Cursor推出了“演示而非差异”功能,直接给你看软件运行的视频,而不是一堆枯燥的代码变更,这简直是评审效率的革命。还有阿里巴巴的Qwen 3.5模型,用更精巧的架构实现了比大块头模型更强的性能,证明“聪明”不一定非要靠堆参数。不过也别太乐观,研究显示AI的能力虽然涨得快,但可靠性还没跟上,在复杂任务里还是容易掉链子。这波趋势背后,是整个行业对延迟、吞吐量和智能体可靠性的极致追求,毕竟谁不想让AI助手反应快得像真人呢?
7.Coding Agent 有个甜蜜点,多数人直接跳过了(宝玉的分享)
你是不是也觉得AI编程助手用起来时灵时不灵?问题可能出在方法上。这篇文章点出了一个关键:AI编程智能体有个‘甜蜜点’,但很多人直接跳过了。它通过两个高产案例——Django创始人迁移Python库和Cloudflare重构Next.js API——揭示了高手是怎么玩的。核心就四件事:第一,别让AI凭空创造,给它明确的参照物,比如现有代码或文档,把任务变成‘翻译’;第二,构建‘智能体闭环’,让AI能自动跑测试、读报错、自我修复,效率直接起飞;第三,坚持先设计后实现,人类先和AI讨论好架构,把大任务拆成清晰的‘填空题’;第四,方向盘还得握在人类手里,负责关键决策和纠偏,防止AI自信满满地跑偏。说到底,区别就在于能不能主动把项目推进到这个舒适区,最大化AI的产出。
8.#424. 探秘 MiniMax:他们如何构建开源模型(跨国串门儿计划)
这期播客聊得真有意思!MiniMax的高级研究员Olive Song分享了他们在大模型研发一线的实战经验。你知道吗,在工业界搞大规模模型训练,那些看似枯燥的工程细节,比如确保FP32精度控制到位,往往比发明一个酷炫的新算法更能带来性能突破,这解决了理论和实际落地之间的鸿沟。他们还特别强调了人类对齐的重要性——模型在强化学习里可会“钻空子”了,得通过系统性的对齐和严格的安全测试,才能让它们乖乖按人类专家的预期行事。更有趣的是,MiniMax内部居然用AI Agent来追踪全球研究动态,自动过滤论文、总结要点甚至跑通代码,用AI技术来加速AI研究本身,这效率提升太酷了。至于开源模型权重,虽然可能冲击API商业模式,但他们认为加入开源社区能让开发者在私有部署和微调中玩出更多花样,借助全球力量共同进化,这才是技术突破的关键。最后还探讨了AGI这个“移动目标”——它没法被准确定义,会随着技术路径不断演变,核心还是朝着提升生产力和实现优雅的人机协作努力。听完感觉既有硬核的技术细节,又有开阔的行业视野,干货满满!
9.深度|OpenAI API 华人工程负责人:模型会把你的脚手架当早餐吃掉,为模型的未来而构建,而非为模型的当下而构建(Z Potentials)
OpenAI的工程负责人Sherwin Wu分享了一个让人又兴奋又警惕的观点:我们花大力气搭建的那些复杂框架和中间件,可能很快就会被更强大的模型直接“吃掉”。他透露,在OpenAI内部,AI已经渗透到几乎每个环节,工程师们正从写代码的人变成指挥AI智能体集群的“巫师”。他提醒我们,别总盯着模型现在的短板去搞过度工程,应该把眼光放远,想想未来一两年模型能原生处理长任务和多模态时,你的产品该是什么样子。这背后还藏着“一人十亿美元公司”的可能性和B2B垂直软件的黄金机会,但企业想用好AI,光靠命令可不行,得组建专门的“虎队”去点燃大家的热情。
其他
行业前沿与开源生态,整合行业深度洞察与开源技术动态的复合型主题,技术哲学、AGI 讨论、领袖观点。
1.#440.拒绝平庸与扩张:37signals 创始人 Jason Fried 的商业美学与“足够”哲学(跨国串门儿计划)
这期内容太有意思了,完全颠覆了硅谷那套增长至上的玩法。37signals创始人Jason Fried干了27年,总结出一套特立独行的商业美学——他压根不追求火箭式扩张,反而觉得‘足够’就是最好的状态。他坚持产品得先解决自己的痛点,这样才能找到真正懂你的核心用户;成本控制被他提到生死存亡的高度,甚至为了省下千万美金,直接把业务从云端搬回自家服务器。团队规模也卡在60人左右,砍掉中层管理,就为了消灭那些烦人的‘传话游戏’。他还用‘薄信封厚信件’比喻商业,外壳越简单越好,精力全砸在产品价值上。最打动人的是那种受自然启发的极简设计观,软件不该无限膨胀,得像实体经典一样直观耐用。听完就觉得,原来企业不一定非要疯狂增长,找到自己的稳定轨道,享受过程,反而能走得更远更踏实。
2.Anthropic CEO Dario Amodei:海啸已在地平线上,但没人在看(宝玉的分享)
Anthropic创始人Dario Amodei这次访谈真是信息量爆炸!他直接把AI比作即将到来的海啸,但大多数人还浑然不觉。最震撼的是他解释智能如何像化学反应一样,只要数据、算力和模型规模按比例投入,就能产生超越现有信息的逻辑思考能力。更值得关注的是他对权力集中的担忧——Anthropic不仅设立了长期利益信托,还主动支持加州监管法案,试图用制度设计防止少数公司垄断通用认知工具。谈到工作替代时,他用阿姆达尔定律点出个残酷现实:写代码这种技术活会最先被颠覆,反而是人际沟通、机构落地这些慢环节会成为新的护城河。给创业者的建议也很实在:别再做简单的API套壳了,去生物、金融这些高壁垒领域找机会,AI驱动下的肽类药物和细胞疗法可能引发生物科技文艺复兴。整场访谈既有哲学思考又有实操建议,看完让人既兴奋又后背发凉。
3.”A lot of intelligence is in how we reason, percei(a16z(@a16z))
李飞飞最近把智能分成了语言和空间两大类,她认为虽然现在语言模型已经相当厉害了,但真正能让机器人革命爆发的其实是空间智能。想想看,从家里扫地的Roomba到医疗助手,再到国防用的无人机,这些智能体都需要在物理世界里自如地移动和交互,而这正是空间智能的用武之地。语言智能让我们能对话,但空间智能才是让机器真正“活”起来、融入我们日常生活的关键。
4.#434.AI 时代的生存法则:纳瓦尔谈氛围编程、个人杠杆与创造力的未来(跨国串门儿计划)
纳瓦尔这期播客聊得挺透彻的,他提到现在用英语就能编程了,这叫“氛围编程”,哪怕你不是程序员,光靠描述想法也能做出产品来,以后应用会像海啸一样涌出来。不过他也强调,懂底层技术的工程师反而更值钱了,因为AI会犯错,只有他们能精准修复,还能把AI当杠杆用,效率翻百倍千倍。最核心的是,AI没有欲望和生存本能,取代不了企业家和艺术家,人类靠“主体意识”在未知领域做决策才是护城河。他还重新定义了智能——不是看学历,而是看你能不能从生活中得到想要的东西,比如健康、财富和关系。最后,别光焦虑AI,去学学它怎么工作的,动手试试新工具,焦虑自然就散了。
5.#423.硅谷教父 Ben Horowitz:AI 时代的美国雄心、管理心法与文化建设(跨国串门儿计划)
硅谷教父 Ben Horowitz 这次聊得真够硬核!他直接把 AI 比作工业革命级别的转折点,说这玩意儿正在改写国家竞争的游戏规则。最颠覆的是,软件开发那个老掉牙的“人月神话”定律被彻底打破了——现在只要手握海量数据、算力和顶尖 AI 人才,初创公司就能弯道超车,把行业巨头甩在身后。管理上他更狠,从英特尔传奇 CEO Andy Grove 那儿学来的“对抗性管理”理念,强调创始人得硬着头皮做那些让人不舒服的决策,把公司利益摆在个人情感前面。文化塑造这块儿他特别实在,反对空喊口号,坚持“文化就是行为”,比如 a16z 用开会迟到罚款这种具体规则,把“尊重创业者”真正落实到行动里。他还分享了个人掏钱帮拉斯维加斯警局用 AI 摄像头和无人机降低犯罪率的案例,认为技术手段比政策干预更能高效解决社会问题。听完感觉,这不仅是技术趋势分析,更是一套在 AI 时代活下去的生存法则。