2025-07-06发表会员计划1 小时读完 (大约10204个字)

Vol.58 AI领域创新与挑战：从模型优化到应用落地

⼤家好，Weekly Gradient第 58 期已送达，本期内容探讨了AI领域的最新进展，包括模型优化、大语言模型的应用、上下文工程的重要性、以及AI编程和多模态技术的发展。同时，也分析了AI在应用落地过程中面临的挑战和解决方案。

✉️ 免费订阅更新

订阅我的免费通讯，第一时间获取生成式 AI 领域优质内容

我承诺保护您的隐私，不会向第三方分享您的信息。
您可以随时取消订阅。

AI 商业化

聚焦AI行业的商业化路径、市场竞争格局和商业模式创新，包含投资趋势、GTM策略、SaaS转型等商业分析

1.红杉美国等机构 4800 万美金超大额押注，四位学者做了一个细分领域的 AI coding 产品（深思圈）

听说过Traversal吗？这家由四位学者创立的公司刚刚获得了4800万美元的融资，他们做的事情可不简单。通过AI技术，Traversal的AI SRE agent能够自主诊断复杂系统的故障，这可不是小打小闹。传统的故障排除方法依赖工程师的经验，效率低下，特别是在微服务架构下，问题更加复杂。Traversal的解决方案结合了因果机器学习、强化学习和AI agent技术，能够理解系统因果关系，大大提高了诊断的速度和准确性。这不仅仅是技术上的突破，更是对传统运维方式的一次革命。随着AI生成代码的普及，系统变得越来越复杂，AI SRE的市场需求将会爆炸性增长。Traversal的故事告诉我们，学术研究与企业实践的结合，能够创造出改变行业的产品。

2.智谱新 MaaS：10B 级效果最好 VLM 上线，Agents 应用空间也来了（智谱）

智谱在最近的产业生态大会上带来了两项重磅消息，首先是开源的视觉语言模型GLM-4.1V-Thinking，这个10B级别的多模态模型在多项评测中表现抢眼，甚至超越了更大体积的模型，展示了小体积模型的巨大潜力。更令人兴奋的是，它还引入了思维链推理机制，大大提升了处理复杂认知任务的能力。另一方面，智谱推出的Agent聚合平台「应用空间」为开发者提供了一个一站式接入AI能力的平台，大大降低了企业使用AI技术的门槛。加上数亿资金的扶持计划，这无疑为AI技术的商业化应用开辟了新的道路。

3.喝点 VC｜红杉美国对谈 OpenAI 前研究主管：预训练已经进入边际效益递减阶段，其真正杠杆在于架构的改进（Z Potentials）

红杉美国与OpenAI前研究主管Bob McGrew的对话揭示了AI发展的几个关键趋势。预训练的边际效益正在递减，架构改进成为未来的关键。2025年，推理技术将成为焦点，其优化潜力巨大。Agent的普及将颠覆传统经济模式，简单任务的价格将接近计算成本，而复杂服务则保持稀缺。专有数据的价值正在变化，AI重构了具身劳动，但具体客户的数据仍有其独特价值。机器人技术迎来新机遇，语言接口降低了任务描述的成本。在AI时代，教育需要转向培养学习过程和自主能动性。最后，管理高绩效团队的真谛在于真心关心团队成员，这样才能激发他们的最大潜能。

4.120 页深度报告，搞懂今年大模型和应用的现状与未来（Founder Park）

这份120页的深度报告揭示了2025年AI产业的现状与未来，特别是大模型和应用的发展趋势。报告指出，基础模型正面临高昂成本与快速折旧的经济学悖论，训练成本飙升而生命周期缩短。技术突破如自监督学习和注意力机制正在解决规模化瓶颈，催生新的’涌现’能力。AI已经深度重塑知识工作，尤其是在软件工程领域，AI代码生成工具创造了SaaS增长的新纪录。智能体技术虽然崛起，但通用型智能体的商业化仍面临挑战，特化智能体更受市场青睐。此外，成功的AI应用不再依赖单一模型，而是通过多模型协作提升性能。数据收集成本的显著降低为AI智能体的发展带来了新机遇。

5.从 Co-pilot 到 Agentic AI，Sierra 如何改变客服的游戏规则（海外独角兽）

如果你对AI如何改变客户服务行业感到好奇，那么Sierra AI的故事绝对值得一读。由前Salesforce联席CEO Bret Taylor创立的Sierra AI，通过其深度定制化的AI Agent，不仅能够像资深员工一样思考和行动，还能完全自主执行任务，彻底改变了游戏规则。特别是它们的噪声抑制技术和多任务处理能力，让交互体验达到了新高度。更令人兴奋的是，Sierra采用的基于成果的定价模式，只在AI成功完成任务时收费，这种创新模式在SiriusXM的案例中使封闭率提高了30%。而且，Sierra的案例还展示了AI Agent在垂直行业的巨大潜力，比如在金融行业处理反垄断审查的效率比通用平台高40%。最后，不得不提的是，Sierra的AI Agent正在重塑劳动力市场格局，如在Minted案例中处理了65%的节日旺季咨询，让人工客服能专注于更复杂的案例。这一切都预示着AI Agent在客户服务领域的未来不可限量。

AI 产品设计

探索AI原生产品的设计范式与用户体验革新，强调产品哲学、交互模式、Agent设计等

1.不止是工具：如何把 AI “炼”成另一个不完美的你？｜对谈余一（AI炼金术）

你有没有想过，AI不仅仅是工具，它还能成为你的数字分身或团队成员？这期内容带你深入了解如何通过喂养个人数据和特质，训练出一个高度个性化的AI版本。嘉宾余一分享了如何让AI理解和模拟人的非理性、情绪和内在冲突，使其更真实、更像个体。更酷的是，利用AI进行人生模拟，辅助你在虚拟空间中预演不同决策路径，从而在现实中做出更明智的选择。未来的工作模式将是人与AI组成的团队协作，人类作为Leader，AI负责执行可拆解任务，实现更高效的协作。具体到应用层面，AI还能帮你优化日程管理，分析会议中的情感线，提供个人表现反馈。这不仅仅是一次技术应用的探索，更是一次关于人与AI共生关系的深度思考。

2.Open Researcher， our AI Agent That Uses Firecrawl Tools During Research（FireCrawl Blog）

Firecrawl 推出的 Open Researcher 可不是一般的 AI 助手，这家伙厉害着呢。它用上了 Anthropic 的交替思考技术，不用你告诉它每一步该怎么做，自己就能在研究过程中灵活调整策略。最酷的是，它还能把思考过程可视化，让你一眼看穿它的决策逻辑。无论是技术文档里的过期信息，还是企业调研的策略制定，甚至是 API 认证的逻辑推理，Open Researcher 都能轻松应对。这不仅仅是一个工具，它代表了 AI 研究助手的新方向，让复杂的研究任务变得简单透明。

3.实测 Readdy：美观度拉满的 AI 编程工具，出海 4 个月交出亮眼成绩单（歸藏的AI工具箱）

Readdy 这款 AI 编程工具真的让人眼前一亮，不仅生成的网页美观度超高，设计上几乎能和专业设计师媲美。最让人惊喜的是，它还能一键导出到 Figma，转换质量高到所有元素都是自动布局，后续编辑简直不要太方便。对于那些想扩展功能的用户来说，’继续生成’这个功能简直是福音，点一下就能生成新页面或功能，连代码都不用写。更厉害的是，内置的数据库功能让非专业开发者也能轻松创建有数据交互功能的应用，实用性大大提升。背后由 MasterGo 团队开发，难怪在设计上这么有优势，上线才4个月就取得了近500万美元ARR的成绩，确实值得关注。

4.吴恩达老师分享的这个做 MVP（最简可行产品，minimum viable product）的技巧（宝玉的分享）

吴恩达老师分享了一个超级实用的技巧，教你如何通过大幅缩减项目范围，快速构建一个1小时内就能完成的MVP。这个方法特别适合那些因为项目太大而迟迟不敢动手的开发者。文章中，吴恩达用自己开发’虚拟观众模拟器’的案例，展示了如何从最初的数十个虚拟观众的设想，精简到仅使用一个简单的2D图像，并采用Wizard of Oz原型方法，由真人手动控制反馈。这种快速起步的方式不仅能加速创意验证，还能促进技能学习，及早获得用户反馈。通过简化功能，比如减少观众数量、使用简单技术，开发者可以立即动手并持续迭代。

5.#164. 打造 AI 时代的工作空间：Granola 创始人的产品哲学与创业之路（跨国串门儿计划）

Granola 的故事不仅仅是关于一个 AI 笔记应用的诞生，它揭示了在 AI 时代如何抓住机遇，打造真正解决用户痛点的产品。两位创始人从线上社区的偶然相识到共同创业，他们的旅程充满了对 AI 技术如何改变我们工作方式的深刻洞察。他们分享了如何在技术快速迭代的背景下做出战略选择，哪些技术问题可以等待模型进步自然解决，哪些需要团队亲自攻克。特别引人注目的是他们的’蜥蜴脑’设计哲学，强调在用户注意力有限的高压场景下，产品必须极简直观，直击核心需求。通过封闭内测和数据图表，Granola 验证了产品与市场的契合度，展现了从直觉到数据的产品打磨过程。更令人兴奋的是，Granola 的愿景远不止于会议纪要工具，它计划整合邮件、Slack 等信息，成为知识工作者的’第二大脑’，一个真正的’超级工作空间’。这个故事不仅对创业者有启发，也为所有关注未来工作方式的人提供了宝贵的思考。

6.122: 10 分钟朱啸虎投资，泡泡玛特、米哈游都在试；Fuzozo 孙兆治聊 AI 潮玩（晚点聊 LateTalk）

这期内容带你深入了解福仔福 zo，一款专为90后、00后女性设计的AI潮玩，它不仅仅是一个玩具，更是一个能提供情绪陪伴的伙伴。从最初的具身智能概念到最终轻巧便携的产品形态，福仔的转变充分体现了团队对用户需求的敏锐捕捉和快速响应。通过多模态模型、TTS技术以及创新的长期记忆机制，福仔能够与用户建立深度的情感连接，带来独一无二的养成体验。节目中还分享了福仔如何在短时间内获得朱啸虎的投资，以及在京东首发的销售表现，同时探讨了AI陪伴硬件市场的巨大潜力和面临的挑战，包括米哈游、泡泡玛特等大厂的入局。最后，展望了端侧模型等技术进步可能给行业带来的变革，以及孙兆志从设计到创业的跨界思考。

AI 工程实践

涵盖AI系统技术实现与场景化开发的全流程，包含工程架构、工具链实践、提示工程等核心技术环节

1.关于 AI 辅助软件交付成熟度模型的探讨（Thoughtworks洞见）

如果你对AI如何改变软件交付流程感到好奇，这篇文章绝对值得一读。它提出了一个从L0到L5的成熟度模型，详细描述了AI在软件交付中的角色如何从辅助工具演变为全自主生态。特别有趣的是，随着级别的提升，人机分工和Prompt驱动开发的方法论也在不断进化。文章还提供了一个实用的自评工具，帮助团队评估自己的成熟度，并指出了AI治理在高级别成熟度中的重要性。对于那些希望提升团队AI能力的实践者和管理者来说，这篇文章提供了清晰的演进路径和关键成功因素。

2.Python 语言从 2.7 到 3.14 的能力变化与演进逻辑（阿里云开发者）

Python 语言的进化之旅，从 2.7 到 3.14，不仅仅是版本号的跳跃，更是一场技术的革命。字符串处理变得更简洁高效，f-string 的引入让格式化不再是头疼的事。异步编程的 async/await 语法，让代码既美观又实用，特别是在云原生场景下。类型系统的建立和完善，让 Python 也能稳稳支撑起大型项目。性能方面，Faster CPython 项目带来的速度提升，JIT 编译和内存管理的改进，让 Python 跑得更快更稳。标准库的精简和第三方生态的繁荣，特别是 AI/ML 领域的爆发，让 Python 的舞台更加宽广。开发者工具的完善，从 pathlib 到类型检查器，让开发体验更上一层楼。Python 的未来，值得期待。

3.AI 编程如何在团队中真正落地？（阿里云开发者）

阿里云高德信息业务中心大供给团队分享了他们如何在实际项目中成功落地 AI 编程工具 Cursor 的经验。面对使用流程不统一、语言表达不清晰和前置步骤复杂这三大挑战，团队没有退缩，而是提出了研发流程规范、结构化语言表达和通用解决方案三大策略。他们不仅详细规划了从需求到测试每个阶段如何使用 Cursor，还创新性地引入了’概要设计-详细设计’流程，确保每一步都走得稳。通过模板化的 prompt 和概要设计，比如代码分包目录结构规范和单应用发布计划模板，团队与 AI 的沟通变得前所未有的高效。更棒的是，他们还总结了一套通用 Rules 和 prompt 提纲，让新成员也能快速上手。这一切都证明，AI 工具要想在团队中真正发挥作用，就得和现有的技术栈、代码规范以及发布流程深度整合。

4.悟空 Agent 实战：LLaMA-Factory 高危 0day 漏洞挖掘与修复（腾讯技术工程）

腾讯悟空团队最近展示了AI在网络安全领域的强大能力，通过他们的AI Agent自动化挖掘了开源项目LLaMA-Factory中的一个高危漏洞。这个案例不仅展示了AI如何从漏洞发现到修复建议生成实现全流程自动化，还揭示了AI在提升漏洞挖掘效率和准确性方面的巨大潜力。特别是，AI能够穿透复杂逻辑链精确定位漏洞，这对于缩短漏洞从潜伏到被发现的时间窗口至关重要。LLaMA-Factory的漏洞由于不安全的torch.load反序列化导致，影响范围广泛，但幸运的是，官方在收到报告后迅速响应并修复。这个案例为AI在安全审计中的应用提供了一个标准化范式，预示着AI将如何重塑网络安全防御体系。

5.如何让 AI 成为你的编程搭档？一次真实重构告诉你答案（阿里云开发者）

想知道AI如何成为编程高手的好搭档吗？这篇文章带你一探究竟。通过一个真实的高德商家平台店铺装修模块重构案例，展示了Cursor AI工具如何在不同工作模式下大显身手，从代码理解到精准编辑，再到跨文件重构，每一步都透露着AI的潜力与局限。关键在于，如何通过精心设计的结构化Rules规范系统和详细的设计文档，引导AI生成既符合标准又高质量的代码。面对复杂业务场景，拆解任务至AI可处理的粒度，再结合严格的开发规范，AI的代码生成准确率和采纳率都能大幅提升。实际效果令人振奋，开发时间减半，代码生成采纳率高达95%。当然，AI工具在跨应用支持和复杂上下文理解方面还有提升空间，但这并不妨碍它成为提升开发效率的利器。

6.微信技术架构部斩获 CVPR 2025 大赛冠军，攻克 AI 图文匹配评估难题（腾讯技术工程）

微信技术架构部的IH-VQA团队在CVPR2025的NTIRE挑战赛中大放异彩，他们的iMatch方案不仅拿下了冠军，还重新定义了AI图文匹配质量的评估标准。这个团队通过双模型驱动、数据增强、优化Q-Align概率映射策略和视觉数据增强四项创新，解决了传统方法难以全面评估图文匹配度的问题。更厉害的是，他们提出的iMatch-Benchmark，为文生图领域的研究和实际应用提供了可靠的性能参考，推动了整个行业的标准化进程。这次胜利不仅展示了腾讯WXG在AI图文多模态质量评估研究中的领先地位，也为AI生成模型的优化指明了方向。

7.智谱 AI 发布新版 VLM 开源模型 GLM-4.1V-9B-Thinking，引入思考范式，性能提升 8 倍（魔搭ModelScope社区）

智谱 AI 的最新力作 GLM-4.1V-9B-Thinking 开源视觉语言模型，不仅在 18 个榜单任务中超越了参数量大 8 倍的对手，还通过课程采样强化学习和思维链推理机制，让性能飙升。支持 64k 上下文长度和 4k 图像分辨率，这意味着它能搞定更复杂的任务和更清晰的图片。更棒的是，它还支持中英文双语，让更多用户受益。文章还贴心地提供了完整的推理和微调代码示例，特别是 ms-swift 框架的支持，让模型用起来更顺手。

8.普通人用 Gemini CLI 提效的 1 万种方法！藏师傅保姆级教程（歸藏的AI工具箱）

如果你曾经因为复杂的命令行操作而头疼，或者对那些需要编程知识才能使用的专业工具望而却步，那么Google的Gemini CLI可能是你的救星。这款工具通过自然语言交互，让非技术用户也能轻松完成文档编辑、图片处理等复杂操作。它不仅支持多种文件格式的处理，还能与传统工具如ffmpeg、ImageMagick无缝集成，扩展了更多高级功能。更棒的是，从安装到具体使用，文章提供了详尽的指导，确保即使是命令行新手也能快速上手。Gemini CLI的出现，或许真的能让技术隐形，让创作变得更加简单。

9.microsoft/vscode-copilot-chat（Simon Willison’s Weblog）

微软最近做了一件挺酷的事，他们把VS Code的GitHub Copilot Chat客户端开源了，用的还是MIT许可证。这意味着咱们开发者现在可以深入查看Copilot的对话组件是怎么工作的，甚至还能自己动手贡献代码。文章里特别提到了几个技术亮点，比如那些高级的提示工程技术，包括代理指令、上下文摘要提示和终端快速修复方案，这些都是为了让编程辅助更智能。还有一个超实用的创新，就是基于SQLite的缓存机制，这让即使是大语言模型那种不太确定性的东西也能进行可靠的测试。对于那些对AI赋能开发工具感兴趣的朋友来说，这篇文章绝对值得一读，不仅技术细节丰富，还能看到开源对行业的积极影响。

10.Instruction-Following Pruning for Large Language Models（Apple Machine Learning Research）

听说过能让大语言模型更聪明更高效的新技术吗？’指令驱动剪枝’就是这样一项突破，它让模型能根据你的指令动态调整，像变魔术一样只激活需要的部分。这不仅让模型在数学和编程任务上表现更出色，准确率提升了5-8个百分点，还大大节省了计算资源，让高性能AI在手机这样的终端设备上运行不再是梦。这项技术的核心在于一个聪明的掩码动态预测模块，它能和模型一起学习，确保每次只调用最相关的参数。更棒的是，它借鉴了专家混合系统的优点，但通过固定任务参数，让模型在边缘设备上的部署变得轻松多了。如果你对AI如何变得更高效、更智能感兴趣，这项技术绝对值得关注。

11.How to Fix Your Context（Simon Willison’s Weblog）

如果你正在和大语言模型打交道，可能会遇到上下文管理这个头疼的问题。这篇文章就像一本指南，详细介绍了如何解决上下文污染、注意力分散、信息混淆和上下文冲突这四大难题。Drew Breunig提出的五大策略，从限制工具数量到采用独立线程隔离任务，再到智能压缩和外部存储，每一条都是实战中提炼出的精华。记住，每个令牌都至关重要，管理好上下文，模型的表现才能更上一层楼。

12.写代码从来不是瓶颈（宝玉的分享）

软件开发的世界里，写代码其实是最简单的一环。真正的挑战藏在代码审查、知识传递、测试调试和团队沟通这些’人类开销’里。大语言模型(LLM)让代码生成变得前所未有的容易，但这并不意味着问题解决了。相反，理解、测试和信任这些生成的代码变得更加复杂，尤其是当代码里藏着不熟悉的模式或潜在的副作用时。LLM并没有消除工作，只是把工作从编写转移到了审查和维护上。更别提，它还放大了’复制粘贴工程’的问题。团队协作的核心在于共同理解和信任，但当代码生成的速度远超沟通和审查的速度时，团队可能会陷入一种’默认质量’而非’确保质量’的困境。说到底，LLM在原型开发等方面确实有其价值，但清晰思考、谨慎审查和周密设计这些人类认知工作，依然是软件开发中不可或缺的部分。

13.Karpathy：我不是要造新词，是「上下文工程」对 Agent 来说太重要了（Founder Park）

Andrej Karpathy 提出的「上下文工程」概念，彻底改变了我们对 AI Agent 开发的看法。不再只是纠结于如何写出完美的提示词，而是如何构建一个动态、丰富的上下文环境，让 AI 能够更聪明地理解和响应。这篇文章不仅清晰地定义了上下文工程，还详细对比了它与传统提示词工程的区别，更提出了四种实用的策略来落地这一概念。无论是通过持久化信息、智能检索、优化 token 使用，还是多 Agent 协作，上下文工程都能显著提升 AI 应用的性能和用户体验。特别是在处理复杂任务和多轮对话时，一个拥有丰富上下文的 Agent 展现出的智能和人性化，远超那些仅依赖提示词的对手。

14.夸克生成千万份志愿报告背后：一个 Agent 应用“深度落地”的真实样本（硅星人Pro）

阿里夸克在高考志愿填报这一零容错场景中，通过七年不懈努力，构建了一个高可信度的知识库，并应用AI Agent技术，生成了超过1000万份志愿报告。这不仅展示了AI从玩具到工具再到智能助手的演进路径，也体现了技术普惠的长期主义实践。夸克的成功在于其严格的数据治理和人工校验，以及分层模型调校，使得AI能在高风险场景提供可靠服务。更值得一提的是，通过设计需求澄清流程等人机协作机制，AI不仅能执行指令，还能处理矛盾需求，主动提示风险并将决策权交还用户。这一案例为AI在其他严肃场景的应用提供了可借鉴的方法论。

15.OpenAI 研究员 Noam Brown：Mid-training 是新的 pre-training（海外独角兽）

OpenAI 研究员 Noam Brown 分享了他对 AI 模型训练和推理能力的深刻见解，提出了一个引人注目的观点：mid-training 正在成为新的 pre-training 阶段。他强调，模型的推理能力是在 pre-training 达到一定水平后自然涌现的，而强化学习在数据稀缺的未来将展现出其不可替代的价值。同时，test-time compute 的发展瓶颈和 multi-agent 系统可能催生的’AI 文明’构想，为我们揭示了 AI 发展的复杂性和无限可能。Noam Brown 还分享了他在 AI Coding 实践中的宝贵经验，尽管面临挑战，但对未来充满期待。

16.AI 的新技能不是提示词，而是上下文工程（宝玉的分享）

如果你还在为AI智能体的表现不够智能而头疼，或许该把注意力从模型本身转移到上下文工程上了。这篇文章揭示了上下文工程如何成为AI领域的新星，它不仅仅是关于提示词的堆砌，而是关乎如何动态地构建一个包含指令、对话历史、长期记忆等多维度的信息环境。通过对比那些因为上下文不足而显得呆板的AI和那些因为丰富上下文而显得神奇的AI，文章清晰地展示了上下文质量对AI表现的决定性影响。构建强大的AI智能体，关键在于深入理解业务场景，清晰定义预期输出，以及如何高效地组织和呈现必要的信息。这不仅仅是技术上的挑战，更是对理解和应用AI能力的深刻洞察。

17.一文看懂“提示词” vs “提示词工程” vs “上下文工程”（宝玉的分享）

如果你对AI如何理解和执行我们的指令感到好奇，这篇文章就像一把钥匙，打开了理解AI交互背后的秘密。它详细解释了提示词、提示词工程和上下文工程这三个概念，从基础的指令输入到复杂的动态上下文构建，每一步都通过实例和图表清晰展示。无论你是AI爱好者还是开发者，这篇文章都能让你对AI的工作原理有更深的认识，特别是那些想要构建更智能AI应用的人，这里面的知识简直就是宝藏。

18.科学进步实际上很大程度依赖于实打实的实验结果，而不仅仅是理论智力｜AI 自我提升不会突然“起飞”，而是逐渐加速的过程（宝玉的分享）

AI 自我提升听起来像是科幻小说里的情节，但现实中的进展远比想象中要脚踏实地。不是一夜之间就能超越人类，而是需要长时间的反复优化和训练，这个过程可能漫长到十年。而且，AI在不同领域的进步速度大相径庭，从简单的语言改进到处理特林吉特语这样的稀有语言，挑战的难度简直是天壤之别。更关键的是，无论AI的智力有多高，科学进步的速度最终还是被现实世界的实验验证所限制。这意味着，AI的发展虽然令人兴奋，但它的每一步都离不开实打实的实验结果。

其他

行业前沿与开源生态，整合行业深度洞察与开源技术动态的复合型主题，技术哲学、AGI讨论、领袖观点

1.The Early Days: How Veeva Hit $100m ARR With Just $3m Raised — And a Deep Vertical Focus（SaaStr）

Veeva的故事就像是一场精心策划的逆袭，证明了在生命科学这样的垂直市场深耕能带来意想不到的竞争优势。创始人Peter Gassner用仅仅300万美元的融资，就实现了1亿美元的年度经常性收入，这背后是他对市场的深刻理解和极端的资本纪律。Veeva的成功还在于它如何策略性地扩展产品线，只在市场机会显著大于核心业务时才行动，以及从一开始就坚持溢价定价，这不仅塑造了产品的市场认知，还确保了质量。最让人印象深刻的是，Veeva证明了在创业初期，无情的执行比远大的愿景更为重要。这个故事不仅仅是关于Veeva的，它给所有创业者上了一课：如何在有限的资源下，通过专注和执行，实现可持续的增长。

2.#163. 李飞飞：空间智能是人工智能的下一个前沿（跨国串门儿计划）

李飞飞博士，这位被誉为‘AI教母’的科学家，在最新一期的播客中分享了她的见解和经历。从创建ImageNet项目，为深度学习革命奠定基础，到探讨空间智能作为人工智能的下一个前沿，李博士的视角总是前瞻而深刻。她认为，理解三维世界的复杂结构是AI迈向通用智能的关键一步，而她的World Labs公司正致力于构建能够理解和推理三维世界的‘世界模型’。李飞飞的故事不仅仅是关于技术的突破，更是关于勇气和无畏的精神。从移民到经营洗衣店，再到成为AI领域的领军人物，她的经历证明了专注于目标、不畏艰难的重要性。对于那些对AI未来充满好奇的你，这期内容无疑是一次思想的盛宴。

3.#162. Airbnb 成功的核心不是房子，而是信任：解密 25 亿次人际连接的商业密码（跨国串门儿计划）

Airbnb的故事远不止于提供一个住宿平台那么简单，它背后是对人性本善的深刻信任和25亿次人际连接的奇迹。Brian Chesky分享的不仅是Airbnb的成长史，更是一部关于如何在快速扩张中保持初心和灵活性的教科书。从气垫床到全球巨头，再到向全方位旅行及本地生活服务的超级应用转型，Airbnb的每一步都充满了对未来的大胆想象。特别值得一提的是，Chesky提出的创始人模式，提醒所有领导者，无论公司规模多大，都要像创业初期那样贴近产品和用户。而AI的加入，无疑将为Airbnb的安全性和用户体验带来革命性的提升。对于那些对创新、领导力和未来旅行方式感兴趣的人来说，这绝对是一次不可多得的思想盛宴。

4.AI 领域并无真正的新想法，只有新的数据集（宝玉的分享）

你有没有想过，AI领域的那些所谓重大突破，其实背后并没有什么全新的理论？这篇文章揭示了四次AI重大突破的真相：深度神经网络、Transformer、RLHF和推理模型，它们的理论早就存在，真正的功臣是新数据集的发现和应用。比如ImageNet、互联网文本这些数据集，才是推动AI进步的关键。研究还发现，在相同的数据集下，不同的架构表现其实差不多，这验证了一个被称为’苦涩教训’的观点：数据，而非算法或架构，才是AI进步的限制因素。文章还大胆预测，未来的AI突破可能会来自YouTube的海量视频数据，或者是机器人实时采集的具身化数据。这让我们不得不重新思考AI的发展观：或许我们应该减少对方法论的过度迷恋，转而更多地关注新数据源的挖掘和利用。AI的能力确实在呈指数级增长，但这种进步更多地来自于数据的积累，而非算法的创新。

Vol.58 AI领域创新与挑战：从模型优化到应用落地

https://liduos.com/the-weekly-gradient-58.html

作者

莫尔索

发布于

2025-07-06

更新于

2025-08-18

Vol.58 AI领域创新与挑战：从模型优化到应用落地

✉️ 免费订阅更新

AI 商业化

1.红杉美国等机构 4800 万美金超大额押注，四位学者做了一个细分领域的 AI coding 产品（深思圈）

2.智谱新 MaaS：10B 级效果最好 VLM 上线，Agents 应用空间也来了（智谱）

3.喝点 VC｜红杉美国对谈 OpenAI 前研究主管：预训练已经进入边际效益递减阶段，其真正杠杆在于架构的改进（Z Potentials）

4.120 页深度报告，搞懂今年大模型和应用的现状与未来（Founder Park）

5.从 Co-pilot 到 Agentic AI，Sierra 如何改变客服的游戏规则（海外独角兽）

AI 产品设计

1.不止是工具：如何把 AI “炼”成另一个不完美的你？｜对谈余一（AI炼金术）

2.Open Researcher， our AI Agent That Uses Firecrawl Tools During Research（FireCrawl Blog）

3.实测 Readdy：美观度拉满的 AI 编程工具，出海 4 个月交出亮眼成绩单（歸藏的AI工具箱）

4.吴恩达老师分享的这个做 MVP（最简可行产品，minimum viable product） 的技巧（宝玉的分享）

5.#164. 打造 AI 时代的工作空间：Granola 创始人的产品哲学与创业之路（跨国串门儿计划）

6.122: 10 分钟朱啸虎投资，泡泡玛特、米哈游都在试；Fuzozo 孙兆治聊 AI 潮玩（晚点聊 LateTalk）

AI 工程实践

1.关于 AI 辅助软件交付成熟度模型的探讨（Thoughtworks洞见）

2.Python 语言从 2.7 到 3.14 的能力变化与演进逻辑（阿里云开发者）

3.AI 编程如何在团队中真正落地？（阿里云开发者）

4.悟空 Agent 实战：LLaMA-Factory 高危 0day 漏洞挖掘与修复（腾讯技术工程）

5.如何让 AI 成为你的编程搭档？一次真实重构告诉你答案（阿里云开发者）

6.微信技术架构部斩获 CVPR 2025 大赛冠军，攻克 AI 图文匹配评估难题（腾讯技术工程）

7.智谱 AI 发布新版 VLM 开源模型 GLM-4.1V-9B-Thinking，引入思考范式，性能提升 8 倍（魔搭ModelScope社区）

8.普通人用 Gemini CLI 提效的 1 万种方法！藏师傅保姆级教程（歸藏的AI工具箱）

9.microsoft/vscode-copilot-chat（Simon Willison’s Weblog）

10.Instruction-Following Pruning for Large Language Models（Apple Machine Learning Research）

11.How to Fix Your Context（Simon Willison’s Weblog）

12.写代码从来不是瓶颈（宝玉的分享）

13.Karpathy：我不是要造新词，是「上下文工程」对 Agent 来说太重要了（Founder Park）

14.夸克生成千万份志愿报告背后：一个 Agent 应用“深度落地”的真实样本（硅星人Pro）

15.OpenAI 研究员 Noam Brown：Mid-training 是新的 pre-training（海外独角兽）

16.AI 的新技能不是提示词，而是上下文工程（宝玉的分享）

17.一文看懂“提示词” vs “提示词工程” vs “上下文工程”（宝玉的分享）

18.科学进步实际上很大程度依赖于实打实的实验结果，而不仅仅是理论智力｜AI 自我提升不会突然“起飞”，而是逐渐加速的过程（宝玉的分享）

其他

1.The Early Days: How Veeva Hit $100m ARR With Just $3m Raised — And a Deep Vertical Focus（SaaStr）

2.#163. 李飞飞：空间智能是人工智能的下一个前沿（跨国串门儿计划）

3.#162. Airbnb 成功的核心不是房子，而是信任：解密 25 亿次人际连接的商业密码（跨国串门儿计划）

4.AI 领域并无真正的新想法，只有新的数据集（宝玉的分享）

作者

发布于

更新于

许可协议

喜欢这篇文章？打赏一下作者吧

评论

订阅我的免费通讯

我的作品

目录

最新文章

归档

标签

4.吴恩达老师分享的这个做 MVP（最简可行产品，minimum viable product）的技巧（宝玉的分享）