AI 周刊 Weekly Gradient 说明

原属于会员计划的邮件通讯现在已全面免费公开,更名为 Weekly Gradient (Gradient 是 AI、机器学习中的核心概念,隐喻每周的技术梯度、趋势更新),用于分享 AI 领域过去一周的最新动态和技术进展,输入邮件免费订阅,获得及时更新。

阅读更多

如何以及何时构建多智能体系统

本文译自 How and when to build multi-agent systems

上周晚些时候发布了两篇标题看似相左的精彩博文:Cognition 团队的《不要构建多智能体》与 Anthropic 团队的《我们如何构建多智能体研究系统》。

尽管标题对立,但两者实则存在诸多共识,并揭示了构建多智能体系统的关键原则:

  1. 上下文工程至关重要
  2. 以”读”为主的多智能体系统比以”写”为主的更易实现
阅读更多

从Cursor到Claude Code,我发现了AI编程的真正价值

这是我新开的一个系列文章,主要探讨 AI 应用的一些想法,例如 AI 搜索、AI 编码,以及用户需要什么样的 Agent 等话题。这些内容基于我实际使用 AI 产品并开发相关 Agent 的经验总结,具有较强的主观性。非常欢迎花时间读完的朋友在留言区表达自己的观点,让我也学习学习,否则这篇文章你也没必要浪费时间看,系列第 1 篇就从 AI 编码开始。

阅读更多

Vol.54 什么是 NLWeb

根据之前调查问卷收集的反馈情况,本期开始对周刊的内容做大幅调整。

【AI 商业变现】部分,简单来说就是AI 项目是如何赚钱的,以及如何利用 AI 赚钱的案例和经验,从个人到大公司的分享都有。

【AI 产品设计】部分,AI 产品的设计、交互方面的文章和资源分享。

【AI 工程实践】部分,定位不变,来自开发者工具团队或模型基础厂商的技术分享。

【其他】部分,包括各家模型厂商重要更新和产品新闻、市场报告等信息,因为这些东西大家到处可以看得到,可有可无,没必要占用篇幅。再包括一些论文(话题包括 Agent 评估和 安全、Agent 记忆管理、工具与推理协同、Agent 产品人机交互等方面)。

⼤家好,Weekly Gradient 第 54 期内容已送达。

阅读更多

Vol.53 如何让 Agent 规划调用工具

本期综合讨论了 Agent 在多轮对话中的应用和挑战,包括 LLMs 的局限性及如何克服这些限制。文章强调了通过端到端的强化学习、ChatBI 的实践经验、AI 智能体的提示工程技巧、以及大模型技术演进的趋势。同时,文章也探讨了 AI 在商业智能领域的应用,包括 AI 视频内容生成、AI 生成播客、以及新版本的开源模型。此外,文章还讨论了蚂蚁集团在 AI 领域的应用,以及 AI Agent 如何帮助企业进行流程改造和内部数据分析。最终,文章提出了对 AI Agent 潜力的新颖视角,强调了 AI Agent 在模拟真实用户和主观世界中的重要性。

阅读更多

Vol.52 面向 AI 产品的智能体评估指南

本期介绍了 AI 产品评估的全面指南,包括如何评估 Agent(代理)的性能,如何使用评估工具和平台,以及如何选择合适的评估指标和评分函数。详细介绍了评估 Agent 的方法论、评估工具的使用效率、工具的正确性评估、以及如何平衡量化与质量指标。提供了选择合适评估指标和评分函数的策略,以及如何通过迭代评估过程来不断优化 AI 产品。同时,对述了 AI 产品经理在设定成功标准和评估指标方面的经验。此外还讨论了相关技术的最新进展,包括 RAG 技术的发展、AI 产品的改进挑战、以及不同公司和组织推出的 AI 相关工具和平台。

阅读更多

Vol.51 AI 智能体商业落地的现状与真相

论文:详细介绍了 PIKE-RAG、KG-HTC、Agent to User Interaction Protocol 等 AI 智能体技术。
工程:讨论了 AI 智能体在商业落地中面临的真实情况,以及 Agent to User Interaction Protocol 的优化。
产品:分析了 AI 产品如 Lovable、Cursor 等的设计原则,以及 AlphaEvolve 在算法设计和优化中的应用。
市场:探讨了 Agentic AI 在市场中的应用,包括微信生态系统中的 Agentic AI 布局,以及 AI 在广告、交易、GPU 租赁等方面的商业模式。
观点:总结了 2025 年关于 Agent 的发展和应用,包括 Agent 的技术挑战、工程实现、商业应用以以及 Agentic AI 在市场中的应用

阅读更多