会员计划说明

我要推出一个为期一年的会员计划,这篇文章我想从会员计划介绍、面向人群、会员权益、会员定价四个方面来介绍下,希望大家理性消费,务必先看权益部分的内容是否是自己未来一年内要聚焦和关注的,然后再看定价是否满足自己当前的消费能力。

阅读更多

Vol.54 什么是 NLWeb

根据之前调查问卷收集的反馈情况,本期开始对周刊的内容做大幅调整。

【AI 商业变现】部分,简单来说就是AI 项目是如何赚钱的,以及如何利用 AI 赚钱的案例和经验,从个人到大公司的分享都有。

【AI 产品设计】部分,AI 产品的设计、交互方面的文章和资源分享。

【AI 工程实践】部分,定位不变,来自开发者工具团队或模型基础厂商的技术分享。

【其他】部分,包括各家模型厂商重要更新和产品新闻、市场报告等信息,因为这些东西大家到处可以看得到,可有可无,没必要占用篇幅。再包括一些论文(话题包括 Agent 评估和 安全、Agent 记忆管理、工具与推理协同、Agent 产品人机交互等方面)。

⼤家好,会员计划第 54 期会员通讯已送达。

阅读更多

Vol.53 如何让 Agent 规划调用工具

本期综合讨论了 Agent 在多轮对话中的应用和挑战,包括 LLMs 的局限性及如何克服这些限制。文章强调了通过端到端的强化学习、ChatBI 的实践经验、AI 智能体的提示工程技巧、以及大模型技术演进的趋势。同时,文章也探讨了 AI 在商业智能领域的应用,包括 AI 视频内容生成、AI 生成播客、以及新版本的开源模型。此外,文章还讨论了蚂蚁集团在 AI 领域的应用,以及 AI Agent 如何帮助企业进行流程改造和内部数据分析。最终,文章提出了对 AI Agent 潜力的新颖视角,强调了 AI Agent 在模拟真实用户和主观世界中的重要性。

阅读更多

Vol.52 面向 AI 产品的智能体评估指南

本期介绍了 AI 产品评估的全面指南,包括如何评估 Agent(代理)的性能,如何使用评估工具和平台,以及如何选择合适的评估指标和评分函数。详细介绍了评估 Agent 的方法论、评估工具的使用效率、工具的正确性评估、以及如何平衡量化与质量指标。提供了选择合适评估指标和评分函数的策略,以及如何通过迭代评估过程来不断优化 AI 产品。同时,对述了 AI 产品经理在设定成功标准和评估指标方面的经验。此外还讨论了相关技术的最新进展,包括 RAG 技术的发展、AI 产品的改进挑战、以及不同公司和组织推出的 AI 相关工具和平台。

阅读更多

Vol.51 AI 智能体商业落地的现状与真相

论文:详细介绍了 PIKE-RAG、KG-HTC、Agent to User Interaction Protocol 等 AI 智能体技术。
工程:讨论了 AI 智能体在商业落地中面临的真实情况,以及 Agent to User Interaction Protocol 的优化。
产品:分析了 AI 产品如 Lovable、Cursor 等的设计原则,以及 AlphaEvolve 在算法设计和优化中的应用。
市场:探讨了 Agentic AI 在市场中的应用,包括微信生态系统中的 Agentic AI 布局,以及 AI 在广告、交易、GPU 租赁等方面的商业模式。
观点:总结了 2025 年关于 Agent 的发展和应用,包括 Agent 的技术挑战、工程实现、商业应用以以及 Agentic AI 在市场中的应用

阅读更多

Vol.49:大模型时代的表格数据挖掘

本期会员通讯中,我们主要关注了大模型在处理表格数据时的优势和面临的挑战。首先,介绍了表格数据的类型和特性,以及大模型处理表格数据的优势和面临的挑战。接着,探讨了 AI 辅助决策的新可能性,特别是在认知支持系统方面的重要性。然后,介绍了 Zep:A Temporal Knowledge Graph Architecture for Agent Memory 的论文,强调了其在动态知识整合方面的创新点。在工程方面,我们看到了 Anthropic 发布的 Claude Code 官方最佳实践指南,以及 OpenAI 发布的 GPT-image-1 的 API。此外,还有 Graphiti 在构建时间感知型知识图谱方面的应用。在产品方面,DeepWiki 等工具的推出,以及阶跃星辰的端到端语音大模型 Step-1o-Audio 的应用,都展示了 AI 技术的广泛应用。市市场方面,讨论了 Chatbot Arena 的公司化运营和融资计划,以及 AWS 和谷歌在提供 AI 模型服务时遇到的问题。最后,从观点中,我们了解到了数据处理和智能体(agents)在 AI 领域中的重要性,以及 Databricks 和 Anthropic 在这些领域中的合作关系。
阅读更多

Vol.48:AI 发展开始进入下半场

本期涉及论文、工程、产品和市场等多个方面的应用和发展。论文部分提到了多个研究成果,包括 LocAgent 用于代码错误定位、CrackSQL 用于 SQL 翻译、Seed-Thinking-v1.5 深度思考模型、以及关于大语言模型学习新知识时可能出现的 “启动效应” 等。这些研究成果都在不同程度上展现了 AI 技术在代码分析、SQL 翻译、模型训练和知识应用等方面的进步和挑战。MCP 安全检查清单、PocketFlow、cursor-rules、智谱开源的 GLM 模型、GPT-4.1 提示指南等工程项目和工具被提及,它们涉及了 AI 安全性、大型软件项目的代码本地化、LLM 应用的精简主义开发等多个方面。产品部分介绍了 Claude 高级 Research 功能、OpenAI 新发布的模型(GPT-4.1 系列)、PocketFlow 和 xAI Grok Studio 的新功能,以及微软 Edge 浏览器即将上线的 Copilot Vision 等产品的最新动态和发能。
阅读更多

Vol.47:workflow 与 Agent 方案如何选择?

本期详细讨论了 Web Agent 专题,包括 ReasonerAgent 的开源 Agent 方案,Browserbase 的 SaaS 服务,以及 browser-use 工具的开发进展。论 papers 方面,OmniTalker 框架和大语言模型自动规划能力的综述。工程部分介绍了 Meta ai 的 Llama 4 系列、AWS MCP 服务器的多功能解决方案、以及使用 LLM 时遇到的偏差问题及其缓解措施。产品部分提到了 Anthropic 的 Claude API、百炼的自定义 MCP 服务部署、腾讯云的 AI 开发套件,以及 GitHub 官方的 MCP 服务器开源。市场观点涉及了 AI 硬件公司 io Products 的收购、华为的智能眼镜产品发布,以及 AI 代理初创公司的市场分析。最后,讨论了在新场景构建时如何平衡拆分 workflow 与等待模型发展的需求。
阅读更多