会员计划说明

我要推出一个为期一年的会员计划,这篇文章我想从会员计划介绍、面向人群、会员权益、会员定价四个方面来介绍下,希望大家理性消费,务必先看权益部分的内容是否是自己未来一年内要聚焦和关注的,然后再看定价是否满足自己当前的消费能力。

阅读更多

Vol.52 面向 AI 产品的智能体评估指南

本期介绍了 AI 产品评估的全面指南,包括如何评估 Agent(代理)的性能,如何使用评估工具和平台,以及如何选择合适的评估指标和评分函数。详细介绍了评估 Agent 的方法论、评估工具的使用效率、工具的正确性评估、以及如何平衡量化与质量指标。提供了选择合适评估指标和评分函数的策略,以及如何通过迭代评估过程来不断优化 AI 产品。同时,对述了 AI 产品经理在设定成功标准和评估指标方面的经验。此外还讨论了相关技术的最新进展,包括 RAG 技术的发展、AI 产品的改进挑战、以及不同公司和组织推出的 AI 相关工具和平台。

阅读更多

Vol.51 AI 智能体商业落地的现状与真相

论文:详细介绍了 PIKE-RAG、KG-HTC、Agent to User Interaction Protocol 等 AI 智能体技术。
工程:讨论了 AI 智能体在商业落地中面临的真实情况,以及 Agent to User Interaction Protocol 的优化。
产品:分析了 AI 产品如 Lovable、Cursor 等的设计原则,以及 AlphaEvolve 在算法设计和优化中的应用。
市场:探讨了 Agentic AI 在市场中的应用,包括微信生态系统中的 Agentic AI 布局,以及 AI 在广告、交易、GPU 租赁等方面的商业模式。
观点:总结了 2025 年关于 Agent 的发展和应用,包括 Agent 的技术挑战、工程实现、商业应用以以及 Agentic AI 在市场中的应用

阅读更多

Vol.49:大模型时代的表格数据挖掘

本期会员通讯中,我们主要关注了大模型在处理表格数据时的优势和面临的挑战。首先,介绍了表格数据的类型和特性,以及大模型处理表格数据的优势和面临的挑战。接着,探讨了 AI 辅助决策的新可能性,特别是在认知支持系统方面的重要性。然后,介绍了 Zep:A Temporal Knowledge Graph Architecture for Agent Memory 的论文,强调了其在动态知识整合方面的创新点。在工程方面,我们看到了 Anthropic 发布的 Claude Code 官方最佳实践指南,以及 OpenAI 发布的 GPT-image-1 的 API。此外,还有 Graphiti 在构建时间感知型知识图谱方面的应用。在产品方面,DeepWiki 等工具的推出,以及阶跃星辰的端到端语音大模型 Step-1o-Audio 的应用,都展示了 AI 技术的广泛应用。市市场方面,讨论了 Chatbot Arena 的公司化运营和融资计划,以及 AWS 和谷歌在提供 AI 模型服务时遇到的问题。最后,从观点中,我们了解到了数据处理和智能体(agents)在 AI 领域中的重要性,以及 Databricks 和 Anthropic 在这些领域中的合作关系。
阅读更多

Vol.48:AI 发展开始进入下半场

本期涉及论文、工程、产品和市场等多个方面的应用和发展。论文部分提到了多个研究成果,包括 LocAgent 用于代码错误定位、CrackSQL 用于 SQL 翻译、Seed-Thinking-v1.5 深度思考模型、以及关于大语言模型学习新知识时可能出现的 “启动效应” 等。这些研究成果都在不同程度上展现了 AI 技术在代码分析、SQL 翻译、模型训练和知识应用等方面的进步和挑战。MCP 安全检查清单、PocketFlow、cursor-rules、智谱开源的 GLM 模型、GPT-4.1 提示指南等工程项目和工具被提及,它们涉及了 AI 安全性、大型软件项目的代码本地化、LLM 应用的精简主义开发等多个方面。产品部分介绍了 Claude 高级 Research 功能、OpenAI 新发布的模型(GPT-4.1 系列)、PocketFlow 和 xAI Grok Studio 的新功能,以及微软 Edge 浏览器即将上线的 Copilot Vision 等产品的最新动态和发能。
阅读更多

Vol.47:workflow 与 Agent 方案如何选择?

本期详细讨论了 Web Agent 专题,包括 ReasonerAgent 的开源 Agent 方案,Browserbase 的 SaaS 服务,以及 browser-use 工具的开发进展。论 papers 方面,OmniTalker 框架和大语言模型自动规划能力的综述。工程部分介绍了 Meta ai 的 Llama 4 系列、AWS MCP 服务器的多功能解决方案、以及使用 LLM 时遇到的偏差问题及其缓解措施。产品部分提到了 Anthropic 的 Claude API、百炼的自定义 MCP 服务部署、腾讯云的 AI 开发套件,以及 GitHub 官方的 MCP 服务器开源。市场观点涉及了 AI 硬件公司 io Products 的收购、华为的智能眼镜产品发布,以及 AI 代理初创公司的市场分析。最后,讨论了在新场景构建时如何平衡拆分 workflow 与等待模型发展的需求。
阅读更多