会员计划说明

我要推出一个为期一年的会员计划,这篇文章我想从会员计划介绍、面向人群、会员权益、会员定价四个方面来介绍下,希望大家理性消费,务必先看权益部分的内容是否是自己未来一年内要聚焦和关注的,然后再看定价是否满足自己当前的消费能力。

阅读更多

Vol.52 面向 AI 产品的智能体评估指南

本期介绍了 AI 产品评估的全面指南,包括如何评估 Agent(代理)的性能,如何使用评估工具和平台,以及如何选择合适的评估指标和评分函数。详细介绍了评估 Agent 的方法论、评估工具的使用效率、工具的正确性评估、以及如何平衡量化与质量指标。提供了选择合适评估指标和评分函数的策略,以及如何通过迭代评估过程来不断优化 AI 产品。同时,对述了 AI 产品经理在设定成功标准和评估指标方面的经验。此外还讨论了相关技术的最新进展,包括 RAG 技术的发展、AI 产品的改进挑战、以及不同公司和组织推出的 AI 相关工具和平台。

阅读更多

Vol.51 AI 智能体商业落地的现状与真相

论文:详细介绍了 PIKE-RAG、KG-HTC、Agent to User Interaction Protocol 等 AI 智能体技术。
工程:讨论了 AI 智能体在商业落地中面临的真实情况,以及 Agent to User Interaction Protocol 的优化。
产品:分析了 AI 产品如 Lovable、Cursor 等的设计原则,以及 AlphaEvolve 在算法设计和优化中的应用。
市场:探讨了 Agentic AI 在市场中的应用,包括微信生态系统中的 Agentic AI 布局,以及 AI 在广告、交易、GPU 租赁等方面的商业模式。
观点:总结了 2025 年关于 Agent 的发展和应用,包括 Agent 的技术挑战、工程实现、商业应用以以及 Agentic AI 在市场中的应用

阅读更多

Vol.49:大模型时代的表格数据挖掘

本期会员通讯中,我们主要关注了大模型在处理表格数据时的优势和面临的挑战。首先,介绍了表格数据的类型和特性,以及大模型处理表格数据的优势和面临的挑战。接着,探讨了 AI 辅助决策的新可能性,特别是在认知支持系统方面的重要性。然后,介绍了 Zep:A Temporal Knowledge Graph Architecture for Agent Memory 的论文,强调了其在动态知识整合方面的创新点。在工程方面,我们看到了 Anthropic 发布的 Claude Code 官方最佳实践指南,以及 OpenAI 发布的 GPT-image-1 的 API。此外,还有 Graphiti 在构建时间感知型知识图谱方面的应用。在产品方面,DeepWiki 等工具的推出,以及阶跃星辰的端到端语音大模型 Step-1o-Audio 的应用,都展示了 AI 技术的广泛应用。市市场方面,讨论了 Chatbot Arena 的公司化运营和融资计划,以及 AWS 和谷歌在提供 AI 模型服务时遇到的问题。最后,从观点中,我们了解到了数据处理和智能体(agents)在 AI 领域中的重要性,以及 Databricks 和 Anthropic 在这些领域中的合作关系。
阅读更多

Vol.48:AI 发展开始进入下半场

本期涉及论文、工程、产品和市场等多个方面的应用和发展。论文部分提到了多个研究成果,包括 LocAgent 用于代码错误定位、CrackSQL 用于 SQL 翻译、Seed-Thinking-v1.5 深度思考模型、以及关于大语言模型学习新知识时可能出现的 “启动效应” 等。这些研究成果都在不同程度上展现了 AI 技术在代码分析、SQL 翻译、模型训练和知识应用等方面的进步和挑战。MCP 安全检查清单、PocketFlow、cursor-rules、智谱开源的 GLM 模型、GPT-4.1 提示指南等工程项目和工具被提及,它们涉及了 AI 安全性、大型软件项目的代码本地化、LLM 应用的精简主义开发等多个方面。产品部分介绍了 Claude 高级 Research 功能、OpenAI 新发布的模型(GPT-4.1 系列)、PocketFlow 和 xAI Grok Studio 的新功能,以及微软 Edge 浏览器即将上线的 Copilot Vision 等产品的最新动态和发能。
阅读更多

Vol.47:workflow 与 Agent 方案如何选择?

本期详细讨论了 Web Agent 专题,包括 ReasonerAgent 的开源 Agent 方案,Browserbase 的 SaaS 服务,以及 browser-use 工具的开发进展。论 papers 方面,OmniTalker 框架和大语言模型自动规划能力的综述。工程部分介绍了 Meta ai 的 Llama 4 系列、AWS MCP 服务器的多功能解决方案、以及使用 LLM 时遇到的偏差问题及其缓解措施。产品部分提到了 Anthropic 的 Claude API、百炼的自定义 MCP 服务部署、腾讯云的 AI 开发套件,以及 GitHub 官方的 MCP 服务器开源。市场观点涉及了 AI 硬件公司 io Products 的收购、华为的智能眼镜产品发布,以及 AI 代理初创公司的市场分析。最后,讨论了在新场景构建时如何平衡拆分 workflow 与等待模型发展的需求。
阅读更多

Vol.46:智能体工具调用 API 与 GUI 的差异和融合

本期深入介绍了智能体工具调用的 API 与 GUI 的差异及融合策略,涉及多轮对话中的具调用能力优化、模型上下文协议(MCP)的研究、以及 MemInsight 方法提升 LLM Agent 记忆和认知能力的具体做法。同时,文章入探讨了 API 与 GUI 在交互模态、效率、可靠性、可用性、灵活性、安全性、可维护性、透明度和可解释性等方面的差异点,并分析了不同融合策略,如 API 包装器、统一编排工具和低代码 / 无代码解决方案的应用。此外,文章还展 ound 了 WebThinker 框架的系统结构和核心创新能力,以及 MegaTTS3 等产品的最新技术动态。最后,文章提供了市场动态,如 OpenAI 的融资情况等相关信息。
阅读更多

Vol.45:Anthropic MCP 当前还有哪些不足?

本期深入探讨了 Anthropic MCP 的最新进展、使用案例、挑战,以及对 AI 工具链和基础设施的潜在影响。文章包含了对 MCP 专题的详细讨论,包括最新更新、基于 OAuth 2.1 的身份验证框架、流式 HTTP 传输、JSON-RPC 批处理支持、工具注解等。此外,还涉及了 Cloudflare、Zapier 和 Microsoft Office 等平台对 MCP 的实施情况,以及 OpenAI、Cloudflare 和 AWS 对 MCP 服务器的支持。文章还包括了对 MCP 的商业应用,如 MCP Infra、MCP Marketplace 和 Agent OS,以及对 MCP 的全面系统分析。最后,提出了对 Anthropic MCP 当前状态的不足分析,并提供了对未来 Agent 发展方向的见解。
阅读更多

Vol.44:模型即产品的技术实现路径

本期内容介绍了如何通过技术手段将模型转化为产品包括模型的技术创新、价值链上移、应用层的自动化、投资者关注点的转移,以及模型作为基础设施的角色,强调了小型专业团队和大型实验室在新的 AI 产品和服务中的战略调整。
阅读更多