会员计划说明

我要推出一个为期一年的会员计划,这篇文章我想从会员计划介绍、面向人群、会员权益、会员定价四个方面来介绍下,希望大家理性消费,务必先看权益部分的内容是否是自己未来一年内要聚焦和关注的,然后再看定价是否满足自己当前的消费能力。

阅读更多

Vol.49:大模型时代的表格数据挖掘

本期会员通讯中,我们主要关注了大模型在处理表格数据时的优势和面临的挑战。首先,介绍了表格数据的类型和特性,以及大模型处理表格数据的优势和面临的挑战。接着,探讨了 AI 辅助决策的新可能性,特别是在认知支持系统方面的重要性。然后,介绍了 Zep:A Temporal Knowledge Graph Architecture for Agent Memory 的论文,强调了其在动态知识整合方面的创新点。在工程方面,我们看到了 Anthropic 发布的 Claude Code 官方最佳实践指南,以及 OpenAI 发布的 GPT-image-1 的 API。此外,还有 Graphiti 在构建时间感知型知识图谱方面的应用。在产品方面,DeepWiki 等工具的推出,以及阶跃星辰的端到端语音大模型 Step-1o-Audio 的应用,都展示了 AI 技术的广泛应用。市市场方面,讨论了 Chatbot Arena 的公司化运营和融资计划,以及 AWS 和谷歌在提供 AI 模型服务时遇到的问题。最后,从观点中,我们了解到了数据处理和智能体(agents)在 AI 领域中的重要性,以及 Databricks 和 Anthropic 在这些领域中的合作关系。
阅读更多

Vol.48:AI 发展开始进入下半场

本期涉及论文、工程、产品和市场等多个方面的应用和发展。论文部分提到了多个研究成果,包括 LocAgent 用于代码错误定位、CrackSQL 用于 SQL 翻译、Seed-Thinking-v1.5 深度思考模型、以及关于大语言模型学习新知识时可能出现的 “启动效应” 等。这些研究成果都在不同程度上展现了 AI 技术在代码分析、SQL 翻译、模型训练和知识应用等方面的进步和挑战。MCP 安全检查清单、PocketFlow、cursor-rules、智谱开源的 GLM 模型、GPT-4.1 提示指南等工程项目和工具被提及,它们涉及了 AI 安全性、大型软件项目的代码本地化、LLM 应用的精简主义开发等多个方面。产品部分介绍了 Claude 高级 Research 功能、OpenAI 新发布的模型(GPT-4.1 系列)、PocketFlow 和 xAI Grok Studio 的新功能,以及微软 Edge 浏览器即将上线的 Copilot Vision 等产品的最新动态和发能。
阅读更多

Vol.47:workflow 与 Agent 方案如何选择?

本期详细讨论了 Web Agent 专题,包括 ReasonerAgent 的开源 Agent 方案,Browserbase 的 SaaS 服务,以及 browser-use 工具的开发进展。论 papers 方面,OmniTalker 框架和大语言模型自动规划能力的综述。工程部分介绍了 Meta ai 的 Llama 4 系列、AWS MCP 服务器的多功能解决方案、以及使用 LLM 时遇到的偏差问题及其缓解措施。产品部分提到了 Anthropic 的 Claude API、百炼的自定义 MCP 服务部署、腾讯云的 AI 开发套件,以及 GitHub 官方的 MCP 服务器开源。市场观点涉及了 AI 硬件公司 io Products 的收购、华为的智能眼镜产品发布,以及 AI 代理初创公司的市场分析。最后,讨论了在新场景构建时如何平衡拆分 workflow 与等待模型发展的需求。
阅读更多

Vol.46:智能体工具调用 API 与 GUI 的差异和融合

本期深入介绍了智能体工具调用的 API 与 GUI 的差异及融合策略,涉及多轮对话中的具调用能力优化、模型上下文协议(MCP)的研究、以及 MemInsight 方法提升 LLM Agent 记忆和认知能力的具体做法。同时,文章入探讨了 API 与 GUI 在交互模态、效率、可靠性、可用性、灵活性、安全性、可维护性、透明度和可解释性等方面的差异点,并分析了不同融合策略,如 API 包装器、统一编排工具和低代码 / 无代码解决方案的应用。此外,文章还展 ound 了 WebThinker 框架的系统结构和核心创新能力,以及 MegaTTS3 等产品的最新技术动态。最后,文章提供了市场动态,如 OpenAI 的融资情况等相关信息。
阅读更多

Vol.45:Anthropic MCP 当前还有哪些不足?

本期深入探讨了 Anthropic MCP 的最新进展、使用案例、挑战,以及对 AI 工具链和基础设施的潜在影响。文章包含了对 MCP 专题的详细讨论,包括最新更新、基于 OAuth 2.1 的身份验证框架、流式 HTTP 传输、JSON-RPC 批处理支持、工具注解等。此外,还涉及了 Cloudflare、Zapier 和 Microsoft Office 等平台对 MCP 的实施情况,以及 OpenAI、Cloudflare 和 AWS 对 MCP 服务器的支持。文章还包括了对 MCP 的商业应用,如 MCP Infra、MCP Marketplace 和 Agent OS,以及对 MCP 的全面系统分析。最后,提出了对 Anthropic MCP 当前状态的不足分析,并提供了对未来 Agent 发展方向的见解。
阅读更多

Vol.44:模型即产品的技术实现路径

本期内容介绍了如何通过技术手段将模型转化为产品包括模型的技术创新、价值链上移、应用层的自动化、投资者关注点的转移,以及模型作为基础设施的角色,强调了小型专业团队和大型实验室在新的 AI 产品和服务中的战略调整。
阅读更多

Vol.43 什么样的 Agent 会在 2025 年脱颖而出?

本期内容通过论文、工程、产品和市场四个部分, 内容涵盖了 AI 代理技术的最新研究成果,包括 LaRA、CodeAct、ViDoRAG 和 Visual-RFT 等论文,这些研究探讨了如何通过 RAG 与长文本语言模型、代码执行能力、视觉文档检索增强生成以及视觉强化微调等技术手段提升 AI 代理的性能和应用范围。在工程方面,介绍了如何使用 Cursor 和 Claude AI 工具高效管理和维护大型项目,以及谷歌发布的新的文本嵌入模型 gemini-embedding-exp-03-07。此外,还讨论了 MCP 的实用性和潜力、Manus 的开源项目 OpenManus 和 OWL 技术实现,以及 OpenAI 发布的 Agents SDK。产品部分,推荐了 Meta FAIR AI Demos 和 Google Labs,介绍了 Google 的 Gemma 3 系列模型和 Gemini 2.0 Flash,Cloudflare Media Transformations 功能,以及 Product Hunt 上的最佳产品。市场方面,提到了 OpenAI 与 CoreWeave 的合作协议,SSI 通过再融资达到 300 亿美元估值,以及 AI 代理定义的模糊性和行业应用。最后,网页提供了 Cartesia 创始人的访谈和对未来 25 年 AI 代理发展趋势的预测。
阅读更多

Vol.42:AI Agent 如何颠覆传统的外包行业?

本期内容通过论文、工程、产品和市场四个部分,论文部分包括多模态大模型在富文本图像理解上的研究、金融信息搜索框架 FinSearch 的开发、代码与推理的双向赋能关系、以及大型语言模型在推理能力上的提升策略。工程部分介绍了阿里云 QwQ-32B 模型的开源、腾讯混元的图生视频模型、开源的 AI 写作软件 refly 等。产品部分提及了 Gamma APP 的功能更新、MiniMax 的图像生成模型 Image-01、Stability AI 与 Arm 的合作、谷歌 Gemini AI 的新功能、Vidu API 平台的开放以及 PH 平台上的十大产品。市场部分分析了智谱的战略融资、ChatGPT 的用户增长趋势、亚马逊 AI Agent 团队的成立、以及 A16z 的 TOP100 AI 榜单。观点部分详细讨论了 AI Agent 如何改变商业流程外包行业,以及语义搜索产品 ExaAI 如何通过 Neural PageRank 算法改进搜索引擎。
阅读更多

Vol.41:DeepSeek R1爆火之后,到底什么任务适合用 RL 做?

本期内容通过论文、工程、产品和市场四个部分, 论文介绍了一系列论文,包括 RAG 系统中上下文大小和模型选择的影响、如何通过代码输入输出预测(CODE I/O)来增强大型语言模型(LLMs)的推理能力、揭秘 LLMs 中的长链思维推理(CoT)、以及从 RAG 到记忆的进化等研究成果。工程部分详述了 DeepSeek 开源周的工程进展,如 FlashMLA、DeepEP、DeepGEMM 等技术的并探讨了开源 AI 的协作机制和法律意义。此外,介绍了多个 AI 模型的开源,包括 Moonlight-16B-A3B、Microsoft 的 Phi-4-Mini 和 Phi-4-Multimodal、通义万相 Wan2.1 视频模型等。Hugging Face 的 FastRTC 库也被提及,用于简化实时音视频 AI 应用的开发。在产品部分,文章讨论了秘塔 AI 的「先想后搜」Research 模式,腾讯混元的快思考模型 Turbo S,以及阿里云推出的推理大模型 QwQ-Max-Preview 等。OpenAI 发布的 GPT-4.5 和 ChatGPT Deep Research 功能的开放,以及 Anthropic 推出的 Claude 3.7 Sonnet 模型,都表明了 AI 产品在推理和创造性任务上的进步。ElevenLabs 发布的独立语音检测模型 Scribe,以及 Product Hunt 上的最佳产品,如 Tanka、Musa、Webdraw Beta 等,展示了 AI 技术在团队沟通、自我护理、API 开发等多个领域的应用。市场动态方面,LiblibAI 完成了新一轮融资,重点投入创作者生态建设与技术研发,Anthropic 公司即将完成一轮 35 亿美元的融资,估值达到 615 亿美元。百度和字节跳动也在积极跟进 AI 模型的迭代和优化。最后,文章提供了一些观点,包括 AI 技术对企业管理和组织结构的影响,以及如何在 AI 时代中保持竞争力和创造价值。
阅读更多