会员计划说明

我要推出一个为期一年的会员计划,这篇文章我想从会员计划介绍、面向人群、会员权益、会员定价四个方面来介绍下,希望大家理性消费,务必先看权益部分的内容是否是自己未来一年内要聚焦和关注的,然后再看定价是否满足自己当前的消费能力。

阅读更多

Vol.48:AI 发展开始进入下半场

本期涉及论文、工程、产品和市场等多个方面的应用和发展。论文部分提到了多个研究成果,包括 LocAgent 用于代码错误定位、CrackSQL 用于 SQL 翻译、Seed-Thinking-v1.5 深度思考模型、以及关于大语言模型学习新知识时可能出现的 “启动效应” 等。这些研究成果都在不同程度上展现了 AI 技术在代码分析、SQL 翻译、模型训练和知识应用等方面的进步和挑战。MCP 安全检查清单、PocketFlow、cursor-rules、智谱开源的 GLM 模型、GPT-4.1 提示指南等工程项目和工具被提及,它们涉及了 AI 安全性、大型软件项目的代码本地化、LLM 应用的精简主义开发等多个方面。产品部分介绍了 Claude 高级 Research 功能、OpenAI 新发布的模型(GPT-4.1 系列)、PocketFlow 和 xAI Grok Studio 的新功能,以及微软 Edge 浏览器即将上线的 Copilot Vision 等产品的最新动态和发能。
阅读更多

Vol.47:workflow 与 Agent 方案如何选择?

本期详细讨论了 Web Agent 专题,包括 ReasonerAgent 的开源 Agent 方案,Browserbase 的 SaaS 服务,以及 browser-use 工具的开发进展。论 papers 方面,OmniTalker 框架和大语言模型自动规划能力的综述。工程部分介绍了 Meta ai 的 Llama 4 系列、AWS MCP 服务器的多功能解决方案、以及使用 LLM 时遇到的偏差问题及其缓解措施。产品部分提到了 Anthropic 的 Claude API、百炼的自定义 MCP 服务部署、腾讯云的 AI 开发套件,以及 GitHub 官方的 MCP 服务器开源。市场观点涉及了 AI 硬件公司 io Products 的收购、华为的智能眼镜产品发布,以及 AI 代理初创公司的市场分析。最后,讨论了在新场景构建时如何平衡拆分 workflow 与等待模型发展的需求。
阅读更多

做自己的互联网房东,而不是租客:拥有你的数字内容与主权(译)

本篇内容译自《Be A Property Owner And Not A Renter On The Internet》,特别是在 AI 内容泛滥的当下,个人更加需要自己表达的根据地。

时间来到 2025 年。我们自 21 世纪初所熟知的那个互联网形态已不复存在。或者说,不完全是我们以前见过的那个样子了。这并非简单的怀旧情绪作祟 —— 那个由博客、feeds、个人网站和论坛组成的充满活力的生态系统,已被少数几个超级集中的巨头所取代。
想找一个关于非常小众主题的活跃社区?它很可能在 Reddit 上。或者你知道吗 —— 也可能在 Discord 上。或者两者皆有。虽然仍有一些人偶尔运营着基于 phpBB 的 VBulletin 论坛,但这已是少数。想买卖东西?你最好的选择是看看 Facebook 的 Marketplace(当然,要通过 Facebook 的 Messenger 来协调购买事宜,而不是邮件或其他方式)。想看一些你喜欢的创作者的视频?要么 YouTube,要么没戏。在这些企业集团的生态系统之外的任何东西,都注定自然会获得较少的曝光度,并且对于广大用户来说,其可发现性将极其低下

我们已经到了这样一个地步:对相当一部分人来说,“互联网”就等同于“Facebook、Instagram 和 Discord”,如果内容不在这些平台上,那它就跟不存在没两样。这种转变带来了一系列问题,我们将在这篇文章中进一步探讨。

我还应该在这篇文章开头加上一个免责声明 —— 本文的目标受众是精通技术的人。对于绝大多数人来说,我接下来要讨论的建议在当前的技术环境下是行不通的,这没关系。我的目的不是让每一个人都在流行网络之外建立自己的内容,而是鼓励那些犹豫不决且有能力迈出这一步的人,去拥有自己的互联网资产,而不是向那些对你的成功并不关心的人租用空间

阅读更多

对话 MCP 团队:MCP 的起源、技术细节与设计思路、与 Agent 的关系及未来迭代方向

上一篇文章《MCP 的应用场景,其实是一个巨大的赚钱机会》 发出后,后台接到很多读者留言,询问能否写一篇文章再详细介绍下 MCP 设计细节,本来想动笔,不过凑巧的是,搜索过程中发现 AI Engineer 频道刚好在上周五(4 月 4 日,新鲜热乎的 🤙)采访了MCP 团队的两位发起工程师 ,基本涉及到了 MCP 的方方面面。本篇内容是访谈的脱水版文字稿,移除了和 MCP 无关的话题和口头表达时的语癖,基本能够解答大家对 MCP 的起源、技术细节与设计思路、与 Agent 的关系及未来迭代方向的疑问,也比大多数能读到的二手内容权威多了。

阅读更多

Vol.46:智能体工具调用 API 与 GUI 的差异和融合

本期深入介绍了智能体工具调用的 API 与 GUI 的差异及融合策略,涉及多轮对话中的具调用能力优化、模型上下文协议(MCP)的研究、以及 MemInsight 方法提升 LLM Agent 记忆和认知能力的具体做法。同时,文章入探讨了 API 与 GUI 在交互模态、效率、可靠性、可用性、灵活性、安全性、可维护性、透明度和可解释性等方面的差异点,并分析了不同融合策略,如 API 包装器、统一编排工具和低代码 / 无代码解决方案的应用。此外,文章还展 ound 了 WebThinker 框架的系统结构和核心创新能力,以及 MegaTTS3 等产品的最新技术动态。最后,文章提供了市场动态,如 OpenAI 的融资情况等相关信息。
阅读更多