别再用智能体忽悠用户了,应用场景化才是大模型落地的关键

这是一篇吐槽文,缘于今天详细体验一款低代码的大模型应用开发工具,没想到设计的真不错,但是一搜相关介绍,看到官方 PR 稿和自媒体广告文铺天盖地都在夸的是什么智能体,什么 AI 原生应用,就是不讲能解决哪些实实在在的问题,支持的实际场景。所以本篇想聊聊「智能体平台」的话题,先叠个甲,这些产品并不是一无是处,毫无疑问确实是方便用户快速用上大模型的能力,也提升了工作效率和生活体验,但这里面噱头大于实际,其中忽悠的内容太多了,本文不会出现具体的产品:)

智能体是个伪概念

我一直反感这类所谓的智能体平台,因为它们声称的成千上万的智能体没一个符合 Agent 的定义,下面这段话是摘录自百度百科:

智能体(Agent)是指能够感知环境并采取行动以实现特定目标的代理体。 它可以是软件、硬件或一个系统,具备自主性、适应性和交互能力。 智能体通过感知环境中的变化(如通过传感器或数据输入),根据自身学习到的知识和算法进行判断和决策,进而执行动作以影响环境或达到预定的目标。

下面这张图是之前参加某大厂智能体平台内测时让填的问卷,这就是他们认为的智能体,也基本能够代表这帮大忽悠对智能体的理解了,不管是为了忽悠自己的 +1 要资源,还是忽悠投资人,你看,我现在加点提示词套个壳,就变成了智能体。
虚假的智能体

当然还有蹭代理工作流(Agentic Workflow) 热点,憋着劲推出工作流功能的,但就以对 Agent 的理解水平,搞的所谓工作流最多就是套了几层提示词,就讲自己是在搞 Flow Engineering,你要不要再读读论文《Code Generation with AlphaCodium: From Prompt Engineering to Flow Engineering》。

工作流是在新瓶装旧酒

现在这些平台宣传的工作流依旧是传统工作流的路子,只是用大模型替代了各个环节的传统机器学习模型,但没有充分利用大模型的推理能力,这是代理工作流的核心优势所在。下面是麦肯锡2017 年发布关于智能流程自动化(IPA,Intelligent Process Automation)的一篇分析文章

本质上,IPA 是“将人的机器属性剥离”。IPA 模仿人类进行的活动,随着时间的推移,通过学习来做得更好。由于深度学习和认知技术的快速发展,传统的基于规则的自动化已经有了制定决策的能力。IPA 有下面五个核心技术:

  1. 机器人流程自动化(RPA,Robotic process automation):通过模拟人类操作来自动化日常任务,如数据提取和清洗。
  2. 智能工作流(smart workflow):集成人类和机器执行的任务,管理端到端流程,提供实时跟踪和统计数据。
  3. 机器学习/高级分析:通过监督和非监督学习算法,识别结构化数据中的模式,用于提高合规性、降低成本结构和获得新的洞察。
  4. 自然语言生成(NLG, natural-language generation):将数据观察结果转换为文字,实现人与技术之间的无缝交互。
  5. 认知智能体(cognitive agents):结合机器学习和自然语言生成技术,创建一个完全虚拟的工作力量,能够执行任务、沟通、从数据集中学习并基于情感检测做出决策。

IPA 通过整合多种技术实现业务流程自动化,不仅能够处理重复性任务,还能通过持续学习和进化应对复杂场景,构建出高度适应性的自动化方案。代理工作流指的是由(一个或多个)Agent 协调的一系列操作,以实现特定目标或自主完成任务。与需要大量规则干预的传统工作流相比,代理工作流通过 Agent 处理数据、做出决策并独立执行操作。虽然目的都是通过自动化任务和流程提升效率,以最小的人工干预实现特定目标,但二者在模式上存在本质区别:传统工作流采用的是“机器辅助人”的模式,规则由人类设定;而代理工作流则采取“人辅助机器”的模式,在机器无法做出决策时才需要人工介入。

实质是基于 API 的自动化平台

为了展示强大的工作流构建能力,这类工具逐渐集成了众多第三方插件,发展成为以 AI 为核心卖点的 API 自动化平台,还是低代码那一套。你都叫 AI 工作流了,为啥不能直接根据用户的意图描述生成初版的 DSL(低代码工作流的本质是 DSL 图形化),每次都要从头拖拽。与现有的 iPaaS 平台相比,支持的插件数量又较少,尤其是能够连接实际使用的企业软件的插件更为稀缺。国内的腾讯轻联、集简云,以及国外上的 Zapier、IFTTT,还有开源且免费的 n8n(专门推出了 AI 功能)等 iPaaS 平台已经可以显著降低用户打通不同应用数据的门槛,也能实现流程自动化,其效果往往也比这些新工具好。

某iPaas平台

如果已经在深度使用类似 iPaas 工具,并且它们已经集成了 AI 功能(这么 FOMO,大概率已经集成了),则暂时无需考虑迁移,AI 应用的关键在于数据,无论是结构化还是非结构化数据,都已沉淀在各类企业软件中,为了使用这些新工具,你需要将原有的数据导出并上传至新的平台,以建立知识库和自动化流程,这是主动又搞出一个新的数据孤岛。当然,你之前没用过这类工具,那你可以选“智能体平台”,毕竟它们还有一个 AI 知识库问答能力。

AI 知识库问答远远不够

这类工具声称的一个主要优点是其基于 RAG 技术的知识库问答功能,能与企业常用的应用程序和文档存储库对接,整合分散的数据和内容孤岛,提供统一的知识搜索体验。即使不考虑连接器支持的丰富度问题,这些工具的功能仍主要局限于搜索和基于企业数据的信息检索、摘要生成和内容创建,而很少有进一步的扩展。对于知识库问答的应用,其目的不仅限于获取知识,还应服务于企业的营销、运营和培训等需求。宣传中提到可用于公文写作、小红书风格模仿、材料审查(如对外宣传材料审核、合同审核)等,但实际上,要实现这些高级功能,用户还需自行编写提示词,我以为我的企业文档都全量喂给你了,你自己可以学到符合品牌调性的内容风格、满足企业规章的审核标准和适应公司特有的表达方式。

写在最后

并非所有此类工具都存在上述问题,有些工具的工作流设计得非常好,能够提供良好的开发者体验,但过于强调 AI 和智能体,忽略了具体场景的需求,宣传方向出现偏差,可能误导用户。

别再用智能体忽悠用户了,应用场景化才是大模型落地的关键

https://liduos.com/why-ai-agent-hype-fails-scenario-based-llm-implementation.html

作者

莫尔索

发布于

2024-12-18

更新于

2024-12-28

许可协议

评论