自从玩了 OpenClaw 和 Hermes Agent 这种「自主 Agent」,就很少碰 Dify 了。最近升级到 v1.14.2,发现插件生态已经可以让 Dify 通过外挂方式做到很多以前想都不敢想的事。
先分清楚两个阵营
聊之前先把概念理清,不然容易混为一谈。
OpenClaw / Hermes Agent 是一类——自主 Agent 平台。它们的核心能力是让 Agent「活」起来:
- Agent 能自主写代码、跑脚本、读文件
- 有长期记忆系统,跨 session 记住用户
- 原生支持多平台通讯(TG / 微信 / 飞书)
- 通过 Gateway 架构做统一的消息路由和会话管理
- 高度灵活,但上手门槛也高
Dify 是另一类——低代码 AI 编排平台。它的核心能力是让你用拖拽的方式:
- 搭工作流、设计 Agent 行为
- 管理知识库和 RAG
- 做企业级的权限、审计、HITL
- 最近更是通过插件市场和MCP 支持,把能力边界大幅扩展
两者不是替代关系,而是互补关系。但有意思的是,Dify 正在通过插件生态,悄悄「吃掉」OpenClaw 的一部分领地。
一、Dify v1.14.2:不再是「纯低代码」了
上一次用 Dify 还是 v1.11,那时候的功能中规中矩——拖工作流、建知识库、调 API,做得不错但没什么惊喜。这次升级到 v1.14.2,核心变化有三个:
1. 插件市场正式上线
这是最炸裂的更新。Dify 不再只是「画布上画画」了。
以前你要扩展 Dify 的能力,得自己写扩展代码、改代码库、重新部署。现在在插件市场里点一下安装,能力就「挂载」上去了。
而且插件的玩法不仅限于工具——已经有插件能做到:
- 自带记忆系统(MemOS)
- 技能管理和自由代码执行(Mini_Claw)
- 桥接到外部 Agent 引擎(OpenClaw Chat / Hermes Agent Chat)
2. Agent 设计器 + 工作流深度融合
Dify 的 Agent 不再是「一个对话窗口」那么简单了:
- 每个 Agent 可单独配置工具的调用策略(同时/顺序)
- Agent 回复可追踪来源,引用知识库原文
- 记忆窗口可精确控制上下文轮次和 Token
- Agent 节点可以嵌入到工作流中,跟代码节点、条件分支、并行节点组合使用
3. MCP 协议支持
Dify 可以直接接入任何 MCP 协议的服务器,工具元数据自动注册、自动刷新。这意味着 Dify 可以用社区里所有 MCP 兼容的工具。
二、OpenClaw / Hermes 的核心能力,Dify 通过插件能做到多少?
做一个清晰的对位:
🧠 长期记忆
| 方案 | 原理 |
|---|---|
| OpenClaw / Hermes | Memory 系统原生支持,Agent 自动读写持久化存储 |
| Dify 原生 | 对话变量 + 知识库(RAG),属于「手动配置」式记忆 |
| Dify + MemOS 插件 | 连接 MemOS 云服务,通过 addMessage/searchMemory 两个 API 实现自动的记忆存取,跨 session、跨应用 |
结论:Dify 原生不做长期记忆,但挂上 MemOS 插件后能补上这个能力。不过 MemOS 是云服务,不像 OpenClaw 那样可以完全自托管。
🛠 工具调用
| 方案 | 范围 |
|---|---|
| OpenClaw / Hermes | 内置大量工具 + 可动态执行任意代码,自由度最高 |
| Dify 原生 | 内置工具(搜索、计算器、API 调用等),数量有限 |
| Dify + 插件市场 | 搜索、RSS、邮件、数据库、代码执行……第三方插件正在快速扩充 |
| Dify + MCP | 接入任何 MCP 协议的服务器,工具自动发现 |
结论:Dify 通过插件 + MCP 的组合,工具生态正快速逼近 OpenClaw 的丰富度。
🗂 Skill 机制
| 方案 | 实现 |
|---|---|
| OpenClaw | Skill 目录 + 渐进式发现,Agent 按需加载能力包 |
| Dify + Mini_Claw | 完全复刻了 OpenClaw 的 Skill 机制——Skill 目录 → 读取技能手册 → 执行脚本 → 返回结果 |
Mini_Claw 的插件页面写得很清楚:「本版本兼容 OpenClaw 的 Skill 目录结构」。你为 OpenClaw 写的 Skill,可以直接拿到 Dify+Mini_Claw 里用。
🔗 多平台通讯
| 方案 | 实现 |
|---|---|
| OpenClaw / Hermes | Gateway 原生架构,一条连接同时跑 TG / 微信 / 飞书 / Discord |
| Dify 原生 | 只有 Web UI 和 API |
| Dify + OpenClaw Chat | 在 Dify 工作流中调用 OpenClaw Gateway,把 Dify 当「前端编排层」 |
三、最大的差距:自主执行 vs 编排执行
把 Dify 插件装得再多,有一个差距是本质性的,永远不会被插件抹平:
OpenClaw / Hermes:Agent 是「活的」

OpenClaw / Hermes Agent 自主执行流程:Agent 接收任务后自主决策,可写代码、查资料、操作文件、执行命令,不受预设节点限制。
Agent 拿到任务后可以做任何事——写代码、跑脚本、上网查资料、操作 Git、甚至生成图片。它不受预设节点限制,有完整的自主决策权。
Dify:Agent 是「编好的」

Dify 工作流编排:用户输入进入画布,按预设节点(LLM / 代码 / 工具 / 条件分支)执行,只能做编排者安排好的事。
Agent 只能执行你在画布上安排好的节点。如果没加「搜索」节点,它就不会去搜。如果没加「代码节点」,它就不能写代码。自由度完全由编排者预先决定。
说人话版
- OpenClaw / Hermes:你雇了一个自由职业者,告诉他「搞定这个」,他自己想办法
- Dify:你画了一张流程图,告诉他「按这个步骤走」
两者没有谁绝对好,取决于你想让 Agent 做「按部就班的活」还是「需要自己动脑子的活」。
四、插件市场的宝藏
以下四个插件,是从「纯低代码编排」到「接近自主 Agent」的关键桥梁:
🦞 Mini_Claw(安装量 5000+)
作者:lfenghx · 版本:1.2.0 · 工具插件
Dify 插件市场里最具份量的一个。它直接在 Dify 里复刻了一套接近 OpenClaw 的体验:
- 短期/长期记忆:跨对话持久化,越用越懂你
- 身份/人格/灵魂设定:不只是「回答问题」,还有角色感
- Skill 渐进式发现机制:把插件目录当工具箱,Agent 先查技能索引,再按需读取和运行
- 自由执行:Agent 可以读写文件、运行脚本,不局限于预设节点
- 技能 CRUD:支持查看/添加/删除技能,以及依赖检测和自动安装
- 兼容 OpenClaw 的 Skill 目录结构
说白了,Mini_Claw 是在 Dify 的插件框架里,重新实现了一遍 OpenClaw 的核心机制。
🔄 OpenClaw Chat(安装量 689)
作者:sawyer-shi · 版本:0.0.1 · 工具插件
这个插件的定位很微妙——它不是替代 OpenClaw,而是把 Dify 和 OpenClaw 连在一起。
通过 OpenClaw Gateway 的 OpenResponses HTTP API,Dify 可以把消息发给 OpenClaw,让 OpenClaw 的 Agent 处理,然后拿回结果。
两种上下文策略:
- 会话级:每个 Dify 会话保持独立的 OpenClaw 上下文
- 用户级:同个用户在多个 Dify 会话间共享一个 OpenClaw 上下文
支持:文本、上传的图片/文档(base64 转发)、图片/文档 URL。
适用场景:你已经在用 OpenClaw,但想借 Dify 的工作流编辑器 + 知识库给它做前端编排层,或者想用 Dify 的 HITL 功能做人工审核节点。
🧞 Hermes Agent Chat(安装量 409)
作者:sawyer-shi · 版本:0.0.1 · 工具插件
OpenClaw Chat 的「亲兄弟」,但连接的是 Hermes Agent API Server。
跟 OpenClaw Chat 相比,区别在于:
- 连接的是 Hermes 的 OpenAI 兼容 API(Responses API),而非 OpenClaw Gateway
- 目前只支持图片上传(不支持文档),也不支持远程 URL——安全性方面更保守
- 同样支持会话级和用户级上下文保持
适用场景:你跑的是 Hermes Agent,想让它出现在 Dify 的界面里,或把 Dify 的编排能力「嫁接」到 Hermes 上。
🧠 MemOS(安装量 389)
作者:memtensor · 版本:0.0.4 · 工具插件
如果说 Mini_Claw 解决的是「像 OpenClaw 一样跑 Agent」,那 MemOS 解决的是「像 OpenClaw 一样记住用户」。
两个核心操作:
- addMessage:把原始对话丢给它,自动处理和存储记忆
- searchMemory:在后续对话中检索相关记忆,让回复更贴近用户
在 Dify 工作流中可以这样组合:
- 「聊天 → addMessage 存储 → searchMemory 检索 → LLM 节点生成回复」——形成记忆闭环
- 也可以把 MemOS 节点放在条件分支里,只在特定场景下读写记忆
MemOS 是独立云服务,不限于 Dify——任何 AI 应用都可以通过 API 接入。
五、Dify 做编排 + OpenClaw/Hermes 做核心 ≈ 最佳组合
绕了一大圈,我最终得出的结论不是「谁替代谁」,而是:

三层架构:用户触点(微信/TG/Web)→ Dify 编排调度层(工作流/知识库/插件)→ OpenClaw/Hermes 核心执行层(自主 Agent/Skills)
什么时候该用什么
| 场景 | 推荐方案 | 理由 |
|---|---|---|
| 固定流程问答(客服、FAQ、审批) | Dify 独立运行 | 编排清晰,HITL 合规,非技术团队也能维护 |
| 需要 Agent 自主写代码、跑脚本 | OpenClaw / Hermes | 自主执行是自主 Agent 类平台的不可替代优势 |
| 知识库+RAG+问答系统 | Dify 独立运行 | 内置知识库系统,一套搞定 |
| 企业级生产环境,需要权限管控 | Dify 优先 | 租户、凭证范围、审计日志都内置了 |
| 需要多平台通讯(TG+微信+飞书) | OpenClaw / Hermes | Gateway 原生支持,Dify 靠插件桥接比较勉强 |
| 既要 Agent 能力又要可视化编排 | Dify + OpenClaw Chat 插件 | Dify 做前端编排,OpenClaw 做核心执行 |
| 想低成本体验「类 OpenClaw」 | Dify + Mini_Claw 插件 | 一个插件就够了,不用自搭 OpenClaw 环境 |
| 需要跨 session 长期记忆 | Dify + MemOS 插件 或 OpenClaw | 根据是否需要自托管选择 |
我在用的组合
Claw Master 项目目前是:
- Dify:管知识库、管前端交互界面、管工作流编排
- OpenClaw:管 Agent 核心执行(写代码、调文件、跑脚本)
- Hermes Agent:管跨平台通讯和核心自主推理
- OpenClaw Chat 插件:把 Dify 和 OpenClaw 串起来
三个平台各管各的擅长领域,中间用插件和 API 连接。
六、写在最后
Dify 从 v1.14 开始的插件化转型,是一个重要的方向信号——低代码平台通过插件生态,正在打破「只能编排不能自主」的边界。
Mini_Claw 的 5000+ 安装量说明了一件事:很多人都想在低代码平台上获得自主 Agent 的体验。而兼容 OpenClaw Skill 结构这一点,更是表明社区已经在主动打通两个阵营。
不过也要清醒看到:插件可以模拟、可以桥接、可以扩展,但改变不了 Dify 的底层设计哲学——它是编排平台,不是自主 Agent 引擎。你可以在 Dify 里装一百个插件,Agent 都不会自己决定去搜一个你忘了加搜索节点的信息。
反过来也一样:OpenClaw 再强大,也不会长出 Dify 那样的可视化工作流编辑器。
所以最好的问题是:你的场景需要 Agent 自由发挥,还是按部就班?
前者选 OpenClaw / Hermes,后者选 Dify。两者都要,就用插件把它们粘起来。
🦞 注:文章标题的「龙虾」取自 OpenClaw 的 Claw(螯足/爪子)。Mini_Claw 的「小龙虾」也是同一个梗。
写于 2026-05-20 · Dify v1.14.2 / OpenClaw 2026.4.21 / Hermes Agent Latest