用 Dify 手搓一个更强大的「龙虾」

自从玩了 OpenClaw 和 Hermes Agent 这种「自主 Agent」，就很少碰 Dify 了。最近升级到 v1.14.2，发现插件生态已经可以让 Dify 通过外挂方式做到很多以前想都不敢想的事。

先分清楚两个阵营

聊之前先把概念理清，不然容易混为一谈。

OpenClaw / Hermes Agent 是一类——自主 Agent 平台。它们的核心能力是让 Agent「活」起来：

Agent 能自主写代码、跑脚本、读文件
有长期记忆系统，跨 session 记住用户
原生支持多平台通讯（TG / 微信 / 飞书）
通过 Gateway 架构做统一的消息路由和会话管理
高度灵活，但上手门槛也高

Dify 是另一类——低代码 AI 编排平台。它的核心能力是让你用拖拽的方式：

搭工作流、设计 Agent 行为
管理知识库和 RAG
做企业级的权限、审计、HITL
最近更是通过插件市场和MCP 支持，把能力边界大幅扩展

两者不是替代关系，而是互补关系。但有意思的是，Dify 正在通过插件生态，悄悄「吃掉」OpenClaw 的一部分领地。

一、Dify v1.14.2：不再是「纯低代码」了

上一次用 Dify 还是 v1.11，那时候的功能中规中矩——拖工作流、建知识库、调 API，做得不错但没什么惊喜。这次升级到 v1.14.2，核心变化有三个：

1. 插件市场正式上线

这是最炸裂的更新。Dify 不再只是「画布上画画」了。

以前你要扩展 Dify 的能力，得自己写扩展代码、改代码库、重新部署。现在在插件市场里点一下安装，能力就「挂载」上去了。

而且插件的玩法不仅限于工具——已经有插件能做到：

自带记忆系统（MemOS）
技能管理和自由代码执行（Mini_Claw）
桥接到外部 Agent 引擎（OpenClaw Chat / Hermes Agent Chat）

2. Agent 设计器 + 工作流深度融合

Dify 的 Agent 不再是「一个对话窗口」那么简单了：

每个 Agent 可单独配置工具的调用策略（同时/顺序）
Agent 回复可追踪来源，引用知识库原文
记忆窗口可精确控制上下文轮次和 Token
Agent 节点可以嵌入到工作流中，跟代码节点、条件分支、并行节点组合使用

3. MCP 协议支持

Dify 可以直接接入任何 MCP 协议的服务器，工具元数据自动注册、自动刷新。这意味着 Dify 可以用社区里所有 MCP 兼容的工具。

二、OpenClaw / Hermes 的核心能力，Dify 通过插件能做到多少？

做一个清晰的对位：

🧠 长期记忆

方案	原理
OpenClaw / Hermes	Memory 系统原生支持，Agent 自动读写持久化存储
Dify 原生	对话变量 + 知识库（RAG），属于「手动配置」式记忆
Dify + MemOS 插件	连接 MemOS 云服务，通过 `addMessage`/`searchMemory` 两个 API 实现自动的记忆存取，跨 session、跨应用

结论：Dify 原生不做长期记忆，但挂上 MemOS 插件后能补上这个能力。不过 MemOS 是云服务，不像 OpenClaw 那样可以完全自托管。

🛠 工具调用

方案	范围
OpenClaw / Hermes	内置大量工具 + 可动态执行任意代码，自由度最高
Dify 原生	内置工具（搜索、计算器、API 调用等），数量有限
Dify + 插件市场	搜索、RSS、邮件、数据库、代码执行……第三方插件正在快速扩充
Dify + MCP	接入任何 MCP 协议的服务器，工具自动发现

结论：Dify 通过插件 + MCP 的组合，工具生态正快速逼近 OpenClaw 的丰富度。

🗂 Skill 机制

方案	实现
OpenClaw	Skill 目录 + 渐进式发现，Agent 按需加载能力包
Dify + Mini_Claw	完全复刻了 OpenClaw 的 Skill 机制——Skill 目录 → 读取技能手册 → 执行脚本 → 返回结果

Mini_Claw 的插件页面写得很清楚：「本版本兼容 OpenClaw 的 Skill 目录结构」。你为 OpenClaw 写的 Skill，可以直接拿到 Dify+Mini_Claw 里用。

🔗 多平台通讯

方案	实现
OpenClaw / Hermes	Gateway 原生架构，一条连接同时跑 TG / 微信 / 飞书 / Discord
Dify 原生	只有 Web UI 和 API
Dify + OpenClaw Chat	在 Dify 工作流中调用 OpenClaw Gateway，把 Dify 当「前端编排层」

三、最大的差距：自主执行 vs 编排执行

把 Dify 插件装得再多，有一个差距是本质性的，永远不会被插件抹平：

OpenClaw / Hermes：Agent 是「活的」

OpenClaw Agent 自主执行流程图

OpenClaw / Hermes Agent 自主执行流程：Agent 接收任务后自主决策，可写代码、查资料、操作文件、执行命令，不受预设节点限制。

Agent 拿到任务后可以做任何事——写代码、跑脚本、上网查资料、操作 Git、甚至生成图片。它不受预设节点限制，有完整的自主决策权。

Dify：Agent 是「编好的」

Dify 工作流编排图

Dify 工作流编排：用户输入进入画布，按预设节点（LLM / 代码 / 工具 / 条件分支）执行，只能做编排者安排好的事。

Agent 只能执行你在画布上安排好的节点。如果没加「搜索」节点，它就不会去搜。如果没加「代码节点」，它就不能写代码。自由度完全由编排者预先决定。

说人话版

OpenClaw / Hermes：你雇了一个自由职业者，告诉他「搞定这个」，他自己想办法
Dify：你画了一张流程图，告诉他「按这个步骤走」

两者没有谁绝对好，取决于你想让 Agent 做「按部就班的活」还是「需要自己动脑子的活」。

四、插件市场的宝藏

以下四个插件，是从「纯低代码编排」到「接近自主 Agent」的关键桥梁：

🦞 Mini_Claw（安装量 5000+）

作者：lfenghx · 版本：1.2.0 · 工具插件

Dify 插件市场里最具份量的一个。它直接在 Dify 里复刻了一套接近 OpenClaw 的体验：

短期/长期记忆：跨对话持久化，越用越懂你
身份/人格/灵魂设定：不只是「回答问题」，还有角色感
Skill 渐进式发现机制：把插件目录当工具箱，Agent 先查技能索引，再按需读取和运行
自由执行：Agent 可以读写文件、运行脚本，不局限于预设节点
技能 CRUD：支持查看/添加/删除技能，以及依赖检测和自动安装
兼容 OpenClaw 的 Skill 目录结构

说白了，Mini_Claw 是在 Dify 的插件框架里，重新实现了一遍 OpenClaw 的核心机制。

🔄 OpenClaw Chat（安装量 689）

作者：sawyer-shi · 版本：0.0.1 · 工具插件

这个插件的定位很微妙——它不是替代 OpenClaw，而是把 Dify 和 OpenClaw 连在一起。

通过 OpenClaw Gateway 的 OpenResponses HTTP API，Dify 可以把消息发给 OpenClaw，让 OpenClaw 的 Agent 处理，然后拿回结果。

两种上下文策略：

会话级：每个 Dify 会话保持独立的 OpenClaw 上下文
用户级：同个用户在多个 Dify 会话间共享一个 OpenClaw 上下文

支持：文本、上传的图片/文档（base64 转发）、图片/文档 URL。

适用场景：你已经在用 OpenClaw，但想借 Dify 的工作流编辑器 + 知识库给它做前端编排层，或者想用 Dify 的 HITL 功能做人工审核节点。

🧞 Hermes Agent Chat（安装量 409）

作者：sawyer-shi · 版本：0.0.1 · 工具插件

OpenClaw Chat 的「亲兄弟」，但连接的是 Hermes Agent API Server。

跟 OpenClaw Chat 相比，区别在于：

连接的是 Hermes 的 OpenAI 兼容 API（Responses API），而非 OpenClaw Gateway
目前只支持图片上传（不支持文档），也不支持远程 URL——安全性方面更保守
同样支持会话级和用户级上下文保持

适用场景：你跑的是 Hermes Agent，想让它出现在 Dify 的界面里，或把 Dify 的编排能力「嫁接」到 Hermes 上。

🧠 MemOS（安装量 389）

作者：memtensor · 版本：0.0.4 · 工具插件

如果说 Mini_Claw 解决的是「像 OpenClaw 一样跑 Agent」，那 MemOS 解决的是「像 OpenClaw 一样记住用户」。

两个核心操作：

addMessage：把原始对话丢给它，自动处理和存储记忆
searchMemory：在后续对话中检索相关记忆，让回复更贴近用户

在 Dify 工作流中可以这样组合：

「聊天 → addMessage 存储 → searchMemory 检索 → LLM 节点生成回复」——形成记忆闭环
也可以把 MemOS 节点放在条件分支里，只在特定场景下读写记忆

MemOS 是独立云服务，不限于 Dify——任何 AI 应用都可以通过 API 接入。

五、Dify 做编排 + OpenClaw/Hermes 做核心 ≈ 最佳组合

绕了一大圈，我最终得出的结论不是「谁替代谁」，而是：

Dify + OpenClaw 组合架构图

三层架构：用户触点（微信/TG/Web）→ Dify 编排调度层（工作流/知识库/插件）→ OpenClaw/Hermes 核心执行层（自主 Agent/Skills）

什么时候该用什么

场景	推荐方案	理由
固定流程问答（客服、FAQ、审批）	Dify 独立运行	编排清晰，HITL 合规，非技术团队也能维护
需要 Agent 自主写代码、跑脚本	OpenClaw / Hermes	自主执行是自主 Agent 类平台的不可替代优势
知识库+RAG+问答系统	Dify 独立运行	内置知识库系统，一套搞定
企业级生产环境，需要权限管控	Dify 优先	租户、凭证范围、审计日志都内置了
需要多平台通讯（TG+微信+飞书）	OpenClaw / Hermes	Gateway 原生支持，Dify 靠插件桥接比较勉强
既要 Agent 能力又要可视化编排	Dify + OpenClaw Chat 插件	Dify 做前端编排，OpenClaw 做核心执行
想低成本体验「类 OpenClaw」	Dify + Mini_Claw 插件	一个插件就够了，不用自搭 OpenClaw 环境
需要跨 session 长期记忆	Dify + MemOS 插件或 OpenClaw	根据是否需要自托管选择

我在用的组合

Claw Master 项目目前是：

Dify：管知识库、管前端交互界面、管工作流编排
OpenClaw：管 Agent 核心执行（写代码、调文件、跑脚本）
Hermes Agent：管跨平台通讯和核心自主推理
OpenClaw Chat 插件：把 Dify 和 OpenClaw 串起来

三个平台各管各的擅长领域，中间用插件和 API 连接。

六、写在最后

Dify 从 v1.14 开始的插件化转型，是一个重要的方向信号——低代码平台通过插件生态，正在打破「只能编排不能自主」的边界。

Mini_Claw 的 5000+ 安装量说明了一件事：很多人都想在低代码平台上获得自主 Agent 的体验。而兼容 OpenClaw Skill 结构这一点，更是表明社区已经在主动打通两个阵营。

不过也要清醒看到：插件可以模拟、可以桥接、可以扩展，但改变不了 Dify 的底层设计哲学——它是编排平台，不是自主 Agent 引擎。你可以在 Dify 里装一百个插件，Agent 都不会自己决定去搜一个你忘了加搜索节点的信息。

反过来也一样：OpenClaw 再强大，也不会长出 Dify 那样的可视化工作流编辑器。

所以最好的问题是：你的场景需要 Agent 自由发挥，还是按部就班？

前者选 OpenClaw / Hermes，后者选 Dify。两者都要，就用插件把它们粘起来。

🦞 注：文章标题的「龙虾」取自 OpenClaw 的 Claw（螯足/爪子）。Mini_Claw 的「小龙虾」也是同一个梗。

写于 2026-05-20 · Dify v1.14.2 / OpenClaw 2026.4.21 / Hermes Agent Latest