Dify AI 智能体指南 2026:构建配备工具的自主 AI
Dify AI 智能体远超普通聊天机器人 — 它们可以搜索网络、执行 Python 代码、调用任意 API,并自主解决多步骤任务。本指南涵盖从第一个智能体到自定义工具和多智能体系统的所有内容。
什么是 Dify AI 智能体?
Dify AI 智能体是一种 AI 应用,它能自主决定使用哪些工具来完成任务。与普通聊天机器人(仅根据提示词生成文本)不同,智能体可以执行真实操作:搜索 Google、阅读 Wikipedia 文章、运行 Python 脚本、获取当前天气或调用任意 REST API。
关键区别在于行动能力:您给智能体一个目标(例如"研究 2026 年前五大 AI 初创公司并总结其融资情况"),智能体会自主确定必要步骤 — 网络搜索、阅读结果、筛选信息并整合答案。
智能体 vs 聊天机器人 vs 工作流 — 何时使用哪种?
Dify 提供三种主要应用类型。了解每种类型的最佳使用场景可以节省时间并获得更好结果:
| 特性 | 聊天机器人 | 工作流 | 智能体 |
|---|---|---|---|
| 工具使用 | ✗ 无 | ✓ 固定工具 | ✓ 动态选择 |
| 决策方式 | 无 | 固定分支 | 自主推理 |
| 最适合 | 问答、支持机器人 | 管道、自动化 | 研究、复杂任务 |
| 步骤数 | 1步(提示→回复) | 预定义步骤 | 可变,运行时决定 |
| 实时数据 | ✗ 否 | 仅通过 HTTP 节点 | ✓ 是,通过工具 |
| 可预测性 | 高 | 非常高 | 较低(灵活) |
使用聊天机器人的情况...
您需要简单的对话助手用于客服、FAQ 解答或帮助台。静态知识,无需实时数据。
使用工作流的情况...
您有定义明确的可重复管道:翻译文本、总结文章、分类支持工单。每次步骤相同。
使用智能体的情况...
任务需要实时信息、多种工具或动态决策。研究、竞争分析、实时数据获取或复杂多步骤任务。
创建您的第一个 Dify 智能体
按照以下步骤构建一个能搜索网络并进行计算的研究智能体,大约需要 10 分钟:
创建新应用
在 Dify Studio 中点击"+ 创建应用"。当被问及类型时,选择"智能体"。输入名称,如"研究助手"。
编写系统提示词
描述智能体的角色。示例:"您是一个研究助手。需要当前信息时,使用 Google 搜索。需要计算时使用计算器。始终引用您的来源。"
添加工具
在"工具"区域(左侧面板)点击"+ 添加工具"。启用"Google 搜索"— 需要 SerpAPI 密钥(有免费配额)。同时启用"计算器"— 无需 API 密钥。
选择智能体策略
在"智能体策略"下,GPT-4o 或 Claude 模型选择"函数调用"。开源模型不支持原生函数调用时选择"ReAct"。
选择模型
选择 GPT-4o 或 Claude 3.5 Sonnet 以获得最佳智能体性能。这些模型最能可靠地理解何时以及如何使用工具。
测试智能体
在预览面板输入:"比特币当前价格是多少欧元?"— 观察智能体如何调用 Google 搜索,阅读结果并提供最新答案。然后问:"如果我以这个价格购买 0.5 BTC,需要花多少钱?"
发布
点击蓝色"发布"按钮。您的智能体现在已上线,可通过分享链接或 REST API 访问。
Dify 智能体内置工具
Dify 包含一个现成工具库。大多数需要相应提供商的免费或付费 API 密钥。以下是最实用的工具:
Google 搜索
搜索 Google 并返回包含标题、摘要和 URL 的顶级结果。最强大的搜索工具 — 非常适合最新新闻、价格、公司数据和时效性信息。
DuckDuckGo
无需 API 密钥的隐私优先网络搜索。适合通用搜索。对非常新的信息不如 Google 搜索可靠。
Bing 搜索
通过 Azure 认知服务使用微软搜索引擎。SerpAPI 的可靠替代品,有慷慨的免费配额(每月 1000 次事务)。
Wikipedia
搜索 Wikipedia 并返回完整文章文本。非常适合事实性百科全书知识。对于稳定事实比网络搜索可靠得多。
计算器
计算数学表达式。防止模型尝试心算(LLM 的数学能力众所周知较弱)。非常适合价格计算、百分比和统计。
代码解释器
在安全沙箱中执行 Python 代码。智能体可以编写和运行代码来分析数据、处理文本、执行复杂计算或操作文件。
自定义工具:连接任意 API
Dify 智能体真正的强大之处在于您可以将任意 REST API 作为自定义工具集成。这样您的智能体就能与内部企业系统、SaaS 工具、数据库或其他有 API 的服务交互。
方法 1:OpenAPI 规范
如果您的 API 有 OpenAPI(Swagger)规范,可直接将 JSON 或 YAML 粘贴到 Dify。它会自动解析所有端点、参数和描述。
- 工具 → 自定义工具 → 创建工具
- 选择"从 OpenAPI 规范导入"
- 粘贴 OpenAPI JSON/YAML
- 添加认证(API Key、Bearer Token 等)
- 保存 — 所有端点立即可作为工具使用
方法 2:手动定义
对于没有正式规范的简单 API,手动定义每个端点:
- 名称:"get_customer_data"(智能体调用时使用的名称)
- 描述:"根据邮箱地址查找客户"(智能体读取此说明来决定何时使用该工具)
- 方法:GET、POST、PUT、DELETE
- URL:带参数的端点 URL
- 参数:名称、类型、描述、必填/可选
智能体策略:ReAct vs 函数调用
Dify 支持两种智能体推理和工具使用策略。正确的选择取决于所使用的 LLM:
函数调用
模型原生理解如何将工具作为结构化函数调用使用。更可靠、更高效,产生更清晰的推理链。
最佳模型:
- GPT-4o、GPT-4 Turbo
- Claude 3.5 Sonnet、Claude 3 Opus
- Gemini 1.5 Pro、Gemini 1.5 Flash
- Mistral Large
ReAct(推理 + 行动)
模型将推理写为文本("思考:我需要搜索 X..."),然后是行动指令("行动:google_search[X]")。适用于任何能遵循指令的模型。
使用场景:
- 开源模型(Llama、Qwen、Mistral 7B)
- 不支持原生函数调用的模型
- 需要查看完整推理过程时
简单规则
使用 GPT-4o、Claude 3.5+ 或 Gemini Pro?→ 使用函数调用。使用开源模型?→ 使用 ReAct。不确定时先尝试函数调用。
常见问题
Dify AI 智能体能做什么?
Dify AI 智能体可以搜索网络(Google、Bing、DuckDuckGo)、执行 Python 代码、调用外部 API、阅读 Wikipedia、进行数学计算、查询天气等。它们能自主决定对每项任务使用哪些工具。
Dify 智能体和聊天机器人有什么区别?
Dify 聊天机器人根据训练和提示词回答问题。Dify 智能体则主动使用工具 — 它可以搜索互联网、执行代码或调用 API。聊天机器人适合支持场景,智能体适合研究和自动化。
我可以给 Dify 智能体添加自定义工具吗?
可以。您可以通过提供 OpenAPI 规范或手动指定端点、名称、描述和参数,将任何 REST API 添加为自定义工具。当任务需要时,智能体会使用您的工具。
Dify 智能体支持多步骤推理吗?
支持。Dify 智能体使用 ReAct(推理 + 行动)或函数调用。智能体逐步思考,调用工具,观察结果并继续,直到任务完成 — 类似于 AutoGPT 或 LangChain。
准备好部署您的 Dify 智能体了吗?
在 Dify Cloud 上运行智能体会迅速消耗大量积分。自托管让您以固定月费享有无限智能体运行 — 最低 €3.79/月起。