2026년 3월 업데이트 AI 에이전트 고급

Dify AI 에이전트 가이드 2026: 도구를 갖춘 자율 AI 구축

Dify AI 에이전트는 단순한 챗봇을 훨씬 넘어섭니다 — 웹을 검색하고, Python 코드를 실행하고, 모든 API를 호출하고, 다단계 작업을 자율적으로 해결할 수 있습니다. 이 가이드는 첫 번째 에이전트부터 커스텀 도구 및 멀티 에이전트 시스템까지 모든 것을 설명합니다.

첫 번째 에이전트 만들기 → 도구 탐색

Dify AI 에이전트란 무엇인가요?

Dify AI 에이전트는 작업을 완수하기 위해 어떤 도구를 사용할지 자율적으로 결정하는 AI 애플리케이션입니다. 프롬프트를 기반으로 텍스트만 생성하는 일반 챗봇과 달리, 에이전트는 실제 행동을 취할 수 있습니다: Google 검색, Wikipedia 기사 읽기, Python 스크립트 실행, 현재 날씨 가져오기, 모든 REST API 호출.

핵심 차이는 행동 능력입니다: 에이전트에게 목표를 줍니다(예: "2026년 상위 5개 AI 스타트업을 조사하고 자금 조달을 요약해 줘"), 그러면 에이전트가 필요한 단계를 자율적으로 결정합니다 — 웹 검색, 결과 읽기, 정보 필터링, 답변 정리.

🔍 실시간 웹 검색
🐍 Python 코드 실행
🔗 모든 REST API 호출
🧮 계산 수행
📚 Wikipedia 조회
🤔 단계별 사고
실제 예시: Dify 에이전트에게 물어보세요: "현재 비트코인 가격은 얼마이고 이번 주에 어떻게 변했나요?" — 에이전트가 Google Search를 사용하고, 결과를 읽고, 최신의 정확한 답변을 제공합니다. 일반 챗봇은 이것을 할 수 없습니다.

에이전트 vs 챗봇 vs 워크플로우 — 언제 무엇을 사용할까요?

Dify는 세 가지 주요 앱 유형을 제공합니다. 각 유형이 가장 적합한 상황을 이해하면 시간을 절약하고 더 나은 결과를 얻을 수 있습니다:

특징 챗봇 워크플로우 에이전트
도구 사용 ✗ 없음 ✓ 고정 도구 ✓ 동적 선택
결정 없음 고정 분기 자율적 추론
이상적인 용도 Q&A, 지원 봇 파이프라인, 자동화 연구, 복잡한 작업
단계 1단계 (프롬프트 → 응답) 사전 정의된 단계 가변적, 런타임에 결정
실시간 데이터 ✗ 아니오 HTTP 노드를 통해서만 ✓ 예, 도구를 통해
예측 가능성 높음 매우 높음 낮음 (유연함)

챗봇 사용 시기...

고객 지원, FAQ 답변 또는 헬프데스크용 간단한 대화 어시스턴트가 필요할 때. 정적 지식, 실시간 데이터 불필요.

워크플로우 사용 시기...

반복 가능하고 결정론적인 파이프라인이 있을 때: 텍스트 번역, 기사 요약, 지원 티켓 분류. 항상 같은 단계.

에이전트 사용 시기...

작업에 실시간 정보, 여러 도구 또는 동적 결정이 필요할 때. 연구, 경쟁 분석, 실시간 데이터 조회 또는 복잡한 다단계 작업.

3

첫 번째 Dify 에이전트 만들기

웹을 검색하고 계산을 수행할 수 있는 연구 에이전트를 구축하려면 다음 단계를 따르세요. 약 10분이 소요됩니다:

1

새 앱 만들기

Dify Studio에서 "+ 앱 만들기"를 클릭합니다. 유형을 묻는 메시지가 표시되면 "에이전트"를 선택합니다. 이름을 입력합니다(예: "연구 어시스턴트").

2

시스템 프롬프트 작성

에이전트의 역할을 설명합니다. 예: "당신은 연구 어시스턴트입니다. 최신 정보가 필요한 경우 Google Search를 사용하세요. 계산에는 Calculator를 사용하세요. 항상 출처를 인용하세요."

3

도구 추가

"도구" 섹션(왼쪽 패널)에서 "+ 도구 추가"를 클릭합니다. "Google Search"를 활성화합니다 — SerpAPI 키가 필요합니다(무료 할당량 사용 가능). "Calculator"도 활성화합니다 — API 키 불필요.

4

에이전트 전략 선택

"에이전트 전략"에서 GPT-4o 또는 Claude 모델의 경우 "함수 호출"을 선택합니다. 기본 함수 호출이 없는 오픈소스 모델의 경우 "ReAct"를 선택합니다.

5

모델 선택

최고의 에이전트 성능을 위해 GPT-4o 또는 Claude 3.5 Sonnet을 선택합니다. 이 모델들이 도구를 언제 어떻게 사용해야 하는지 가장 잘 이해합니다.

6

에이전트 테스트

미리보기 패널에서 입력합니다: "현재 비트코인 가격은 유로로 얼마인가요?" — 에이전트가 Google Search를 호출하고, 결과를 읽고, 최신 답변을 제공하는 것을 관찰하세요. 그런 다음: "이 가격으로 0.5 BTC를 구매하면 얼마인가요?"

7

게시

파란색 "게시" 버튼을 클릭합니다. 이제 에이전트가 공유 링크 또는 REST API를 통해 액세스할 수 있습니다.

전문가 팁: 시스템 프롬프트를 집중적으로 유지하세요. 에이전트가 무엇인지, 어떤 도구를 선호해야 하는지, 어떻게 응답을 형식화해야 하는지 정확히 설명하세요. 모호한 프롬프트는 일관성 없는 도구 사용으로 이어집니다.

Dify 에이전트용 내장 도구

Dify는 바로 사용할 수 있는 도구 라이브러리를 포함합니다. 대부분은 해당 제공업체의 무료 또는 유료 API 키가 필요합니다. 가장 유용한 것들:

🔍

Google Search

가장 많이 사용됨

Google을 검색하고 제목, 스니펫, URL이 포함된 상위 결과를 제공합니다. 가장 강력한 검색 도구 — 최신 뉴스, 가격, 기업 데이터 및 시간에 민감한 정보에 이상적입니다.

제공업체: SerpAPI
키: SerpAPI 키 (월 100회 무료 검색)
🦆

DuckDuckGo

키 불필요

API 키 없이 개인 정보를 보호하는 웹 검색. 일반 검색에 적합합니다. 매우 최신 정보의 경우 Google Search보다 약간 덜 신뢰할 수 있습니다.

제공업체: 내장
키: 없음 — 무료
🔎

Bing Search

좋은 무료 티어

Azure Cognitive Services를 통한 Microsoft의 검색 엔진. 넉넉한 무료 할당량(월 1,000회 트랜잭션)이 있는 SerpAPI의 강력한 대안입니다.

제공업체: Microsoft Azure
키: Azure Bing Search API 키
📚

Wikipedia

키 불필요

Wikipedia를 검색하고 전체 기사 텍스트를 반환합니다. 사실적이고 백과사전적인 지식에 이상적입니다. 안정적인 사실의 경우 웹 검색보다 훨씬 신뢰할 수 있습니다.

제공업체: 내장
키: 없음 — 무료
🧮

Calculator

키 불필요

수학 표현식을 평가합니다. 모델이 머릿속으로 산술을 계산하려는 시도를 방지합니다(LLM은 수학을 잘 못하는 것으로 알려져 있음). 가격 계산, 백분율, 통계에 이상적입니다.

제공업체: 내장
키: 없음 — 무료
🐍

Code Interpreter

매우 강력함

안전한 샌드박스에서 Python 코드를 실행합니다. 에이전트가 데이터 분석, 텍스트 처리, 복잡한 계산 수행 또는 파일 조작을 위한 코드를 작성하고 실행할 수 있습니다.

제공업체: 내장 (샌드박스)
키: 없음 — Dify 내부에서 실행됨
🌤

날씨

무료 티어

모든 위치의 현재 날씨 조건과 예보를 반환합니다. 여행 에이전트, 이벤트 계획 또는 위치 기반 애플리케이션에 유용합니다.

제공업체: OpenWeatherMap
키: OpenWeatherMap API 키 (무료 티어 사용 가능)
🧠

WolframAlpha

매우 정확함

계산 지능 — 수학 문제, 과학 질문, 역사 데이터, 단위 변환에 최고의 정확도로 답변합니다. 웹 검색의 훌륭한 보완재입니다.

제공업체: Wolfram
키: Wolfram API 키 (월 2,000회 무료 호출)

커스텀 도구: 모든 API 연결

Dify 에이전트의 진정한 강점은 모든 REST API를 커스텀 도구로 통합할 수 있다는 점입니다. 에이전트가 내부 회사 시스템, SaaS 도구, 데이터베이스 또는 API가 있는 다른 서비스와 상호 작용할 수 있습니다.

방법 1: OpenAPI 스키마

API에 OpenAPI(Swagger) 사양이 있다면 JSON 또는 YAML을 Dify에 직접 붙여넣으세요. 모든 엔드포인트, 매개변수, 설명을 자동으로 파싱합니다.

  1. 도구 → 커스텀 도구 → 도구 만들기
  2. "OpenAPI 스키마에서 가져오기" 선택
  3. OpenAPI JSON/YAML 붙여넣기
  4. 인증 추가 (API 키, Bearer 토큰 등)
  5. 저장 — 모든 엔드포인트가 도구로 사용 가능

방법 2: 수동 정의

공식 사양이 없는 간단한 API의 경우 각 엔드포인트를 수동으로 정의합니다:

  1. 이름: "get_customer_data" (에이전트가 부르는 이름)
  2. 설명: "이메일 주소로 고객을 검색합니다" (에이전트가 언제 도구를 사용할지 결정하기 위해 이것을 읽습니다)
  3. 메서드: GET, POST, PUT, DELETE
  4. URL: 매개변수가 포함된 엔드포인트 URL
  5. 매개변수: 이름, 유형, 설명, 필수/선택