DOCXSearchTool

아직 도구를 개선 중이므로 예상치 못한 동작이나 변경 사항이 발생할 수 있습니다.

개요

DOCXSearchTool은 DOCX 문서 내에서 의미 기반 검색을 수행하는 RAG 도구이다. 이 도구를 사용하면 쿼리 기반 검색을 통해 DOCX 파일에서 관련 정보를 효과적으로 검색하고 추출할 수 있다. 대규모 문서 컬렉션 내에서 특정 정보를 찾는 과정을 간소화하여 데이터 분석, 정보 관리, 연구 작업에 매우 유용하다.

설치

터미널에서 다음 명령어를 실행해 crewai_tools 패키지를 설치한다:

pip install 'crewai[tools]'

예제

다음 예제는 DOCXSearchTool을 초기화하여 특정 DOCX 파일의 내용을 검색하거나, 특정 DOCX 파일 경로를 지정해 검색하는 방법을 보여준다.

from crewai_tools import DOCXSearchTool

# 모든 DOCX 파일의 내용을 검색하기 위해 도구 초기화
tool = DOCXSearchTool()

# 또는

# 특정 DOCX 파일을 지정해 도구 초기화
# 에이전트는 지정된 DOCX 파일의 내용만 검색 가능
tool = DOCXSearchTool(docx='path/to/your/document.docx')

인자

DOCXSearchTool의 동작을 커스텀하기 위해 다음과 같은 인자를 사용할 수 있다:

인자타입설명
docxstring선택사항. 검색하려는 DOCX 파일의 경로를 지정한다. 초기화 시 제공하지 않으면, 나중에 검색할 DOCX 파일의 콘텐츠 경로를 지정할 수 있다.

커스텀 모델과 임베딩

기본적으로 이 도구는 임베딩과 요약 모두에 OpenAI를 사용한다. 모델을 커스터마이징하려면 다음과 같이 설정 딕셔너리를 활용할 수 있다:

tool = DOCXSearchTool(
    config=dict(
        llm=dict(
            provider="ollama", # 또는 google, openai, anthropic, llama2, ...
            config=dict(
                model="llama2",
                # temperature=0.5,
                # top_p=1,
                # stream=true,
            ),
        ),
        embedder=dict(
            provider="google", # 또는 openai, ollama, ...
            config=dict(
                model="models/embedding-001",
                task_type="retrieval_document",
                # title="Embeddings",
            ),
        ),
    )
)