VisionTool

설명

이 도구는 이미지에서 텍스트를 추출하는 데 사용한다. 에이전트에 전달하면 이미지에서 텍스트를 추출한 후, 이를 활용해 응답, 보고서 또는 기타 출력물을 생성한다. 이미지의 URL이나 PATH를 에이전트에 전달해야 한다.

설치

crewai_tools 패키지를 설치한다.

pip install 'crewai[tools]'

사용 방법

VisionTool을 사용하려면 환경 변수 OPENAI_API_KEY에 OpenAI API 키를 설정해야 한다.

from crewai_tools import VisionTool

vision_tool = VisionTool()

@agent
def researcher(self) -> Agent:
    '''
    이 에이전트는 VisionTool을 사용해 이미지에서 텍스트를 추출한다.
    '''
    return Agent(
        config=self.agents_config["researcher"],
        allow_delegation=False,
        tools=[vision_tool]
    )

인자

VisionTool은 다음과 같은 인자를 필요로 한다:

인자타입설명
image_path_urlstring필수. 텍스트를 추출해야 하는 이미지 파일의 경로.