CrewAI 프레임워크에서 이미지 및 비텍스트 콘텐츠 처리를 위한 멀티모달 기능을 활성화하고 사용하는 방법을 배워보세요.
multimodal
매개변수를 True
로 설정한다:
multimodal=True
로 설정하면, 에이전트는 자동으로 비텍스트 콘텐츠를 처리하는 데 필요한 도구들(예: AddImageTool
)과 함께 구성된다.
AddImageTool
을 기본으로 포함하고 있다. 이 도구는 이미지를 처리할 수 있게 해준다. 여러분이 직접 이 도구를 추가할 필요는 없다. 멀티모달 기능을 활성화하면 자동으로 포함된다.
멀티모달 어시스턴트를 사용해 이미지를 분석하는 완전한 예제는 다음과 같다:
AddImageTool
은 자동으로 다음 스키마로 구성된다:
action
매개변수를 활용한다.