For the complete documentation index, see llms.txt. This page is also available as Markdown.

멀티모달 데이터 주석 달기

멀티모달 프로젝트의 일부인 데이터셋에 레이블을 지정하는 경우, prefix는 이미지에 주석을 달 때 사용됩니다.

prefix는 다음 중 하나일 수 있습니다:

  • 다음과 같은 식별자 <PREFIX>는 다음을 프롬프트하기 위해 사용됩니다 VLM 예: Florence-2, 또는;

  • "이 이미지에는 무엇이 있나요?"와 같은 질문으로, GPT-4o 같은 일반 VQA 모델에 사용하기에 적합합니다.

예를 들어 Florence-2 미세 조정의 경우, 선택한 prefix는 모델에 제공하는 prefix prompt와 대응됩니다. Florence-2의 prefix는 다음 형식이어야 합니다 <PREFIX>와 같이 <TOTAL>.

GPT-4o의 경우 prefix는 다음과 같을 수 있습니다: "이 영수증의 총액은 얼마인가요?".

식별하려는 객체의 total, subtotal, tax 같은 서로 다른 기능에 대해 다른 prefix를 추가할 수도 있습니다.

Add Prefixes

prefix를 추가하려면 Roboflow 사이드바에서 "Classes & Tags"를 클릭한 다음, "Add " 버튼을 클릭하세요:

그런 다음 prefix를 입력하세요. 이는 모델에 따라 "What is in the image?" 같은 질문일 수도 있고, "<RECEIPT>" 같은 고유 ID일 수도 있습니다.

"+" 버튼으로 여러 prefix를 추가할 수 있습니다.

prefix를 추가하려면 “Add Prefixes”를 클릭하세요.

prefix를 설정하면, annotation editor에서 질문으로 사용할 수 있게 됩니다:

마지막 업데이트

도움이 되었나요?