멀티모달 데이터에 주석 달기
데이터셋이 Multimodal 프로젝트의 일부인 경우, 이미지 주석에 접두사가 사용됩니다.
접두사는 다음 중 하나일 수 있습니다:
식별자 예:
<PREFIX>, 모델에 프롬프트를 제공하는 데 사용되는 VLM 예를 들어 Florence-2 등, 또는;"이 이미지에 무엇이 있나요?"와 같은 질문으로, GPT-4o와 같은 일반 VQA 모델에 적합합니다.
예를 들어 Florence-2 파인튜닝의 경우 선택한 접두사는 모델에 제공하는 접두사 프롬프트에 해당합니다. Florence-2의 접두사는 다음 형식이어야 합니다: <PREFIX>, 예: <TOTAL>.
GPT-4o의 경우 접두사는 "이 영수증의 합계는 무엇입니까?"와 같을 수 있습니다.
총합, 소계, 세금 등 식별하려는 객체의 서로 다른 기능에 대해 다양한 접두사를 추가할 수 있습니다.
접두사 추가
접두사를 추가하려면 Roboflow 사이드바에서 "Classes & Tags"를 클릭한 다음 "Add " 버튼을 클릭하세요:

그런 다음 접두사를 입력하세요. 이는 모델에 따라 "이미지에 무엇이 있나요?"와 같은 질문이거나 "<RECEIPT>"와 같은 고유 ID일 수 있습니다.
"+" 버튼으로 여러 접두사를 추가할 수 있습니다.
접두사를 추가하려면 “Add Prefixes”를 클릭하세요.
접두사를 설정하면 주석 편집기에서 질문으로 사용할 수 있습니다:

Last updated
Was this helpful?