Multimodal Data annotate करें
यदि आप एक Multimodal project का हिस्सा होने वाले dataset को label कर रहे हैं, तो images को annotate करने के लिए prefixes का उपयोग किया जाता है।
एक prefix इनमें से कोई भी हो सकता है:
जैसे एक identifier
<PREFIX>, जिसका उपयोग एक को prompt करने के लिए किया जाता है VLM जैसे Florence-2, या;"इस image में क्या है?" जैसा एक question, जो GPT-4o जैसे general VQA models के साथ उपयोग के लिए उपयुक्त है।
उदाहरण के लिए, Florence-2 fine-tuning के लिए, चुना गया prefix उस prefix prompt से मेल खाएगा जो आप model को देते हैं। Florence-2 के लिए, prefixes का format होना चाहिए <PREFIX> , जैसे <TOTAL>.
GPT-4o के लिए, आपका prefix यह हो सकता है: "इस receipt में total कितना है?"।
आप किसी object में अलग-अलग features के लिए अलग-अलग prefixes जोड़ना चाह सकते हैं, जिन्हें हम identify करना चाहते हैं, जैसे total, subtotal, और tax.
Prefixes जोड़ें
Prefixes जोड़ने के लिए, Roboflow sidebar में "Classes & Tags" पर क्लिक करें, फिर "Add " button पर क्लिक करें:

फिर, prefix दर्ज करें। यह "इस image में क्या है?" जैसा question या "<RECEIPT>" जैसा unique ID हो सकता है, उस model पर निर्भर करता है जिसे आप train करना चाहते हैं।
आप "+" button के साथ multiple prefixes जोड़ सकते हैं।
अपने prefixes जोड़ने के लिए “Add Prefixes” पर क्लिक करें।
एक बार जब आपने prefixes सेट कर दिए, तो वे आपके annotation editor में questions के रूप में उपलब्ध होंगे:

अंतिम अपडेट
क्या यह उपयोगी था?