Annotate Multimodal Data
यदि आप किसी Multimodal प्रोजेक्ट के हिस्से वाले डेटासेट का लेबलिंग कर रहे हैं, तो आपकी इमेजेज़ को एनोटेट करने के लिए प्रीफिक्स का उपयोग किया जाता है।
एक प्रीफिक्स या तो हो सकता है:
एक पहचानकर्ता जैसे
<PREFIX>, जिसका उपयोग एक को प्रॉम्प्ट करने के लिए किया जाता है VLM जैसे Florence-2, या;एक प्रश्न जैसे "इस छवि में क्या है?", जो GPT-4o जैसे सामान्य VQA मॉडलों के साथ उपयोग के लिए आदर्श है।
उदाहरण के लिए Florence-2 के फ़ाइन-ट्यूनिंग के लिए, चुना गया प्रीफिक्स उस प्रीफ़िक्स प्रॉम्प्ट के अनुरूप होगा जिसे आप मॉडल को देते हैं। Florence-2 के लिए, प्रीफिक्स का प्रारूप होना चाहिए <PREFIX>, जैसे <TOTAL>.
GPT-4o के लिए, आपका प्रीफिक्स हो सकता है: "इस रसीद में कुल कितनी राशि है?".
आप किसी ऑब्जेक्ट के अलग-अलग फीचर्स जैसे total, subtotal, और tax को पहचानने के लिए विभिन्न प्रीफिक्स जोड़ना चाह सकते हैं।
प्रीफिक्स जोड़ें
प्रीफिक्स जोड़ने के लिए, Roboflow साइडबार में "Classes & Tags" पर क्लिक करें, फिर "Add " बटन पर क्लिक करें:

फिर, प्रीफिक्स दर्ज करें। यह एक प्रश्न हो सकता है जैसे "छवि में क्या है?" या एक अनूठा ID जैसे "<RECEIPT>", जो उस मॉडल पर निर्भर करेगा जिसे आप ट्रेन करना चाहते हैं।
आप "+" बटन से कई प्रीफिक्स जोड़ सकते हैं।
अपने प्रीफिक्स जोड़ने के लिए “Add Prefixes” पर क्लिक करें।
एक बार जब आप प्रीफिक्स सेट कर देंगे, तो वे आपके एनोटेशन एडिटर में प्रश्नों के रूप में उपलब्ध होंगे:

Last updated
Was this helpful?