Annotate Multimodal Data

यदि आप किसी Multimodal प्रोजेक्ट के हिस्से वाले डेटासेट का लेबलिंग कर रहे हैं, तो आपकी इमेजेज़ को एनोटेट करने के लिए प्रीफिक्स का उपयोग किया जाता है।

एक प्रीफिक्स या तो हो सकता है:

  • एक पहचानकर्ता जैसे <PREFIX>, जिसका उपयोग एक को प्रॉम्प्ट करने के लिए किया जाता है VLM जैसे Florence-2, या;

  • एक प्रश्न जैसे "इस छवि में क्या है?", जो GPT-4o जैसे सामान्य VQA मॉडलों के साथ उपयोग के लिए आदर्श है।

उदाहरण के लिए Florence-2 के फ़ाइन-ट्यूनिंग के लिए, चुना गया प्रीफिक्स उस प्रीफ़िक्स प्रॉम्प्ट के अनुरूप होगा जिसे आप मॉडल को देते हैं। Florence-2 के लिए, प्रीफिक्स का प्रारूप होना चाहिए <PREFIX>, जैसे <TOTAL>.

GPT-4o के लिए, आपका प्रीफिक्स हो सकता है: "इस रसीद में कुल कितनी राशि है?".

आप किसी ऑब्जेक्ट के अलग-अलग फीचर्स जैसे total, subtotal, और tax को पहचानने के लिए विभिन्न प्रीफिक्स जोड़ना चाह सकते हैं।

प्रीफिक्स जोड़ें

प्रीफिक्स जोड़ने के लिए, Roboflow साइडबार में "Classes & Tags" पर क्लिक करें, फिर "Add " बटन पर क्लिक करें:

फिर, प्रीफिक्स दर्ज करें। यह एक प्रश्न हो सकता है जैसे "छवि में क्या है?" या एक अनूठा ID जैसे "<RECEIPT>", जो उस मॉडल पर निर्भर करेगा जिसे आप ट्रेन करना चाहते हैं।

आप "+" बटन से कई प्रीफिक्स जोड़ सकते हैं।

अपने प्रीफिक्स जोड़ने के लिए “Add Prefixes” पर क्लिक करें।

एक बार जब आप प्रीफिक्स सेट कर देंगे, तो वे आपके एनोटेशन एडिटर में प्रश्नों के रूप में उपलब्ध होंगे:

Last updated

Was this helpful?