मल्टीमॉडल डेटा एनोटेट करें

यदि आप किसी ऐसे डेटासेट को लेबल कर रहे हैं जो किसी Multimodal प्रोजेक्ट का हिस्सा है, तो आपकी छवियों को एनोटेट करने के लिए प्रीफिक्स का उपयोग किया जाता है।

एक प्रीफिक्स निम्न में से कोई एक हो सकता है:

  • एक पहचानकर्ता जैसे <PREFIX>जो प्रॉम्प्ट करने के लिए उपयोग किया जाता है VLM जैसे Florence-2, या;

  • एक प्रश्न जैसे "इस छवि में क्या है?", जो सामान्य VQA मॉडल जैसे GPT-4o के साथ उपयोग के लिए उपयुक्त है।

उदाहरण के लिए, Florence-2 फाइन-ट्यूनिंग के लिए, चुना गया प्रीफिक्स उस प्रीफिक्स प्रॉम्प्ट के अनुरूप होगा जो आप मॉडल को देते हैं। Florence-2 के लिए, प्रीफिक्स इस प्रारूप में होना चाहिए <PREFIX>जैसे <TOTAL>.

GPT-4o के लिए, आपका प्रीफिक्स हो सकता है: "इस रसीद में कुल क्या है?"

आप किसी ऑब्जेक्ट में विभिन्न फीचर्स की पहचान के लिए अलग-अलग प्रीफिक्स जोड़ना चाह सकते हैं, जैसे कुल, उप-कुल, और टैक्स।

प्रीफिक्स जोड़ें

प्रीफिक्स जोड़ने के लिए, Roboflow साइडबार में "Classes & Tags" पर क्लिक करें, फिर "Add " बटन पर क्लिक करें:

फिर, प्रीफिक्स दर्ज करें। यह एक प्रश्न हो सकता है जैसे "इस छवि में क्या है?" या एक यूनिक आईडी जैसे "<RECEIPT>", यह इस पर निर्भर करता है कि आप किस मॉडल को ट्रेन करना चाहते हैं।

आप "+" बटन के साथ कई प्रीफिक्स जोड़ सकते हैं।

अपने प्रीफिक्स जोड़ने के लिए “Add Prefixes” पर क्लिक करें।

एक बार जब आप प्रीफिक्स सेट कर लेते हैं, तो वे आपके annotation editor में प्रश्नों के रूप में उपलब्ध होंगे:

Last updated

Was this helpful?