Image Augmentation

मॉडल प्रदर्शन सुधारने के लिए ऑग्मेंटेड इमेज बनाएँ।

छवि इनहांसमेंट एक चरण है जहाँ आपके डेटासेट में "Train" के रूप में चिह्नित मौजूदा छवियों पर ऑगमेंटेशन लागू किए जाते हैं। यह प्रक्रिया आपके मॉडल की सामान्यीकरण क्षमता को सुधारने में मदद कर सकती है और इस प्रकार अप्रत्याशित छवियों पर अधिक प्रभावी प्रदर्शन करने में सहायक हो सकती है।

ऑगमेंटेशन कुछ प्रमुख कारणों से प्रशिक्षण के समय पर नहीं बल्कि डेटासेट वर्ज़न ("ऑफलाइन ऑगमेंटेशन") के माध्यम से लागू किए जाते हैं:

  1. मॉडल पुनरुत्पादन क्षमता बढ़ती है. Roboflow के साथ, आपके पास प्रत्येक छवि के ऑगमेंट किए जाने का एक कॉपी रिकॉर्ड होता है। उदाहरण के लिए, आप पा सकते हैं कि आपका मॉडल उज्जवल छवियों पर अंधेरी छवियों की तुलना में बेहतर प्रदर्शन करता है, इसलिए आपको अधिक लो-लाइट प्रशिक्षण डेटा इकट्ठा करना चाहिए।

  2. प्रशिक्षण समय घटता है. ऑगमेंटेशन CPU-निर्भर ऑपरेशन होते हैं। जब आप अपने GPU पर प्रशिक्षण कर रहे होते हैं और ऑन-द-फ्लाई ऑगमेंटेशन कर रहे होते हैं, तो आपका GPU अक्सर प्रत्येक एपोच पर CPU से ऑगमेंटेड डेटा के आने की प्रतीक्षा कर रहा होता है। यह समय जोड़ जाता है!

  3. प्रशिक्षण लागतें घटती हैं. चूंकि ऑगमेंटेशन CPU-निर्भर होते हैं, आपका महंगा किराये पर लिया गया GPU अक्सर प्रशिक्षण के लिए इमेजेस दिए जाने की प्रतीक्षा में रहता है।

ऑगमेंटेशन कैसे लागू किए जाते हैं

ऑगमेंटेशन हमेशा प्रशिक्षण छवियों पर लागू किए जाते हैं उसके बाद पूर्व-प्रसंस्करण चरण. चुने गए ऑगमेंटेशन एक साथ स्टैक किए जाते हैं, ऑगमेंटेशन सेटिंग्स के लिए रैंडमाइज़ेशन के साथ, और प्रत्येक सेटिंग के मान प्रत्येक ऑगमेंटेड छवि पर लागू होते हैं। इस प्रक्रिया के दौरान जो छवियाँ डुप्लिकेट के रूप में दिखाई देती हैं उन्हें बनाए गए वर्ज़न से फ़िल्टर कर दिया जाता है।

उदाहरण के लिए, यदि आप "अक्षांश रूप से पलटना (flip horizontally)" और "सॉल्ट और पेपर शोर (salt and pepper noise)" ऑगमेंटेशन चुनते हैं, तो एक दी गई छवि यादृच्छिक रूप से क्षैतिज पलट के रूप में परिलक्षित होगी और उसे यादृच्छिक सॉल्ट और पेपर शोर प्राप्त होगा।

ऑगमेंटेशन को सीमित करना

ऑगमेंटेशन के साथ एक डेटासेट वर्ज़न बनाते समय, आप "Maximum Version Size" विकल्प के माध्यम से शामिल करने के लिए अधिकतम ऑगमेंटेड छवियों की संख्या चुन सकते हैं।

उदाहरण के लिए, 3x चुनने का मतलब है कि आपका अंतिम डेटासेट वर्ज़न प्रत्येक प्रशिक्षण स्रोत छवि को के साथ शामिल करेगा पूर्व-प्रसंस्करण चरण लागू और आपकी चुनी हुई सेटिंग्स के आधार पर प्रत्येक छवि के 2 यादृच्छिक ऑगमेंटेशन।

यदि आपके डेटासेट में 100 छवियाँ थीं जिनका train/valid/test विभाजन 70/20/10 था और आपने 3x ऑगमेंटेशन चुना, तो आपका अंतिम डेटासेट लगभग 210/20/10 विभाजन होगा।

आपके वर्ज़न की अंतिम छवियों की संख्या इस अनुमान से कम हो सकती है क्योंकि हम छवियों की डुप्लिकेटिंग हटाते हैं और कुछ विकल्प (जैसे "Filter Null") आउटपुट से छवियों को हटा सकते हैं।

ऑगमेंटेशन विकल्प

Roboflow में ऑगमेंटेशन "Basic" या "Enhanced" हो सकते हैं और दो अलग-अलग स्तरों पर लागू किए जा सकते हैं।

छवि-स्तर ऑगमेंटेशन

छवि-स्तर ऑगमेंटेशन पूरे इमेज पर परिवर्तन लागू करके नया प्रशिक्षण डेटा बनाते हैं न कि व्यक्तिगत ऑब्जेक्ट्स या क्षेत्रों पर। पूरी छवि को संशोधित करके, डेवलपर्स व्यापक दृश्य परिस्थितियों का अनुकरण कर सकते हैं, जिससे मॉडल नए डेटा पर बेहतर सामान्यीकरण सीखते हैं।

बाउंडिंग बॉक्स-स्तर ऑगमेंटेशन

बाउंडिंग बॉक्स-स्तर ऑगमेंटेशन स्रोत छवि के बाउंडिंग बॉक्स की सामग्री को बदलकर नया प्रशिक्षण डेटा बनाता है। ऐसा करने से, डेवलपर्स के पास उस प्रकार का प्रशिक्षण डेटा बनाने पर अधिक नियंत्रण होता है जो उनकी समस्या की परिस्थितियों के लिए अधिक उपयुक्त हो।

एक 2019 पेपर Google के शोधकर्ताओं का यह पेपर केवल बाउंडिंग बॉक्स ऑगमेंटेशन के उपयोग का विचार प्रस्तुत करता है ताकि उनके मॉडलों के लिए इष्टतम डेटा बनाया जा सके। इस पेपर में, शोधकर्ताओं ने दिखाया कि केवल बाउंडिंग बॉक्स संशोधन प्रणालीगत सुधार बनाते हैं, विशेष रूप से उन मॉडलों के लिए जो छोटे डेटासेट पर फिट किए गए थे।

Enhanced Augmentations और Bounding Box Augmentations प्रीमियम फीचर हैं।

हमारी योजनाओं और उनके संबंधित फ़ीचर्स पर ताज़ा जानकारी के लिए, हमारी देखें प्राइसिंग पेज.

छवि-स्तर ऑगमेंटेशन
बाउंडिंग बॉक्स ऑगमेंटेशन
ऑगमेंटेशन प्रकार

और जानें

Last updated

Was this helpful?