इमेज ऑगमेंटेशन

मॉडल प्रदर्शन सुधारने के लिए ऑगमेंटेड इमेज बनाएं।

छवि इनहांसमेंट एक चरण है जहाँ आपके डेटासेट में "Train" के रूप में चिह्नित मौजूदा छवियों पर ऑगमेंटेशन लागू किए जाते हैं। यह प्रक्रिया आपके मॉडल की सामान्यीकरण क्षमता को सुधारने में मदद कर सकती है और इस प्रकार अप्रत्याशित छवियों पर अधिक प्रभावी प्रदर्शन करने में सहायक हो सकती है।

circle-check

ऑगमेंटेशन कुछ प्रमुख कारणों से प्रशिक्षण के समय पर नहीं बल्कि डेटासेट वर्ज़न ("ऑफलाइन ऑगमेंटेशन") के माध्यम से लागू किए जाते हैं:

  1. मॉडल पुनरुत्पादन क्षमता बढ़ती है. Roboflow के साथ, आपके पास प्रत्येक छवि के ऑगमेंट किए जाने का एक कॉपी रिकॉर्ड होता है। उदाहरण के लिए, आप पा सकते हैं कि आपका मॉडल उज्जवल छवियों पर अंधेरी छवियों की तुलना में बेहतर प्रदर्शन करता है, इसलिए आपको अधिक लो-लाइट प्रशिक्षण डेटा इकट्ठा करना चाहिए।

  2. प्रशिक्षण समय घटता है. ऑगमेंटेशन CPU-निर्भर ऑपरेशन होते हैं। जब आप अपने GPU पर प्रशिक्षण कर रहे होते हैं और ऑन-द-फ्लाई ऑगमेंटेशन कर रहे होते हैं, तो आपका GPU अक्सर प्रत्येक एपोच पर CPU से ऑगमेंटेड डेटा के आने की प्रतीक्षा कर रहा होता है। यह समय जोड़ जाता है!

  3. प्रशिक्षण लागतें घटती हैं. चूंकि ऑगमेंटेशन CPU-निर्भर होते हैं, आपका महंगा किराये पर लिया गया GPU अक्सर प्रशिक्षण के लिए इमेजेस दिए जाने की प्रतीक्षा में रहता है।

ऑगमेंटेशन कैसे लागू किए जाते हैं

ऑगमेंटेशन हमेशा प्रशिक्षण छवियों पर लागू किए जाते हैं उसके बाद पूर्व-प्रसंस्करण चरण. चुने गए ऑगमेंटेशन एक साथ स्टैक किए जाते हैं, ऑगमेंटेशन सेटिंग्स के लिए रैंडमाइज़ेशन के साथ, और प्रत्येक सेटिंग के मान प्रत्येक ऑगमेंटेड छवि पर लागू होते हैं। इस प्रक्रिया के दौरान जो छवियाँ डुप्लिकेट के रूप में दिखाई देती हैं उन्हें बनाए गए वर्ज़न से फ़िल्टर कर दिया जाता है।

उदाहरण के लिए, यदि आप "अक्षांश रूप से पलटना (flip horizontally)" और "सॉल्ट और पेपर शोर (salt and pepper noise)" ऑगमेंटेशन चुनते हैं, तो एक दी गई छवि यादृच्छिक रूप से क्षैतिज पलट के रूप में परिलक्षित होगी और उसे यादृच्छिक सॉल्ट और पेपर शोर प्राप्त होगा।

ऑगमेंटेशन को सीमित करना

ऑगमेंटेशन के साथ एक डेटासेट वर्ज़न बनाते समय, आप "Maximum Version Size" विकल्प के माध्यम से शामिल करने के लिए अधिकतम ऑगमेंटेड छवियों की संख्या चुन सकते हैं।

उदाहरण के लिए, 3x चुनने का मतलब है कि आपका अंतिम डेटासेट वर्ज़न प्रत्येक प्रशिक्षण स्रोत छवि को के साथ शामिल करेगा पूर्व-प्रसंस्करण चरण लागू और आपकी चुनी हुई सेटिंग्स के आधार पर प्रत्येक छवि के 2 यादृच्छिक ऑगमेंटेशन।

यदि आपके डेटासेट में 100 छवियाँ थीं जिनका train/valid/test विभाजन 70/20/10 था और आपने 3x ऑगमेंटेशन चुना, तो आपका अंतिम डेटासेट लगभग 210/20/10 विभाजन होगा।

circle-info

आपके वर्ज़न की अंतिम छवियों की संख्या इस अनुमान से कम हो सकती है क्योंकि हम छवियों की डुप्लिकेटिंग हटाते हैं और कुछ विकल्प (जैसे "Filter Null") आउटपुट से छवियों को हटा सकते हैं।

ऑगमेंटेशन विकल्प

Roboflow में ऑगमेंटेशन "Basic" या "Enhanced" हो सकते हैं और दो अलग-अलग स्तरों पर लागू किए जा सकते हैं।

छवि-स्तर ऑगमेंटेशन

छवि-स्तर ऑगमेंटेशन पूरे इमेज पर परिवर्तन लागू करके नया प्रशिक्षण डेटा बनाते हैं न कि व्यक्तिगत ऑब्जेक्ट्स या क्षेत्रों पर। पूरी छवि को संशोधित करके, डेवलपर्स व्यापक दृश्य परिस्थितियों का अनुकरण कर सकते हैं, जिससे मॉडल नए डेटा पर बेहतर सामान्यीकरण सीखते हैं।

बाउंडिंग बॉक्स-स्तर ऑगमेंटेशन

बाउंडिंग बॉक्स-स्तर ऑगमेंटेशन स्रोत छवि के बाउंडिंग बॉक्स की सामग्री को बदलकर नया प्रशिक्षण डेटा बनाता है। ऐसा करने से, डेवलपर्स के पास उस प्रकार का प्रशिक्षण डेटा बनाने पर अधिक नियंत्रण होता है जो उनकी समस्या की परिस्थितियों के लिए अधिक उपयुक्त हो।

एक 2019 पेपरarrow-up-right Google के शोधकर्ताओं का यह पेपर केवल बाउंडिंग बॉक्स ऑगमेंटेशन के उपयोग का विचार प्रस्तुत करता है ताकि उनके मॉडलों के लिए इष्टतम डेटा बनाया जा सके। इस पेपर में, शोधकर्ताओं ने दिखाया कि केवल बाउंडिंग बॉक्स संशोधन प्रणालीगत सुधार बनाते हैं, विशेष रूप से उन मॉडलों के लिए जो छोटे डेटासेट पर फिट किए गए थे।

circle-info

Enhanced Augmentations और Bounding Box Augmentations प्रीमियम फीचर हैं।

हमारी योजनाओं और उनके संबंधित फ़ीचर्स पर ताज़ा जानकारी के लिए, हमारी देखें प्राइसिंग पेजarrow-up-right.

छवि-स्तर ऑगमेंटेशन
बाउंडिंग बॉक्स ऑगमेंटेशन
ऑगमेंटेशन प्रकार

और जानें

Last updated

Was this helpful?