Image Augmentation
मॉडल प्रदर्शन सुधारने के लिए ऑग्मेंटेड इमेज बनाएँ।
छवि इनहांसमेंट एक चरण है जहाँ आपके डेटासेट में "Train" के रूप में चिह्नित मौजूदा छवियों पर ऑगमेंटेशन लागू किए जाते हैं। यह प्रक्रिया आपके मॉडल की सामान्यीकरण क्षमता को सुधारने में मदद कर सकती है और इस प्रकार अप्रत्याशित छवियों पर अधिक प्रभावी प्रदर्शन करने में सहायक हो सकती है।
हम बिना किसी ऑगमेंटेशन के प्रोजेक्ट शुरू करने की सलाह देते हैं। इससे आप अपने कच्चे डेटासेट की गुणवत्ता का आकलन कर सकते हैं। यदि आप ऑगमेंटेशन जोड़ते हैं और आपका डेटासेट अपेक्षित रूप से अच्छा प्रदर्शन नहीं करता है, तो आपके पास मॉडल प्रदर्शन की तुलना करने के लिए कोई बेसलाइन नहीं होगी।
यदि आपका मॉडल बिना ऑगमेंटेशन के अच्छा प्रदर्शन नहीं करता है, तो आपको क्लास संतुलन, डेटा प्रतिनिधित्व और डेटासेट आकार की जांच करने की आवश्यकता हो सकती है। जब आपके पास ऐसा डेटासेट हो जिस पर आपने ऑगमेंटेशन के बिना सफलतापूर्वक मॉडल प्रशिक्षित किया हो, तब आप मॉडल प्रदर्शन को और बेहतर करने के लिए ऑगमेंटेशन जोड़ सकते हैं।
ऑगमेंटेशन कुछ प्रमुख कारणों से प्रशिक्षण के समय पर नहीं बल्कि डेटासेट वर्ज़न ("ऑफलाइन ऑगमेंटेशन") के माध्यम से लागू किए जाते हैं:
मॉडल पुनरुत्पादन क्षमता बढ़ती है. Roboflow के साथ, आपके पास प्रत्येक छवि के ऑगमेंट किए जाने का एक कॉपी रिकॉर्ड होता है। उदाहरण के लिए, आप पा सकते हैं कि आपका मॉडल उज्जवल छवियों पर अंधेरी छवियों की तुलना में बेहतर प्रदर्शन करता है, इसलिए आपको अधिक लो-लाइट प्रशिक्षण डेटा इकट्ठा करना चाहिए।
प्रशिक्षण समय घटता है. ऑगमेंटेशन CPU-निर्भर ऑपरेशन होते हैं। जब आप अपने GPU पर प्रशिक्षण कर रहे होते हैं और ऑन-द-फ्लाई ऑगमेंटेशन कर रहे होते हैं, तो आपका GPU अक्सर प्रत्येक एपोच पर CPU से ऑगमेंटेड डेटा के आने की प्रतीक्षा कर रहा होता है। यह समय जोड़ जाता है!
प्रशिक्षण लागतें घटती हैं. चूंकि ऑगमेंटेशन CPU-निर्भर होते हैं, आपका महंगा किराये पर लिया गया GPU अक्सर प्रशिक्षण के लिए इमेजेस दिए जाने की प्रतीक्षा में रहता है।
ऑगमेंटेशन कैसे लागू किए जाते हैं
ऑगमेंटेशन हमेशा प्रशिक्षण छवियों पर लागू किए जाते हैं उसके बाद पूर्व-प्रसंस्करण चरण. चुने गए ऑगमेंटेशन एक साथ स्टैक किए जाते हैं, ऑगमेंटेशन सेटिंग्स के लिए रैंडमाइज़ेशन के साथ, और प्रत्येक सेटिंग के मान प्रत्येक ऑगमेंटेड छवि पर लागू होते हैं। इस प्रक्रिया के दौरान जो छवियाँ डुप्लिकेट के रूप में दिखाई देती हैं उन्हें बनाए गए वर्ज़न से फ़िल्टर कर दिया जाता है।
उदाहरण के लिए, यदि आप "अक्षांश रूप से पलटना (flip horizontally)" और "सॉल्ट और पेपर शोर (salt and pepper noise)" ऑगमेंटेशन चुनते हैं, तो एक दी गई छवि यादृच्छिक रूप से क्षैतिज पलट के रूप में परिलक्षित होगी और उसे यादृच्छिक सॉल्ट और पेपर शोर प्राप्त होगा।
ऑगमेंटेशन को सीमित करना
ऑगमेंटेशन के साथ एक डेटासेट वर्ज़न बनाते समय, आप "Maximum Version Size" विकल्प के माध्यम से शामिल करने के लिए अधिकतम ऑगमेंटेड छवियों की संख्या चुन सकते हैं।
उदाहरण के लिए, 3x चुनने का मतलब है कि आपका अंतिम डेटासेट वर्ज़न प्रत्येक प्रशिक्षण स्रोत छवि को के साथ शामिल करेगा पूर्व-प्रसंस्करण चरण लागू और आपकी चुनी हुई सेटिंग्स के आधार पर प्रत्येक छवि के 2 यादृच्छिक ऑगमेंटेशन।
यदि आपके डेटासेट में 100 छवियाँ थीं जिनका train/valid/test विभाजन 70/20/10 था और आपने 3x ऑगमेंटेशन चुना, तो आपका अंतिम डेटासेट लगभग 210/20/10 विभाजन होगा।

ऑगमेंटेशन विकल्प
Roboflow में ऑगमेंटेशन "Basic" या "Enhanced" हो सकते हैं और दो अलग-अलग स्तरों पर लागू किए जा सकते हैं।
छवि-स्तर ऑगमेंटेशन
छवि-स्तर ऑगमेंटेशन पूरे इमेज पर परिवर्तन लागू करके नया प्रशिक्षण डेटा बनाते हैं न कि व्यक्तिगत ऑब्जेक्ट्स या क्षेत्रों पर। पूरी छवि को संशोधित करके, डेवलपर्स व्यापक दृश्य परिस्थितियों का अनुकरण कर सकते हैं, जिससे मॉडल नए डेटा पर बेहतर सामान्यीकरण सीखते हैं।
बाउंडिंग बॉक्स-स्तर ऑगमेंटेशन
बाउंडिंग बॉक्स-स्तर ऑगमेंटेशन स्रोत छवि के बाउंडिंग बॉक्स की सामग्री को बदलकर नया प्रशिक्षण डेटा बनाता है। ऐसा करने से, डेवलपर्स के पास उस प्रकार का प्रशिक्षण डेटा बनाने पर अधिक नियंत्रण होता है जो उनकी समस्या की परिस्थितियों के लिए अधिक उपयुक्त हो।
एक 2019 पेपर Google के शोधकर्ताओं का यह पेपर केवल बाउंडिंग बॉक्स ऑगमेंटेशन के उपयोग का विचार प्रस्तुत करता है ताकि उनके मॉडलों के लिए इष्टतम डेटा बनाया जा सके। इस पेपर में, शोधकर्ताओं ने दिखाया कि केवल बाउंडिंग बॉक्स संशोधन प्रणालीगत सुधार बनाते हैं, विशेष रूप से उन मॉडलों के लिए जो छोटे डेटासेट पर फिट किए गए थे।
Camera Gain ऑगमेंटेशन
Motion Blur ऑगमेंटेशन
और जानें
Last updated
Was this helpful?