छवि वृद्धि
मॉडल प्रदर्शन सुधारने के लिए बढ़ी हुई छवियाँ बनाएं।
इमेज ऑगमेंटेशन एक ऐसा चरण है जिसमें आपके डेटासेट में "Train" के रूप में चिह्नित मौजूदा छवियों पर ऑगमेंटेशन लागू किए जाते हैं। यह प्रक्रिया आपके मॉडल की सामान्यीकरण क्षमता को बेहतर बनाने में मदद कर सकती है और इस प्रकार अनदेखी छवियों पर अधिक प्रभावी प्रदर्शन कर सकती है।
हम अनुशंसा करते हैं कि किसी प्रोजेक्ट की शुरुआत बिना किसी ऑगमेंटेशन के करें। इससे आप अपने कच्चे डेटासेट की गुणवत्ता का मूल्यांकन कर सकते हैं। यदि आप ऑगमेंटेशन जोड़ते हैं और आपका डेटासेट अपेक्षा के अनुसार प्रदर्शन नहीं करता है, तो आपके पास मॉडल प्रदर्शन की तुलना के लिए कोई आधार रेखा नहीं होगी।
यदि आपका मॉडल बिना ऑगमेंटेशन के अच्छा प्रदर्शन नहीं करता है, तो आपको वर्ग संतुलन, डेटा प्रतिनिधित्व और डेटासेट आकार की जांच करनी पड़ सकती है। जब आपके पास ऐसा डेटासेट हो जिस पर आपने बिना ऑगमेंटेशन के सफलतापूर्वक मॉडल प्रशिक्षित किया हो, तब आप ऑगमेंटेशन जोड़ सकते हैं ताकि मॉडल प्रदर्शन को और बेहतर बनाया जा सके।
कुछ मुख्य कारणों से ऑगमेंटेशन प्रशिक्षण के समय के बजाय डेटासेट संस्करण ("ऑफलाइन ऑगमेंटेशन") के माध्यम से लागू किए जाते हैं:
मॉडल पुनरुत्पादकता बढ़ जाती है। रोबोफ्लो के साथ, आपके पास यह रिकॉर्ड होता है कि प्रत्येक छवि को कैसे ऑगमेंट किया गया था। उदाहरण के लिए, आप देख सकते हैं कि आपका मॉडल उज्ज्वल छवियों पर गहरे छवियों की तुलना में बेहतर प्रदर्शन करता है, इसलिए आपको अधिक कम-प्रकाश प्रशिक्षण डेटा एकत्र करना चाहिए।
प्रशिक्षण समय कम हो जाता है। ऑगमेंटेशन सीपीयू-सीमित ऑपरेशन हैं। जब आप अपने जीपीयू पर प्रशिक्षण ले रहे होते हैं और ऑन-द-फ्लाई ऑगमेंटेशन कर रहे होते हैं, तो आपका जीपीयू अक्सर आपके सीपीयू से ऑगमेंटेड डेटा की प्रतीक्षा करता है। यह समय जोड़ता है!
प्रशिक्षण लागत कम हो जाती है। क्योंकि ऑगमेंटेशन सीपीयू-सीमित ऑपरेशन हैं, आपका महंगा, किराए का जीपीयू अक्सर प्रशिक्षण के लिए छवियों की प्रतीक्षा करता है।
ऑगमेंटेशन कैसे लागू किए जाते हैं
ऑगमेंटेशन हमेशा प्रशिक्षण छवियों पर लागू किए जाते हैं प्रीप्रोसेसिंग चरणोंके बाद। चयनित ऑगमेंटेशन एक साथ स्टैक किए जाते हैं, ऑगमेंटेशन सेटिंग्स के लिए यादृच्छिकता के साथ, और प्रत्येक सेटिंग के लिए मान प्रत्येक ऑगमेंटेड छवि पर लागू किए जाते हैं। इस प्रक्रिया के दौरान जो भी छवियां डुप्लिकेट के रूप में आती हैं, उन्हें बनाए गए संस्करण से फ़िल्टर कर दिया जाता है।
उदाहरण के लिए, यदि आप "क्षैतिज रूप से पलटें" और "नमक और काली मिर्च शोर" ऑगमेंटेशन चुनते हैं, तो किसी दी गई छवि को यादृच्छिक रूप से क्षैतिज रूप से पलटा जा सकता है और उस पर यादृच्छिक नमक और काली मिर्च शोर लगाया जा सकता है।
ऑगमेंटेशन सीमित करना
जब आप ऑगमेंटेशन के साथ डेटासेट संस्करण बना रहे होते हैं, तो आप "अधिकतम संस्करण आकार" विकल्प के माध्यम से शामिल की जाने वाली ऑगमेंटेड छवियों की अधिकतम संख्या चुन सकते हैं।
उदाहरण के लिए, 3x चुनने का मतलब है कि आपके अंतिम डेटासेट संस्करण में प्रत्येक प्रशिक्षण स्रोत छवि के साथ प्रीप्रोसेसिंग चरणों लागू और प्रत्येक छवि के 2 यादृच्छिक ऑगमेंटेशन आपके द्वारा चुनी गई सेटिंग्स के आधार पर होंगे।
यदि आपके डेटासेट में 100 छवियां हैं और ट्रेन/वैलिड/टेस्ट विभाजन 70/20/10 है और आपने 3x ऑगमेंटेशन चुना है, तो आपके अंतिम डेटासेट में लगभग 210/20/10 का विभाजन होगा।

ऑगमेंटेशन विकल्प
रोबोफ्लो में ऑगमेंटेशन या तो "बेसिक" या "एन्हांस्ड" हो सकते हैं और दो अलग-अलग स्तरों पर लागू किए जा सकते हैं।
इमेज लेवल ऑगमेंटेशन
इमेज लेवल ऑगमेंटेशन पूरी छवि पर परिवर्तन लागू करके नया प्रशिक्षण डेटा बनाते हैं, न कि केवल व्यक्तिगत वस्तुओं या क्षेत्रों पर। पूरी छवि को संशोधित करके, डेवलपर्स दृश्य स्थितियों की एक विस्तृत श्रृंखला का अनुकरण कर सकते हैं, जिससे मॉडल नए डेटा पर बेहतर सामान्यीकरण सीख सकते हैं।
बाउंडिंग बॉक्स लेवल ऑगमेंटेशन
बाउंडिंग बॉक्स लेवल ऑगमेंटेशन केवल स्रोत छवि के बाउंडिंग बॉक्स की सामग्री को बदलकर नया प्रशिक्षण डेटा बनाते हैं। ऐसा करके, डेवलपर्स को अपने समस्या की स्थितियों के लिए अधिक उपयुक्त प्रशिक्षण डेटा बनाने पर अधिक नियंत्रण मिलता है।
एक 2019 का पेपर गूगल के शोधकर्ताओं द्वारा बाउंडिंग बॉक्स केवल ऑगमेंटेशन का उपयोग करके अपने मॉडलों के लिए इष्टतम डेटा बनाने का विचार प्रस्तुत किया गया है। इस पेपर में, शोधकर्ताओं ने दिखाया कि केवल बाउंडिंग बॉक्स में किए गए परिवर्तन प्रणालीगत सुधार लाते हैं, विशेष रूप से उन मॉडलों के लिए जिन्हें छोटे डेटासेट पर फिट किया गया था।
और जानें
Last updated
Was this helpful?