Dataset विश्लेषण
अपने dataset की गुणवत्ता का आकलन और सुधार करें।
Dataset Analytics एक प्रोजेक्ट से संबंधित dataset के बारे में विभिन्न आँकड़े दिखाता है। आप निम्न जानकारी देख सकते हैं:
आपके dataset में छवियों की संख्या;
annotations की संख्या;
औसत छवि आकार;
मध्य छवि अनुपात;
गायब annotations की संख्या;
null annotations की संख्या;
आपके dataset में छवियों के आयाम;
ऑब्जेक्ट काउंट हिस्टोग्राम, और;
annotations के स्थानों का हीटमैप।
Dataset Analytics का उपयोग करके, आप अपने dataset के बारे में कई तरह की अंतर्दृष्टियाँ निकाल सकते हैं। उदाहरण के लिए, यदि आपके पास कोई null annotations नहीं हैं, तो आप उस प्रोजेक्ट के आधार पर कुछ जोड़ने पर विचार कर सकते हैं; यदि कुछ छवियों में annotations गायब हैं, तो आप आवश्यक annotations जोड़ने के लिए गहराई से जांच कर सकते हैं।
किसी प्रोजेक्ट के लिए Dataset Analytics देखने के लिए, प्रोजेक्ट की बायीँ साइडबार में "Analytics" पर क्लिक करें:

इसके बाद Dataset Analytics टैब खुल जाएगा:

इस पृष्ठ पर, आप देख सकते हैं:
आपके train, test, और valid datasets में छवियों में कक्षाओं (classes) की संख्या का विभाजन।
आपके dataset में छवियों के आकारों और aspect ratios का एक अवलोकन।
एक हीटमैप जो दिखाता है कि आपकी अधिकांश annotations कहाँ हैं।
एक हिस्टोग्राम जो दिखाता है कि आपके dataset की प्रत्येक छवि में कितनी कक्षाएँ annotated हैं।
Dimension Insights
Dimension Insights अनुभाग आपके dataset में कच्ची (raw) छवियों के आकारों और aspect ratios का वर्णन करता है।
यदि आप प्रोजेक्ट वर्जन बनाते समय Resize augmentation लागू करते हैं — जिसे हम लगभग सभी उपयोग मामलों के लिए कड़ाई से सुझाते हैं — तो आपकी वर्जन में छवियाँ resize होंगी, लेकिन raw छवियाँ अपरिवर्तित रहेंगी।

Annotation Heat Map
जब आप कोई मॉडल train कर रहे होते हैं, तो यह महत्वपूर्ण है कि आपका dataset उस वातावरण का प्रतिनिधित्व करता हो जिसमें आपका मॉडल deploy होगा।
यदि आपका मॉडल ऐसे वातावरण में deploy होगा जहाँ annotations कैमरा फ्रेम के किसी भी हिस्से में दिखाई दे सकती हैं — उदाहरण के लिए, एक फैक्ट्री लाइन जहाँ अलग-अलग आकार के ऑब्जेक्ट रीयल-टाइम में चलते हैं, या फ़ोन से किसी ऑब्जेक्ट की ली गई छवि — तो यह ज़रूरी है कि आप उन ऑब्जेक्ट्स को इसी तरह annotate करें जो छवियों में अलग-अलग स्थानों पर दिखाई देते हैं।
छवि के विभिन्न हिस्सों में ऑब्जेक्ट्स को लेबल करने से सुनिश्चित होगा कि आपका मॉडल केवल विशिष्ट स्थानों में ऑब्जेक्ट्स पहचानना ही न सीख ले (overfit न हो)।
Annotation Heat Map दिखाता है कि छवियों में कहाँ अधिक या कम annotations हैं। इसे उस स्थिति की पहचान करने के लिए उपयोग किया जा सकता है जहाँ आपके dataset की annotations किसी विशेष स्थान पर बहुत सघन हैं।

Heat Map में किसी क्षेत्र पर ड्रैग करके आप चुने हुए रेंज की छवियाँ देख सकते हैं:

Histogram of Object Count by Image
यह आपको दिखाता है कि प्रत्येक छवि में कितने annotated ऑब्जेक्ट्स दिखाई देते हैं का वितरण कैसा है।
यदि उन छवियों में जिन पर आप अपने मॉडल को चलाएँगे किसी ऑब्जेक्ट के एक से अधिक इंस्टेंस हो सकते हैं, तो हम सलाह देते हैं कि आपका dataset भिन्न संख्या में ऑब्जेक्ट इंस्टेंस वाली छवियाँ शामिल करे। इससे यह मदद मिलेगी कि आपका मॉडल शून्य, एक, या कई रुचिकर ऑब्जेक्ट्स वाली छवियों पर अच्छी तरह सामान्यीकृत कर सके।
यहाँ एक हिस्टोग्राम का उदाहरण दिया गया है:

आप दिए गए काउंट वाली छवियाँ देखने के लिए हिस्टोग्राम पर किसी भी बार का चयन कर सकते हैं:

Last updated
Was this helpful?