For the complete documentation index, see llms.txt. This page is also available as Markdown.

Dataset Health Check

अपने dataset की quality का आकलन करें और उसे बेहतर बनाएं।

Dataset Health Check किसी प्रोजेक्ट से जुड़े dataset के बारे में विभिन्न आँकड़े दिखाता है। आप निम्न जानकारी देख सकते हैं:

  • आपके dataset में images की संख्या;

  • annotations की संख्या;

  • औसत image size;

  • मध्यिका image ratio;

  • missing annotations की संख्या;

  • null annotations की संख्या;

  • आपके dataset में image dimensions;

  • Object count histogram, और;

  • annotation locations का heatmap.

Dataset Health Check का उपयोग करके, आप अपने dataset के बारे में कई तरह की insights निकाल सकते हैं। उदाहरण के लिए, यदि आपके पास कोई null annotations नहीं हैं, तो आप जिस project पर काम कर रहे हैं उसके आधार पर कुछ जोड़ने पर विचार कर सकते हैं; यदि ऐसी images हैं जिनमें missing annotations हैं, तो आप आवश्यक annotations जोड़ने के लिए गहराई से जाँच कर सकते हैं.

किसी project के लिए Health Check देखने के लिए, Dataset page खोलें और "Health Check" tab पर क्लिक करें:

इसके बाद Health Check tab खुल जाएगा:

इस page पर, आप देख सकते हैं:

  • आपके train, test, और valid datasets की images में classes की संख्या का breakdown.

  • आपके dataset में images के sizes और aspect ratios का overview.

  • एक heatmap जो दिखाता है कि आपकी अधिकांश annotations कहाँ हैं.

  • एक histogram जो दिखाता है कि आपके dataset की हर image में कितनी classes annotated हैं.

Dimension Insights

Dimension Insights section आपके dataset की raw images के sizes और aspect ratios का वर्णन करता है.

यदि आप कोई project version बनाते समय Resize augmentation लागू करते हैं — जिसकी हम लगभग सभी use cases के लिए दृढ़ता से अनुशंसा करते हैं — तो आपके version की images का आकार बदला जाएगा, लेकिन raw images वही रहेंगी.

Annotation Heat Map

जब आप model train कर रहे होते हैं, तो यह महत्वपूर्ण है कि आपका dataset उन परिस्थितियों का प्रतिनिधि हो जिनमें आपका model deploy किया जाएगा.

यदि आपका model ऐसे environment में deploy किया जाएगा जहाँ annotations camera frame में कहीं भी दिखाई दे सकते हैं — उदाहरण के लिए, एक factory line पर जहाँ अलग-अलग sizes की objects real time में moving हैं, या phone पर ली गई किसी object की image में — तो यह महत्वपूर्ण है कि आप ऐसी objects को annotate करें जो image में अलग-अलग जगहों पर दिखाई देती हैं.

image के अलग-अलग हिस्सों में objects को label करने से यह सुनिश्चित होगा कि आपका model केवल विशिष्ट स्थानों पर objects की पहचान करना सीखने तक overfit न हो.

Annotation Heat Map दिखाता है कि images में annotations कहाँ अधिक या कम हैं। इसका उपयोग उन scenarios की पहचान करने के लिए किया जा सकता है जहाँ आपके dataset की annotations किसी विशेष स्थान पर बहुत अधिक concentrated हैं.

आप Heat Map में किसी area पर drag करके चुनी हुई range में images देख सकते हैं:

Image के अनुसार Object Count का Histogram

यह आपको दिखाता है कि हर image में कितनी annotated objects दिखाई देती हैं, इसका वितरण.

यदि आपके model से pass होने वाली images में किसी object की multiple instances हो सकती हैं, तो हम अनुशंसा करते हैं कि आपका dataset ऐसी images शामिल करे जिनमें object instances की अलग-अलग संख्याएँ हों। इससे यह सुनिश्चित करने में मदद मिलेगी कि आपका model बिना, एक, या कई रुचिकर objects वाली images पर अच्छी तरह generalise कर सके.

यहाँ histogram का एक example है:

आप histogram पर किसी भी bar को चुनकर दी गई count वाली images देख सकते हैं:

अंतिम अपडेट

क्या यह उपयोगी था?