# Trained Models का मूल्यांकन करें

मॉडल मूल्यांकन दिखाते हैं:

1. एक production metrics explorer, जो आपको वह optimal confidence threshold खोजने में मदद करता है जिस पर आप अपना मॉडल चला सकते हैं;
2. मॉडल सुधार अनुशंसाएँ, जो इस बारे में सुझाव देती हैं कि आप अपने मॉडल की accuracy कैसे बढ़ा सकते हैं;
3. class के अनुसार performance, जो दिखाती है कि आपका मॉडल विभिन्न classes की पहचान कितनी अच्छी तरह करता है;
4. एक confusion matrix, जिसका उपयोग आप उन specific classes को खोजने के लिए कर सकते हैं जिनमें आपका मॉडल अच्छा करता है और जिनमें उसे संघर्ष होता है, और;
5. एक interactive vector explorer, जो आपको images के उन clusters की पहचान करने देता है जहाँ आपका मॉडल अच्छा या खराब करता है;

आप अपने मॉडल के लिए सुधार के क्षेत्रों की पहचान करने के लिए model evaluation का उपयोग कर सकते हैं.

Paid users द्वारा Roboflow में trained on, या uploaded किए गए सभी versioned models के लिए model evaluations automatically run किए जाते हैं। कुछ सौ images वाले dataset के लिए evaluation चलने में कई मिनट लग सकते हैं, और हज़ारों या उससे अधिक images वाले बड़े datasets के लिए कई घंटे लग सकते हैं।

### Model Evaluation खोलें

अपने मॉडल के लिए confusion matrix और vector explorer खोजने के लिए, अपने project में किसी भी trained model version को खोलें। फिर, "View Evaluation" button पर click करें:

<figure><img src="/files/d19d702b435278edd8ab44e2b34bb4e4b50eaf62" alt=""><figcaption></figcaption></figure>

एक window खुलेगी जहाँ आप अपनी confusion matrix और vector analysis देख सकते हैं.

### Production Metrics Explorer

production metrics explorer आपके मॉडल के लिए सभी संभव confidence thresholds पर Precision, Recall, और F1 score दिखाता है। यह जानकारी एक graph पर प्रस्तुत की जाती है।

इन statistics का उपयोग करके, production metrics explorer एक "optimal confidence" की अनुशंसा करेगा। यह वह threshold है जो आपको Precision/Recall/F1 Score का सबसे अच्छा trade-off देगा।

एक बार model evaluation पूरा हो जाने पर, optimal confidence threshold आपके मॉडल के inference requests के लिए default के रूप में automatically लागू हो जाता है। यदि per-class thresholds उपलब्ध हैं, तो वे भी लागू किए जाते हैं, और किसी भी class के लिए जिसका अपना value नहीं है, global threshold fallback के रूप में उपयोग होता है.

आप फिर भी किसी individual inference request पर confidence threshold override कर सकते हैं, इसके लिए `confidence` parameter को explicitly पास करें।

<figure><img src="/files/3950d04a2251eacbe5a3209211f8266e45569b20" alt=""><figcaption></figcaption></figure>

आप slider को drag करके अलग-अलग confidence thresholds पर F1/Precision/Recall values देख सकते हैं:

<figure><img src="/files/b07ede186f569ca1d97d07d8b17521407c79ed30" alt=""><figcaption></figcaption></figure>

### Model Improvement Recommendations

आपके model evaluation का model improvement recommendations section इस बारे में सुझाव सूचीबद्ध करता है कि आप अपने मॉडल की accuracy कैसे बढ़ा सकते हैं। ये सुधार आपके model के साथ calculated confusion matrix के results पर आधारित होते हैं। (इस पृष्ठ पर आगे अपनी confusion matrix के बारे में अधिक जानकारी देखें).

model improvement recommendations feature निम्न से संबंधित सुझाव दे सकता है:

* ऐसे model को कैसे सुधारें जो बहुत सारे false negatives predict करता है।
* ऐसे model को कैसे सुधारें जो बहुत सारे false positives predict करता है।
* कौन-सी classes अक्सर confused (गलत पहचानी) जाती हैं।
* कौन-सी classes को accuracy सुधारने के लिए अधिक data की आवश्यकता है।
* जब test या validation set बहुत छोटा हो सकता है।
* और भी.

<figure><img src="/files/8f681dec82adc1273ddb3cd5fc9793ef6d94b243" alt=""><figcaption></figcaption></figure>

### Performance by Class

performance by class chart दिखाता है कि आपके dataset की सभी classes में कितनी सही predictions, misclassifications, false negatives, और false positives हैं।

आप इस जानकारी का उपयोग एक नज़र में यह देखने के लिए कर सकते हैं कि आपका मॉडल किन classes को अच्छी तरह पहचान सकता है और किन classes की पहचान करने में हमारा model संघर्ष करता है।

<figure><img src="/files/5ce7c00a360627eda210d2a5b6db14eda14e1d6d" alt=""><figcaption></figcaption></figure>

यदि आपके dataset में classes की संख्या बहुत अधिक है, तो आप "All Classes" dropdown खोलकर और जिन classes को आप highlight करना चाहते हैं उन्हें चुनकर chart को specific classes पर focus कर सकते हैं:

<figure><img src="/files/7182f2ef853e5eb27befd49c378131378b2f8c92" alt=""><figcaption></figcaption></figure>

आप Confidence Threshold slider को move करके यह भी देख सकते हैं कि अलग-अलग confidence thresholds पर यह chart कैसे बदलता है:

<figure><img src="/files/c34d186e521c3b796185643699a21c7fd0d5ef60" alt=""><figcaption></figcaption></figure>

डिफ़ॉल्ट रूप से, यह chart उस optimal confidence threshold का उपयोग करेगा जिसकी हम अनुशंसा करते हैं।

### Confusion Matrix

आपकी confusion matrix दिखाती है कि आपका मॉडल विभिन्न classes पर कितना अच्छा प्रदर्शन करता है।

आपकी confusion matrix आपके test और validation sets की images को आपके trained model के साथ चलाकर calculated की जाती है। फिर आपके model के results की तुलना आपके dataset annotations से "ground truth" के साथ की जाती है।

confusion matrix tool के साथ, आप पहचान सकते हैं:

* वे classes जहाँ आपका model अच्छा प्रदर्शन करता है।
* वे classes जहाँ आपका model किसी object के लिए गलत class पहचानता है (false positives)।
* वे instances जहाँ आपका model किसी object की पहचान करता है जबकि ground truth data में वहाँ कोई object मौजूद नहीं होता (false negatives)।

यहाँ एक उदाहरण confusion matrix है:

<figure><img src="/files/f890564655cb8d718c9f75de09910fa157e39e91" alt=""><figcaption></figcaption></figure>

यदि आपका model कई classes detect करता है, तो scroll bars दिखाई देंगी जो आपको अपनी confusion matrix में navigate करने देंगी।

डिफ़ॉल्ट रूप से, confusion matrix यह दिखाती है कि आपका model तब कैसा प्रदर्शन करता है जब उसे आपके model के लिए calculated optimal threshold पर चलाया जाता है।

आप Confidence Threshold slider का उपयोग करके confidence threshold समायोजित कर सकते हैं। जैसे-जैसे आप slider configure करेंगे, आपकी confusion matrix, precision, और recall update होंगे:

<figure><img src="/files/f111576e4673e92717ebeaae52fd1294097c322c" alt=""><figcaption></figcaption></figure>

आप confusion matrix में प्रत्येक box पर click करके देख सकते हैं कि संबंधित category में कौन-सी images दिखाई देती हैं।

उदाहरण के लिए, आप "False Positive" column में किसी भी box पर click करके उन images की पहचान कर सकते हैं जहाँ ground truth data में वस्तु मौजूद न होने पर भी वस्तु की पहचान की गई थी।

<figure><img src="/files/e46d724107a4d36cc0f1eeb791bafe70b1041f32" alt=""><figcaption></figcaption></figure>

आप किसी individual image पर click करके एक interactive view में प्रवेश कर सकते हैं, जहाँ आप ground truth (आपकी annotations) और model predictions के बीच toggle कर सकते हैं:

<figure><img src="/files/bff592e7c8ff325b82cae2c8f45f96a8c9cb70c2" alt=""><figcaption></figcaption></figure>

अपनी annotations देखने के लिए "Ground Truth" पर click करें और आपका model क्या लौटाता है यह देखने के लिए "Model Predictions" पर click करें।


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.roboflow.com/roboflow/roboflow-hi/train/evaluate-trained-models.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
