# (Legacy) Serverless Hosted API

{% hint style="info" %}
हम **सिफारिश करते हैं** हमारे Serverless Hosted API के V2 का उपयोग करने के लिए। V2 API तेज़ है।\
\
[नई API के साथ शुरू करने के लिए Serverless Hosted API V2 दस्तावेज़ देखें।](https://docs.roboflow.com/roboflow/roboflow-hi/deploy/serverless-hosted-api-v2)
{% endhint %}

## मॉडल समर्थन

निम्नलिखित मॉडल प्रकार Serverless Hosted API (v1) द्वारा समर्थित हैं:

| कार्य प्रकार                                                                                                                        | Hosted API (v1) द्वारा समर्थित |
| ----------------------------------------------------------------------------------------------------------------------------------- | ------------------------------ |
| [ऑब्जेक्ट डिटेक्शन](https://docs.roboflow.com/roboflow/roboflow-hi/deploy/serverless/object-detection)                              | ✅                              |
| [क्लासीफिकेशन](https://docs.roboflow.com/roboflow/roboflow-hi/deploy/serverless/classification)                                     | ✅                              |
| [इन्स्टेंस सेगमेंटेशन](https://docs.roboflow.com/roboflow/roboflow-hi/deploy/serverless/instance-segmentation)                      | ✅                              |
| [सेमांटिक सेगमेंटेशन](https://docs.roboflow.com/roboflow/roboflow-hi/deploy/serverless/instance-segmentation/semantic-segmentation) | ✅                              |
| [कीपॉइंट डिटेक्शन](https://docs.roboflow.com/roboflow/roboflow-hi/deploy/serverless/keypoint-detection)                             | ✅                              |

## लेटेंसी तुलना (v1 बनाम v2)

Serverless Hosted API को भेजे गए अनुरोधों की end-to-end लेटेंसी कई कारकों पर निर्भर करती है:

1. मॉडल आर्किटेक्चर, जो निष्पादन समय को प्रभावित करता है
2. छवियों का आकार और रेज़ल्यूशन, जो अपलोड समय और निष्पादन के दौरान मॉडल इंफरेंस समय को प्रभावित करते हैं
3. नेटवर्क लेटेंसी और बैंडविड्थ, जो अनुरोध अपलोड समय और प्रतिक्रिया डाउनलोड समय को प्रभावित करते हैं।
4. किसी विशिष्ट समय पर सेवा सदस्यता और अन्य उपयोगकर्ताओं द्वारा उपयोग, जिससे कतारबद्ध होने की लेटेंसी हो सकती है

<figure><img src="https://2698615118-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2F-M6S9nPJhEX9FYH6clfW%2Fuploads%2FqMum7HkzyWoxLnOpbVGx%2Fserverless-img.png?alt=media&#x26;token=e075c90c-32a9-4691-9afc-54ec9831251b" alt=""><figcaption></figcaption></figure>

हम नीचे दी गई तालिका में v1 बनाम v2 Serverless Hosted API के कुछ प्रतिनिधि बेंचमार्क दिखाते हैं। यह दोनों end-to-end लेटेंसी (E2E) और निष्पादन समय (Exec) दिखाता है। ये संख्याएँ केवल जानकारी के लिए हैं, हम उपयोगकर्ताओं को प्रोत्साहित करते हैं कि वे अपने स्वयं के बेंचमार्क चलाएँ उपयोग करके [हमारे inference benchmark tools](https://inference.roboflow.com/inference_helpers/cli_commands/benchmark/) या उनके अपने कस्टम बेंचमार्क।

<table><thead><tr><th width="176.14410400390625">मॉडल</th><th>V2 (E2E)</th><th>V2 (Exec)</th><th>V1 (E2E)</th><th>V1 (Exec)</th></tr></thead><tbody><tr><td>yolov8x-640</td><td>401 ms</td><td>29 ms</td><td>4084 ms</td><td>821 ms</td></tr><tr><td>yolov8m-640</td><td>757 ms</td><td>21 ms</td><td>572 ms</td><td>265 ms</td></tr><tr><td>yolov8n-640</td><td>384 ms</td><td>17 ms</td><td>312 ms</td><td>63 ms</td></tr><tr><td>yolov8x-1280</td><td>483 ms</td><td>97 ms</td><td>6431 ms</td><td>3032 ms</td></tr><tr><td>yolov8m-1280</td><td>416 ms</td><td>52 ms</td><td>1841 ms</td><td>1006 ms</td></tr><tr><td>yolov8n-1280</td><td>428 ms</td><td>35 ms</td><td>464 ms</td><td>157 ms</td></tr></tbody></table>

हम उपयोगकर्ताओं को उनके मॉडल इंफरेंस और वर्कफ़्लो के लिए अपने स्वयं के बेंचमार्क चलाने के लिए प्रोत्साहित करते हैं ताकि उनके विशिष्ट उपयोग मामलों पर वास्तविक मेट्रिक्स प्राप्त हो सकें।

## सीमाएँ

Serverless Hosted API (v1), किसी भी विशिष्ट कार्य प्रकार से स्वतंत्र रूप से, 5MB तक की फाइलें स्वीकार करता है। यह सीमा, लेकिन केवल इन्हीं तक सीमित नहीं, image फ़ाइल आकार और किसी भी संलग्न अनुरोध जानकारी को शामिल करती है।

{% hint style="info" %}
यदि अनुरोध बहुत बड़े हैं, तो हम किसी भी संलग्न छवि का आकार कम करने की सिफारिश करते हैं। आम तौर पर ontvangst पर हमारी सर्वरों पर प्राप्त होने के बाद छवियों को मॉडल आर्किटेक्चर के स्वीकार किए गए इनपुट आकार में डाउनसाइज़ किया जाता है, इसलिए यह खराब प्रदर्शन का कारण नहीं बनता।\
\
हमारे कुछ SDKs, जैसे Python SDK, स्वचालित रूप से छवियों को API पर भेजने से पहले मॉडल आर्किटेक्चर के इनपुट आकार में डाउनसाइज़ कर देते हैं।
{% endhint %}
