Deploy a Model or Workflow

Roboflow पर प्रशिक्षित या अपलोड किए गए मॉडलों को तैनात करने के बारे में जानें।

आप Roboflow पर प्रशिक्षित या अपलोड किए गए किसी भी मॉडल और किसी भी Workflow को Roboflow के deployment ऑफ़रिंग्स के साथ deploy कर सकते हैं।

हमारे deployment ऑफ़रिंग्स दो श्रेणियों में फिट होते हैं:

  • Managed Deployments: ये विकल्प आपके मॉडल चलाने के लिए Roboflow के क्लाउड इन्फ्रास्ट्रक्चर का उपयोग करते हैं, जिससे आपको अपनी हार्डवेयर या सॉफ़्टवेयर का प्रबंधन करने की आवश्यकता नहीं रहती।

  • Self-Hosted Deployments: ये विकल्प आपको अपने स्वयं के हार्डवेयर पर स्थानीय रूप से मॉडल deploy करने की अनुमति देते हैं, जिससे आपके पर्यावरण और संसाधनों पर अधिक नियंत्रण मिलता है।

निम्न तालिका प्रत्येक deployment विकल्प की प्रमुख विशेषताओं, लाभों और सीमाओं का सारांश प्रस्तुत करती है:

Deployment Option
Description
लाभ
सीमाएँ

Roboflow के इन्फ्रास्ट्रक्चर पर GPU हार्डवेयर पर सीधे workflows और मॉडल चलाएँ।

GPU मॉडल्स के लिए समर्थन।

संसाधनों पर सीमित नियंत्रण, मांग वाली एप्लिकेशन के लिए या उच्च लोड के दौरान उच्च latency की संभावना

एक अनंत-स्केलेबल API के माध्यम से Roboflow के इन्फ्रास्ट्रक्चर पर सीधे workflows और मॉडल चलाएँ।

स्केलेबल, उपयोग में आसान, कोई इन्फ्रास्ट्रक्चर प्रबंधन नहीं।

संसाधनों पर सीमित नियंत्रण, मांग वाली एप्लिकेशन के लिए उच्च latency की संभावना।

Workflows और मॉडल चलाने के लिए समर्पित GPUs और CPUs।

GPU मॉडल्स, Video Streaming, Custom Python Blocks के लिए समर्थन।

केवल US-आधारित डेटा सेंटर्स तक सीमित। Serverless API की तरह ऑटो-स्केलिंग नहीं है

Batch Processing

चयनित workflow के साथ आपकी छवियों और वीडियो को प्रोसेस करने के लिए प्रबंधित सर्वरों का पूल।

पूर्ण रूप से प्रबंधित समाधान जो उच्च डेटा थ्रूपुट और लागत-कुशलता प्रदान करता है, GPU समर्थन के साथ आपके डेटा वॉल्यूम के अनुसार सहज रूप से स्केलेबल।

नॉन-रियल-टाइम प्रोसेसिंग और Custom Python Blocks के लिए समर्थन नहीं।

Self-Hosted Deployments

अपने स्वयं के हार्डवेयर पर स्थानीय रूप से Inference चलाएँ।

संसाधनों और पर्यावरण पर पूर्ण नियंत्रण, संभावित रूप से कम latency।

इन्फ्रास्ट्रक्चर प्रबंधन और विशेषज्ञता की आवश्यकता होती है।

मॉडल्स को deploy करना हमेशा credits, की खपत करता है, चाहे कोई भी विधि चुनी जाए।

Inference क्या है?

कंप्यूटर विज़न में, inference का अर्थ है प्रशिक्षित मॉडल का उपयोग करके नई छवियों या वीडियो का विश्लेषण करना और भविष्यवाणियाँ करना। उदाहरण के लिए, एक object detection मॉडल का उपयोग वीडियो स्ट्रीम में वस्तुओं की पहचान और स्थान निर्धारित करने के लिए किया जा सकता है, या एक classification मॉडल का उपयोग छवियों को उनकी सामग्री के आधार पर श्रेणीबद्ध करने के लिए किया जा सकता है।

Roboflow Inference is an open-source project that provides a powerful and flexible framework for deploying computer vision models and workflows. It is s the engine that powers most of Roboflows managed deployment services. You can also self host it or use it to deploy your vision workflows to edge devices. Roboflow Inference offers a range of features and capabilities, including:

  • विभिन्न मॉडल आर्किटेक्चर और कार्यों के लिए समर्थन, जिनमें object detection, classification, instance segmentation, और अधिक शामिल हैं।

  • Workflows, जो आपको مختلف मॉडल्स, प्री-बिल्ट लॉजिक, और बाहरी अनुप्रयोगों को जोड़कर कंप्यूटर विज़न एप्लिकेशन बनाने देते हैं, और सैकड़ों Building Blocks में से चुनने का विकल्प प्रदान करते हैं।

  • विभिन्न डिवाइसों पर अनुकूलित प्रदर्शन के लिए हार्डवेयर त्वरण, जिनमें CPUs, GPUs, और NVIDIA Jetson जैसे edge डिवाइस शामिल हैं।

  • संसाधनों के कुशल उपयोग के लिए multiprocessing।

  • वीडियो स्ट्रीम्स की सहज प्रोसेसिंग के लिए वीडियो डिकोडिंग।

  • डिप्लॉयमेंट को सरल बनाने के लिए HTTP इंटरफ़ेस, APIs और docker इमेजेज़

  • Roboflow के होस्टेड deployment विकल्पों और Roboflow प्लेटफ़ॉर्म के साथ एकीकरण।

Workflow क्या है?

Workflows आपको विभिन्न मॉडल्स, प्री-बिल्ट लॉजिक, और बाहरी अनुप्रयोगों को जोड़कर जटिल कंप्यूटर विज़न एप्लिकेशन बनाने में सक्षम बनाते हैं। वे परिष्कृत कंप्यूटर विज़न पाइपलाइनों के डिज़ाइन और डिप्लॉयमेंट के लिए एक विज़ुअल, कम-कोड वातावरण प्रदान करते हैं।

Workflows के साथ, आप कर सकते हैं:

  • जटिल कार्य करने के लिए कई मॉडलों को एक साथ chain करना।

  • अपने अनुप्रयोगों में कस्टम लॉजिक और निर्णय-निर्माण जोड़ें।

  • बाहरी सिस्टम और APIs के साथ एकीकृत करें।

  • छवियों और वीडियो में वस्तुओं को ट्रैक, गिनती, समय निर्धारण, माप और विज़ुअलाइज़ करें।

सही Deployment विकल्प चुनना

आपके उपयोग के मामले के लिए सर्वश्रेष्ठ deployment विधि कैसे चुनें इस पर एक शानदार गाइड inference getting started guide में उपलब्ध है: https://inference.roboflow.com/start/getting-started/

आपके लिए सबसे अच्छा deployment विकल्प आपकी विशिष्ट आवश्यकताओं और मांगों पर निर्भर करता है। निर्णय लेते समय निम्नलिखित कारकों पर विचार करें:

  • स्केलेबिलिटी: यदि आपका अनुप्रयोग ट्रैफ़िक या डेटा वॉल्यूम के विभिन्न स्तरों को संभालने की आवश्यकता है, तो serverless API रियल-टाइम उपयोग-मामलों के लिए उत्कृष्ट स्केलेबिलिटी प्रदान करता है; अन्यथा, Batch Processing is a suggested option.

  • Latency: यदि आपको कम latency या वीडियो प्रोसेसिंग की आवश्यकता है, तो समर्पित deployments या शक्तिशाली हार्डवेयर वाले self-hosted deployments सबसे अच्छा विकल्प हो सकते हैं।

  • GPUs: यदि आपको ऐसे मॉडल चलाने हैं जिन्हें GPU की आवश्यकता है (उदाहरण के लिए SAM2, CogVML, आदि) तो आपको GPU मशीन प्रकार के साथ Dedicated Deployment का उपयोग करना होगा या ऐसे हार्डवेयर पर self hosted करना होगा जिनमें GPUs उपलब्ध हों। (Serverless GPU API शीघ्र आ रहा है)

  • Control: Self-hosted deployments आपके पर्यावरण और संसाधनों पर सबसे अधिक नियंत्रण प्रदान करते हैं।

  • Expertise: Self-hosted deployments को सेट अप और प्रबंधित करने के लिए अधिक तकनीकी विशेषज्ञता की आवश्यकता होती है।

Last updated

Was this helpful?