Deploy a Model or Workflow

जानें कि Roboflow पर प्रशिक्षित या अपलोड किए गए मॉडलों को कैसे deploy करें।

आप Roboflow पर प्रशिक्षित या अपलोड किए गए किसी भी मॉडल और किसी भी Workflow को Roboflow के deployment offerings के साथ तैनात (deploy) कर सकते हैं।

हमारी deployment offerings दो श्रेणियों में फिट होती हैं:

  • Managed Deployments: ये विकल्प Roboflow के क्लाउड इंफ्रास्ट्रक्चर का उपयोग करके आपके मॉडल चलाते हैं, जिससे आपको अपने स्वयं के हार्डवेयर या सॉफ्टवेयर का प्रबंधन करने की आवश्यकता नहीं होती।

  • Self-Hosted Deploymentsarrow-up-right: ये विकल्प आपको अपने स्वयं के हार्डवेयर पर स्थानीय रूप से मॉडल तैनात करने की अनुमति देते हैं, जिससे आपके पर्यावरण और संसाधनों पर अधिक नियंत्रण मिलता है।

निम्न तालिका प्रत्येक deployment विकल्प की प्रमुख सुविधाओं, लाभों और सीमाओं का सारांश देती है:

Deployment Option
Description
Benefits
Limitations

GPU हार्डवेयर पर Roboflow के इंफ्रास्ट्रक्चर पर सीधे workflows और मॉडल चलाएं।

GPU मॉडल के लिए समर्थन।

संसाधनों पर सीमित नियंत्रण, मांग वाले अनुप्रयोगों के लिए या उच्च लोड के दौरान उच्च लेटेंसी की संभावनाएं

असीमित-स्केलेबल API के माध्यम से Roboflow के इंफ्रास्ट्रक्चर पर सीधे workflows और मॉडल चलाएं।

स्केलेबल, उपयोग में आसान, कोई इंफ्रास्ट्रक्चर प्रबंधन नहीं।

संसाधनों पर सीमित नियंत्रण, मांग वाले अनुप्रयोगों के लिए संभावित उच्च लेटेंसी।

workflows और मॉडल चलाने के लिए समर्पित GPUs और CPUs।

GPU मॉडल, Video Streaming, Custom Python Blocks के लिए समर्थन।

केवल US-आधारित डेटा सेंटर्स तक सीमित। Serverless API की तरह ऑटो-स्केलिंग नहीं है

चयनित workflow के साथ आपकी छवियों और वीडियो को संसाधित करने वाले प्रबंधित सर्वरों का पूल।

GPU समर्थन के साथ उच्च डेटा थ्रूपुट और लागत-प्रभावशीलता प्रदान करने वाला पूर्ण रूप से प्रबंधित समाधान, आपके डेटा वॉल्यूम के अनुसार सहज रूप से स्केलेबल।

नॉन-रीयल-टाइम प्रोसेसिंग और Custom Python Blocks के लिए समर्थन नहीं।

अपने स्वयं के हार्डवेयर पर लोकली Inference चलाएं।

संसाधनों और पर्यावरण पर पूरा नियंत्रण, संभावित रूप से कम लेटेंसी।

इंफ्रास्ट्रक्चर प्रबंधन और विशेषज्ञता की आवश्यकता होती है।

circle-info

मॉडल तैनात करने पर हमेशा credits, की खपत होती है, चाहे कोई भी विधि चुनी जाए।

chevron-rightInference क्या है?hashtag
circle-info

कंप्यूटर विज़न में, inference का तात्पर्य प्रशिक्षित मॉडल का उपयोग करके नई छवियों या वीडियो का विश्लेषण करने और भविष्यवाणियाँ करने की प्रक्रिया से है। उदाहरण के लिए, एक object detection मॉडल का उपयोग वीडियो स्ट्रीम में वस्तुओं की पहचान और स्थान निर्धारित करने के लिए किया जा सकता है, या एक classification मॉडल का उपयोग छवियों को उनके कंटेंट के आधार पर वर्गीकृत करने के लिए किया जा सकता है।

Roboflow Inferencearrow-up-right एक open-source प्रोजेक्ट है जो कंप्यूटर विज़न मॉडल और workflows तैनात करने के लिए एक शक्तिशाली और लचीला फ्रेमवर्क प्रदान करता है। यह वह इंजन है जो Roboflow के अधिकांश managed deployment सेवाओं को चलाता है। आप इसे self host भी कर सकते हैं या अपने vision workflows को edge devices पर तैनात करने के लिए उपयोग कर सकते हैं। Roboflow Inference कई सुविधाएँ और क्षमताएँ प्रदान करता है, जिनमें शामिल हैं:

  • विभिन्न मॉडल आर्किटेक्चर और कार्यों के लिए समर्थन, जिसमें object detection, classification, instance segmentation और अन्य शामिल हैं।

  • Workflows, जो आपको सैकड़ों बिल्डिंग Blocks में से चुनकर विभिन्न मॉडल, पूर्व-निर्मित लॉजिक और बाहरी एप्लिकेशनों को जोड़कर कंप्यूटर विज़न अनुप्रयोग बनाने देते हैं।

  • विभिन्न डिवाइसों पर अनुकूलित प्रदर्शन के लिए हार्डवेयर एक्सेलेरेशन, जिसमें CPUs, GPUs और NVIDIA Jetson जैसे edge डिवाइस शामिल हैं।

  • संसाधनों के कुशल उपयोग के लिए multiprocessing।

  • वीडियो स्ट्रीम्स की निर्बाध प्रोसेसिंग के लिए वीडियो डिकोडिंग।

  • तैनाती को सरल बनाने के लिए HTTP इंटरफ़ेस, APIs और docker images

  • Roboflow के hosted deployment विकल्पों और Roboflow प्लेटफ़ॉर्म के साथ एकीकरण।

chevron-rightWorkflow क्या है?hashtag

Workflowsarrow-up-right आपको विभिन्न मॉडल, पूर्व-निर्मित लॉजिक और बाहरी एप्लिकेशनों को जोड़कर जटिल कंप्यूटर विज़न अनुप्रयोग बनाने में सक्षम करते हैं। वे परिष्कृत कंप्यूटर विज़न पाइपलाइनों को डिज़ाइन और तैनात करने के लिए एक दृश्य, लो-कोड वातावरण प्रदान करते हैं।

Workflows के साथ, आप कर सकते हैं:

  • जटिल कार्यों को करने के लिए कई मॉडलों को एक साथ चेन करें।

  • अपने अनुप्रयोगों में कस्टम लॉजिक और निर्णय-निर्माण जोड़ें।

  • बाहरी सिस्टम और APIs के साथ एकीकृत करें।

  • छवियों और वीडियो में ऑब्जेक्ट्स को ट्रैक, गिनती, समय, माप और विज़ुअलाइज़ करें।

सही Deployment विकल्प चुनना

circle-info

आपके उपयोग के मामले के लिए सबसे अच्छा deployment तरीका कैसे चुनें इस पर एक शानदार गाइड inference getting started guide में है: https://inference.roboflow.com/start/getting-started/arrow-up-right

आपके लिए सबसे अच्छा deployment विकल्प आपकी विशिष्ट ज़रूरतों और आवश्यकताओं पर निर्भर करता है। निर्णय लेते समय निम्नलिखित कारकों पर विचार करें:

  • Scalability: यदि आपका एप्लिकेशन विभिन्न स्तरों के ट्रैफ़िक या डेटा वॉल्यूम को संभालने की आवश्यकता रखता है, तो serverless API वास्तविक-समय उपयोग मामलों के लिए उत्कृष्ट स्केलेबिलिटी प्रदान करता है; अन्यथा, Batch Processing एक सुझाया गया विकल्प है।

  • Latency: यदि आपको कम लेटेंसी या वीडियो प्रोसेसिंग की आवश्यकता है, तो dedicated deployments या शक्तिशाली हार्डवेयर वाले self-hosted deployments सबसे अच्छा विकल्प हो सकते हैं।

  • GPUs: यदि आपको ऐसे मॉडल चलाने की आवश्यकता है जिनके लिए GPU की आवश्यकता होती है (उदा. SAM2, CogVML, इत्यादि) तो आपको GPU मशीन प्रकार के साथ Dedicated Deployment का उपयोग करना होगा या ऐसे हार्डवेयर पर self hosted होना चाहिए जिनमें GPU उपलब्ध हों। (Serverless GPU API जल्द आ रहा है)

  • Control: Self-hosted deployments आपके पर्यावरण और संसाधनों पर सबसे अधिक नियंत्रण प्रदान करते हैं।

  • Expertise: Self-hosted deployments को सेटअप और प्रबंधित करने के लिए अधिक तकनीकी विशेषज्ञता की आवश्यकता होती है।

Last updated

Was this helpful?