Deploy a Model or Workflow
जानें कि Roboflow पर प्रशिक्षित या अपलोड किए गए मॉडलों को कैसे deploy करें।
आप Roboflow पर प्रशिक्षित या अपलोड किए गए किसी भी मॉडल और किसी भी Workflow को Roboflow के deployment offerings के साथ तैनात (deploy) कर सकते हैं।
हमारी deployment offerings दो श्रेणियों में फिट होती हैं:
Managed Deployments: ये विकल्प Roboflow के क्लाउड इंफ्रास्ट्रक्चर का उपयोग करके आपके मॉडल चलाते हैं, जिससे आपको अपने स्वयं के हार्डवेयर या सॉफ्टवेयर का प्रबंधन करने की आवश्यकता नहीं होती।
Self-Hosted Deployments: ये विकल्प आपको अपने स्वयं के हार्डवेयर पर स्थानीय रूप से मॉडल तैनात करने की अनुमति देते हैं, जिससे आपके पर्यावरण और संसाधनों पर अधिक नियंत्रण मिलता है।
निम्न तालिका प्रत्येक deployment विकल्प की प्रमुख सुविधाओं, लाभों और सीमाओं का सारांश देती है:
GPU हार्डवेयर पर Roboflow के इंफ्रास्ट्रक्चर पर सीधे workflows और मॉडल चलाएं।
GPU मॉडल के लिए समर्थन।
संसाधनों पर सीमित नियंत्रण, मांग वाले अनुप्रयोगों के लिए या उच्च लोड के दौरान उच्च लेटेंसी की संभावनाएं
असीमित-स्केलेबल API के माध्यम से Roboflow के इंफ्रास्ट्रक्चर पर सीधे workflows और मॉडल चलाएं।
स्केलेबल, उपयोग में आसान, कोई इंफ्रास्ट्रक्चर प्रबंधन नहीं।
संसाधनों पर सीमित नियंत्रण, मांग वाले अनुप्रयोगों के लिए संभावित उच्च लेटेंसी।
workflows और मॉडल चलाने के लिए समर्पित GPUs और CPUs।
GPU मॉडल, Video Streaming, Custom Python Blocks के लिए समर्थन।
केवल US-आधारित डेटा सेंटर्स तक सीमित। Serverless API की तरह ऑटो-स्केलिंग नहीं है
चयनित workflow के साथ आपकी छवियों और वीडियो को संसाधित करने वाले प्रबंधित सर्वरों का पूल।
GPU समर्थन के साथ उच्च डेटा थ्रूपुट और लागत-प्रभावशीलता प्रदान करने वाला पूर्ण रूप से प्रबंधित समाधान, आपके डेटा वॉल्यूम के अनुसार सहज रूप से स्केलेबल।
नॉन-रीयल-टाइम प्रोसेसिंग और Custom Python Blocks के लिए समर्थन नहीं।
अपने स्वयं के हार्डवेयर पर लोकली Inference चलाएं।
संसाधनों और पर्यावरण पर पूरा नियंत्रण, संभावित रूप से कम लेटेंसी।
इंफ्रास्ट्रक्चर प्रबंधन और विशेषज्ञता की आवश्यकता होती है।
सही Deployment विकल्प चुनना
आपके लिए सबसे अच्छा deployment विकल्प आपकी विशिष्ट ज़रूरतों और आवश्यकताओं पर निर्भर करता है। निर्णय लेते समय निम्नलिखित कारकों पर विचार करें:
Scalability: यदि आपका एप्लिकेशन विभिन्न स्तरों के ट्रैफ़िक या डेटा वॉल्यूम को संभालने की आवश्यकता रखता है, तो serverless API वास्तविक-समय उपयोग मामलों के लिए उत्कृष्ट स्केलेबिलिटी प्रदान करता है; अन्यथा, Batch Processing एक सुझाया गया विकल्प है।
Latency: यदि आपको कम लेटेंसी या वीडियो प्रोसेसिंग की आवश्यकता है, तो dedicated deployments या शक्तिशाली हार्डवेयर वाले self-hosted deployments सबसे अच्छा विकल्प हो सकते हैं।
GPUs: यदि आपको ऐसे मॉडल चलाने की आवश्यकता है जिनके लिए GPU की आवश्यकता होती है (उदा. SAM2, CogVML, इत्यादि) तो आपको GPU मशीन प्रकार के साथ Dedicated Deployment का उपयोग करना होगा या ऐसे हार्डवेयर पर self hosted होना चाहिए जिनमें GPU उपलब्ध हों। (Serverless GPU API जल्द आ रहा है)
Control: Self-hosted deployments आपके पर्यावरण और संसाधनों पर सबसे अधिक नियंत्रण प्रदान करते हैं।
Expertise: Self-hosted deployments को सेटअप और प्रबंधित करने के लिए अधिक तकनीकी विशेषज्ञता की आवश्यकता होती है।
Last updated
Was this helpful?