मॉडल या वर्कफ़्लो तैनात करें
जानें कि रोबोफ्लो पर प्रशिक्षित या अपलोड किए गए मॉडल्स को कैसे तैनात करें।
आप Roboflow पर प्रशिक्षित या अपलोड किए गए किसी भी मॉडल और किसी भी Workflow को Roboflow की डिप्लॉयमेंट सेवाओं के साथ डिप्लॉय कर सकते हैं।
हमारी डिप्लॉयमेंट सेवाएँ दो श्रेणियों में आती हैं:
Managed Deployments: ये विकल्प आपके मॉडल चलाने के लिए Roboflow की क्लाउड इंफ्रास्ट्रक्चर का उपयोग करते हैं, जिससे आपको अपना हार्डवेयर या सॉफ़्टवेयर प्रबंधित करने की आवश्यकता नहीं होती।
Self-Hosted Deployments: ये विकल्प आपको अपने हार्डवेयर पर स्थानीय रूप से मॉडल डिप्लॉय करने की अनुमति देते हैं, जिससे आपको अपने वातावरण और संसाधनों पर अधिक नियंत्रण मिलता है।
निम्नलिखित तालिका प्रत्येक डिप्लॉयमेंट विकल्प की प्रमुख विशेषताओं, लाभों और सीमाओं का सारांश प्रस्तुत करती है:
Workflow और मॉडल्स को सीधे Roboflow की इंफ्रास्ट्रक्चर पर GPU हार्डवेयर के साथ चलाएँ।
GPU मॉडल्स के लिए समर्थन।
संसाधनों पर सीमित नियंत्रण, मांग वाले अनुप्रयोगों या उच्च लोड की अवधि के दौरान अधिक लेटेंसी की संभावना
Workflow और मॉडल्स को Roboflow की इंफ्रास्ट्रक्चर पर सीधे एक अनंत-स्केलेबल API के माध्यम से चलाएँ।
स्केलेबल, उपयोग में आसान, कोई इंफ्रास्ट्रक्चर प्रबंधन नहीं।
संसाधनों पर सीमित नियंत्रण, मांग वाले अनुप्रयोगों के लिए अधिक लेटेंसी की संभावना।
Workflow और मॉडल्स चलाने के लिए समर्पित GPU और CPU।
GPU मॉडल्स, Video Streaming, Custom Python Blocks के लिए सपोर्ट।
केवल US-आधारित डेटा सेंटर्स तक सीमित। Serverless API की तरह ऑटोस्केलिंग नहीं है।
Batch Processing
चयनित workflow के साथ आपकी छवियों और वीडियो को संसाधित करने के लिए प्रबंधित सर्वरों का समूह।
पूरी तरह से प्रबंधित समाधान जो उच्च डेटा थ्रूपुट और लागत दक्षता प्रदान करता है, GPU समर्थन के साथ आपके डेटा वॉल्यूम के अनुसार सहजता से स्केलेबल।
रीयल-टाइम प्रोसेसिंग नहीं और Custom Python Blocks के लिए कोई समर्थन नहीं।
Self-Hosted Deployments
अपने स्वयं के हार्डवेयर पर स्थानीय रूप से Inference चलाएँ।
संसाधनों और वातावरण पर पूर्ण नियंत्रण, कम लेटेंसी की संभावना।
इंफ्रास्ट्रक्चर प्रबंधन और विशेषज्ञता की आवश्यकता होती है।
सही डिप्लॉयमेंट विकल्प चुनना
आपके लिए सर्वोत्तम डिप्लॉयमेंट विकल्प आपकी विशिष्ट आवश्यकताओं और मांगों पर निर्भर करता है। निर्णय लेते समय निम्नलिखित कारकों पर विचार करें:
Scalability: यदि आपके एप्लिकेशन को विभिन्न स्तरों के ट्रैफ़िक या डेटा वॉल्यूम को संभालने की आवश्यकता है, तो serverless API रीयल-टाइम उपयोग के मामलों के लिए उत्कृष्ट scalability प्रदान करता है; अन्यथा, Batch Processing एक सुझाया गया विकल्प है।
Latency: यदि आपको कम लेटेंसी या वीडियो प्रोसेसिंग की आवश्यकता है, तो dedicated deployments या शक्तिशाली हार्डवेयर के साथ self-hosted deployments सर्वोत्तम विकल्प हो सकते हैं।
GPUs: यदि आपको ऐसे मॉडल्स चलाने हैं जिन्हें GPU की आवश्यकता है (जैसे SAM2, CogVML, आदि), तो आपको GPU मशीन टाइप के साथ Dedicated Deployment या ऐसे हार्डवेयर पर self hosted का उपयोग करना होगा जिसमें GPU उपलब्ध हो। (Serverless GPU API जल्द आ रहा है)
Control: Self-hosted deployments आपके वातावरण और संसाधनों पर सबसे अधिक नियंत्रण प्रदान करते हैं।
Expertise: Self-hosted deployments को सेटअप और प्रबंधित करने के लिए अधिक तकनीकी विशेषज्ञता की आवश्यकता होती है।
Last updated
Was this helpful?