Foundation Models

फाउंडेशन मॉडल बड़े, पूर्व-प्रशिक्षित मॉडल होते हैं जिन्हें अकेले या विज़न वर्कफ़्लो के हिस्से के रूप में उपयोग किया जा सकता है ताकि किसी कंप्यूटर विज़न समस्या को हल किया जा सके।

आप निम्नलिखित मॉडल चलाने के लिए Roboflow क्लाउड APIs का उपयोग कर सकते हैं:

YOLO-World

YOLO-World एक ज़ीरो-शॉट ऑब्जेक्ट डिटेक्शन मॉडल है जो आपको किसी भी प्रशिक्षण के बिना, केवल उन आइटमों का वर्णन करके ऑब्जेक्ट डिटेक्शन करने की अनुमति देता है जिन्हें आप डिटेक्ट करना चाहते हैं।

CLIP

CLIP छवियों और पाठ को एक साथ समझता है, जिससे यह उन्हें सेमान्टिक रूप से अर्थपूर्ण तरीके से जोड़ने में सक्षम होता है क्योंकि इसे इंटरनेट के विशाल मात्रा में पाठ और छवियों पर प्रशिक्षित किया गया है, OpenAI द्वारा निर्मित। Roboflow API के माध्यम से और डिवाइस पर Roboflow Inference का उपयोग करके उपलब्ध।

OCR

इमेजेस के भीतर शब्दों और टेक्स्ट को मशीन-पठनीय टेक्स्ट में बदलने के लिए DocTR का उपयोग करें।

आप इन मॉडलों को भी डिप्लॉय कर सकते हैं अपने स्वयं के हार्डवेयर पर Roboflow Inference के साथ.

Last updated 11 months ago

Was this helpful?