Foundation Models

फाउंडेशन मॉडल बड़े, पूर्व-प्रशिक्षित मॉडल होते हैं जिन्हें अकेले या विज़न वर्कफ़्लो के हिस्से के रूप में उपयोग किया जा सकता है ताकि किसी कंप्यूटर विज़न समस्या को हल किया जा सके।

आप निम्नलिखित मॉडल चलाने के लिए Roboflow क्लाउड APIs का उपयोग कर सकते हैं:

YOLO-World

YOLO-World एक ज़ीरो-शॉट ऑब्जेक्ट डिटेक्शन मॉडल है जो आपको किसी भी प्रशिक्षण के बिना, केवल उन आइटमों का वर्णन करके ऑब्जेक्ट डिटेक्शन करने की अनुमति देता है जिन्हें आप डिटेक्ट करना चाहते हैं।

CLIP

CLIP छवियों और पाठ को एक साथ समझता है, जिससे यह उन्हें सेमान्टिक रूप से अर्थपूर्ण तरीके से जोड़ने में सक्षम होता है क्योंकि इसे इंटरनेट के विशाल मात्रा में पाठ और छवियों पर प्रशिक्षित किया गया है, OpenAI द्वारा निर्मितarrow-up-right। Roboflow API के माध्यम से और डिवाइस पर Roboflow Inference का उपयोग करके उपलब्ध।

OCR

इमेजेस के भीतर शब्दों और टेक्स्ट को मशीन-पठनीय टेक्स्ट में बदलने के लिए DocTR का उपयोग करें।

आप इन मॉडलों को भी डिप्लॉय कर सकते हैं अपने स्वयं के हार्डवेयर पर Roboflow Inference के साथarrow-up-right.

\

Last updated

Was this helpful?