inferencejs संदर्भ
`inferencejs` के लिए संदर्भ, एक एज लाइब्रेरी जो रोबोफ्लो के साथ बनाए गए कंप्यूटर विज़न एप्लिकेशन को वेब/JavaScript वातावरण में तैनात करती है
इंस्टॉलेशन
यह लाइब्रेरी ब्राउज़र के भीतर उपयोग के लिए डिज़ाइन की गई है, जिसमें vite, webpack, parcel आदि जैसे बंडलर का उपयोग किया जाता है। मान लीजिए कि आपका बंडलर सेटअप है, आप निम्नलिखित कमांड चलाकर इंस्टॉल कर सकते हैं:
npm install inferencejs
शुरुआत करें
शुरुआत करें InferenceEngine
. यह एक बैकग्राउंड वर्कर शुरू करेगा जो मॉडल डाउनलोड और निष्पादित कर सकता है बिना यूज़र इंटरफेस को ब्लॉक किए।
import { InferenceEngine } from "inferencejs";
const PUBLISHABLE_KEY = "rf_a6cd..."; // इसे अपने प्रोजेक्ट सेटिंग्स फोल्डर से Roboflow का अपना publishable key डालें
const inferEngine = new InferenceEngine();
const workerId = await inferEngine.startWorker("[PROJECT URL SLUG]", [VERSION NUMBER], PUBLISHABLE_KEY);
//मॉडल पर इनफेरेंस करें
const result = await inferEngine.infer(workerId, img);
एपीआई
InferenceEngine
new InferenceEngine()
एक नया InferenceEngine इंस्टेंस बनाता है।
startWorker(modelName: string, modelVersion: number, publishableKey: string): Promise<number>
दिए गए मॉडल के लिए एक नया वर्कर शुरू करता है और लौटाता है workerId
. महत्वपूर्ण- publishableKey
आवश्यक है और इसे आपके प्रोजेक्ट सेटिंग्स फोल्डर में Roboflow से प्राप्त किया जा सकता है।
infer(workerId: number, img: CVImage | ImageBitmap): Promise<Inference>
दिए गए वर्कर के साथ एक छवि पर इनफेर करें workerId
. img
का उपयोग करके बनाया जा सकता है new CVImage(HTMLImageElement | HTMLVideoElement | ImageBitmap | TFJS.Tensor)
या createImageBitmap
stopWorker(workerId: number): Promise<void>
दिए गए workerId
.
YOLOv8
YOLOv5
YOLOv8
YOLOv5
का उपयोग करके इनफेरेंस करने का परिणाम InferenceEngine
YOLOv8 या YOLOv5 ऑब्जेक्ट डिटेक्शन मॉडल पर निम्न प्रकार की एक array होती है:
type RFObjectDetectionPrediction = {
class?: string;
confidence?: number;
bbox?: {
x: number;
y: number;
width: number;
height: number;
};
color?: string;
};
GazeDetections
GazeDetections
का उपयोग करके इनफेरेंस करने का परिणाम InferenceEngine
Gaze मॉडल पर। निम्न प्रकार की एक array:
type GazeDetections = {
leftEye: { x: number; y: number };
rightEye: { x: number; y: number };
yaw: number;
pitch: number;
}[];
leftEye.x
बाएं आंख की x स्थिति, 0 और 1 के बीच फ्लोटिंग पॉइंट संख्या के रूप में, इनपुट छवि की चौड़ाई के प्रतिशत में मापी गई।
leftEye.y
बाएं आंख की y स्थिति, 0 और 1 के बीच फ्लोटिंग पॉइंट संख्या के रूप में, इनपुट छवि की ऊंचाई के प्रतिशत में मापी गई।
rightEye.x
दाएं आंख की x स्थिति, 0 और 1 के बीच फ्लोटिंग पॉइंट संख्या के रूप में, इनपुट छवि की चौड़ाई के प्रतिशत में मापी गई।
rightEye.y
दाएं आंख की y स्थिति, 0 और 1 के बीच फ्लोटिंग पॉइंट संख्या के रूप में, इनपुट छवि की ऊंचाई के प्रतिशत में मापी गई।
yaw
विजुअल गेज का यॉ, रेडियन में मापा गया।
pitch
विजुअल गेज का पिच, रेडियन में मापा गया।
CVImage
CVImage
एक क्लास जो एक छवि का प्रतिनिधित्व करती है जिसे कंप्यूटर विज़न कार्यों के लिए उपयोग किया जा सकता है। यह छवि को बदलने और कन्वर्ट करने के लिए विभिन्न विधियाँ प्रदान करती है।
कंस्ट्रक्टर
यह CVImage(image)
क्लास कंस्ट्रक्टर क्लास का एक नया इंस्टेंस इनिशियलाइज़ करता है। यह निम्न प्रकारों में से एक छवि स्वीकार करता है:
ImageBitmap
: एक वैकल्पिकImageBitmap
छवि का प्रतिनिधित्व।HTMLImageElement
: एक वैकल्पिकHTMLImageElement
छवि का प्रतिनिधित्व।tf.Tensor
: एक वैकल्पिकtf.Tensor
छवि का प्रतिनिधित्व।tf.Tensor4D
: एक वैकल्पिक 4Dtf.Tensor
छवि का प्रतिनिधित्व।
विधियाँ
bitmap()
एक प्रॉमिस लौटाता है जो ImageBitmap
छवि का प्रतिनिधित्व करता है। यदि छवि पहले से ही बिटमैप है, तो यह कैश्ड बिटमैप लौटाता है।
tensor()
एक tf.Tensor
छवि का प्रतिनिधित्व लौटाता है। यदि छवि पहले से ही टेन्सर है, तो यह कैश्ड टेन्सर लौटाता है।
tensor4D()
एक प्रॉमिस लौटाता है जो एक 4D tf.Tensor
छवि का प्रतिनिधित्व करता है। यदि छवि पहले से ही 4D टेन्सर है, तो यह कैश्ड 4D टेन्सर लौटाता है।
array()
एक प्रॉमिस लौटाता है जो छवि के जावास्क्रिप्ट array प्रतिनिधित्व को लौटाता है। यदि छवि पहले से ही टेन्सर है, तो यह टेन्सर को array में बदलता है।
dims()
एक array लौटाता है जिसमें छवि के आयाम होते हैं। यदि छवि बिटमैप है, तो यह लौटाता है [चौड़ाई, ऊंचाई]
. यदि छवि टेन्सर है, तो यह टेन्सर का आकार लौटाता है। यदि छवि HTML छवि एलिमेंट है, तो यह लौटाता है [चौड़ाई, ऊंचाई]
.
dispose()
छवि के टेन्सर प्रतिनिधित्व को मेमोरी मुक्त करने के लिए नष्ट करता है।
static fromArray(array: tf.TensorLike)
एक नया बनाता है CVImage
दिए गए टेन्सर-जैसे array से इंस्टेंस।
Last updated
Was this helpful?