inferencejs संदर्भ

`inferencejs` के लिए संदर्भ, एक एज लाइब्रेरी जो रोबोफ्लो के साथ बनाए गए कंप्यूटर विज़न एप्लिकेशन को वेब/JavaScript वातावरण में तैनात करती है

और अधिक जानें inferencejs , हमारा वेब SDK, यहाँ

इंस्टॉलेशन

यह लाइब्रेरी ब्राउज़र के भीतर उपयोग के लिए डिज़ाइन की गई है, जिसमें vite, webpack, parcel आदि जैसे बंडलर का उपयोग किया जाता है। मान लीजिए कि आपका बंडलर सेटअप है, आप निम्नलिखित कमांड चलाकर इंस्टॉल कर सकते हैं:

npm install inferencejs

शुरुआत करें

शुरुआत करें InferenceEngine. यह एक बैकग्राउंड वर्कर शुरू करेगा जो मॉडल डाउनलोड और निष्पादित कर सकता है बिना यूज़र इंटरफेस को ब्लॉक किए।

import { InferenceEngine } from "inferencejs";

const PUBLISHABLE_KEY = "rf_a6cd..."; // इसे अपने प्रोजेक्ट सेटिंग्स फोल्डर से Roboflow का अपना publishable key डालें

const inferEngine = new InferenceEngine();
const workerId = await inferEngine.startWorker("[PROJECT URL SLUG]", [VERSION NUMBER], PUBLISHABLE_KEY);

//मॉडल पर इनफेरेंस करें
const result = await inferEngine.infer(workerId, img);

एपीआई

InferenceEngine

new InferenceEngine()

एक नया InferenceEngine इंस्टेंस बनाता है।

startWorker(modelName: string, modelVersion: number, publishableKey: string): Promise<number>

दिए गए मॉडल के लिए एक नया वर्कर शुरू करता है और लौटाता है workerId. महत्वपूर्ण- publishableKey आवश्यक है और इसे आपके प्रोजेक्ट सेटिंग्स फोल्डर में Roboflow से प्राप्त किया जा सकता है।

infer(workerId: number, img: CVImage | ImageBitmap): Promise<Inference>

दिए गए वर्कर के साथ एक छवि पर इनफेर करें workerId. img का उपयोग करके बनाया जा सकता है new CVImage(HTMLImageElement | HTMLVideoElement | ImageBitmap | TFJS.Tensor) या createImageBitmap

stopWorker(workerId: number): Promise<void>

दिए गए workerId.

YOLOv8 YOLOv5

का उपयोग करके इनफेरेंस करने का परिणाम InferenceEngine YOLOv8 या YOLOv5 ऑब्जेक्ट डिटेक्शन मॉडल पर निम्न प्रकार की एक array होती है:

type RFObjectDetectionPrediction = {
    class?: string;
    confidence?: number;
    bbox?: {
        x: number;
        y: number;
        width: number;
        height: number;
    };
    color?: string;
};

GazeDetections

का उपयोग करके इनफेरेंस करने का परिणाम InferenceEngine Gaze मॉडल पर। निम्न प्रकार की एक array:

type GazeDetections = {
    leftEye: { x: number; y: number };
    rightEye: { x: number; y: number };
    yaw: number;
    pitch: number;
}[];

leftEye.x

बाएं आंख की x स्थिति, 0 और 1 के बीच फ्लोटिंग पॉइंट संख्या के रूप में, इनपुट छवि की चौड़ाई के प्रतिशत में मापी गई।

leftEye.y

बाएं आंख की y स्थिति, 0 और 1 के बीच फ्लोटिंग पॉइंट संख्या के रूप में, इनपुट छवि की ऊंचाई के प्रतिशत में मापी गई।

rightEye.x

दाएं आंख की x स्थिति, 0 और 1 के बीच फ्लोटिंग पॉइंट संख्या के रूप में, इनपुट छवि की चौड़ाई के प्रतिशत में मापी गई।

rightEye.y

दाएं आंख की y स्थिति, 0 और 1 के बीच फ्लोटिंग पॉइंट संख्या के रूप में, इनपुट छवि की ऊंचाई के प्रतिशत में मापी गई।

yaw

विजुअल गेज का यॉ, रेडियन में मापा गया।

pitch

विजुअल गेज का पिच, रेडियन में मापा गया।

CVImage

एक क्लास जो एक छवि का प्रतिनिधित्व करती है जिसे कंप्यूटर विज़न कार्यों के लिए उपयोग किया जा सकता है। यह छवि को बदलने और कन्वर्ट करने के लिए विभिन्न विधियाँ प्रदान करती है।

कंस्ट्रक्टर

यह CVImage(image) क्लास कंस्ट्रक्टर क्लास का एक नया इंस्टेंस इनिशियलाइज़ करता है। यह निम्न प्रकारों में से एक छवि स्वीकार करता है:

  • ImageBitmap: एक वैकल्पिक ImageBitmap छवि का प्रतिनिधित्व।

  • HTMLImageElement: एक वैकल्पिक HTMLImageElement छवि का प्रतिनिधित्व।

  • tf.Tensor: एक वैकल्पिक tf.Tensor छवि का प्रतिनिधित्व।

  • tf.Tensor4D: एक वैकल्पिक 4D tf.Tensor छवि का प्रतिनिधित्व।

विधियाँ

bitmap()

एक प्रॉमिस लौटाता है जो ImageBitmap छवि का प्रतिनिधित्व करता है। यदि छवि पहले से ही बिटमैप है, तो यह कैश्ड बिटमैप लौटाता है।

tensor()

एक tf.Tensor छवि का प्रतिनिधित्व लौटाता है। यदि छवि पहले से ही टेन्सर है, तो यह कैश्ड टेन्सर लौटाता है।

tensor4D()

एक प्रॉमिस लौटाता है जो एक 4D tf.Tensor छवि का प्रतिनिधित्व करता है। यदि छवि पहले से ही 4D टेन्सर है, तो यह कैश्ड 4D टेन्सर लौटाता है।

array()

एक प्रॉमिस लौटाता है जो छवि के जावास्क्रिप्ट array प्रतिनिधित्व को लौटाता है। यदि छवि पहले से ही टेन्सर है, तो यह टेन्सर को array में बदलता है।

dims()

एक array लौटाता है जिसमें छवि के आयाम होते हैं। यदि छवि बिटमैप है, तो यह लौटाता है [चौड़ाई, ऊंचाई]. यदि छवि टेन्सर है, तो यह टेन्सर का आकार लौटाता है। यदि छवि HTML छवि एलिमेंट है, तो यह लौटाता है [चौड़ाई, ऊंचाई].

dispose()

छवि के टेन्सर प्रतिनिधित्व को मेमोरी मुक्त करने के लिए नष्ट करता है।

static fromArray(array: tf.TensorLike)

एक नया बनाता है CVImage दिए गए टेन्सर-जैसे array से इंस्टेंस।

Last updated

Was this helpful?