動画推論

動画フレーム全体でコンピュータビジョンモデルを実行します。

ビデオ推論APIは非同期ビデオ処理に最適化されています。あらゆるモデルを実行することができます Roboflow Inference が実装している(CLIPのような基盤モデル、カスタムでファインチューニングしたモデル、 Roboflowでトレーニングしたモデル、および他のユーザーが Roboflow Universeで共有した数千のモデル)を使って、記録されたビデオ内のすべてまたは一部のフレームに対して予測を取得できます。

APIを利用して予測を取得するために従うべき手順は以下の通りです:

  1. ビデオをアップロードする

  2. アップロードしたビデオに対してモデルまたはモデルのリストで推論をリクエストする

  3. 結果が利用可能になるまでポーリングする

GPUの効率的なバッチ処理と高いレイテンシ許容度の最適化により、ビデオ推論APIは保存された(リアルタイムストリーミングと比較して)ビデオ処理において画像ベースの Roboflowホスト型推論API.

API出力フォーマットの仕様を見る こちら.

モデルサポート

以下のモデルタイプでビデオ推論APIを利用できます:

タスクタイプ
ホステッドAPIによるサポート

分類

インスタンスセグメンテーション

セマンティックセグメンテーション

利用例

ビデオ推論APIを使用できるいくつかの利用例を以下に示します:

  • ビデオのタグ付け

  • ビデオのモデレーション(例:暴力や過激なシーンの検索)

  • ブランドや製品の検出とタグ付け

  • ビデオからのテキスト抽出

  • シーンの分割と分類

  • オブジェクトのカウント

  • メディア検索のインデックス作成

  • ビデオ内でコンテキスト広告を配置できる領域の特定

  • その他。

重要な注意事項

  1. ビデオ推論は現在、以下のビデオファイル拡張子をサポートしています: mp4、MP4、avi、AVI、mkv、MKV、webm、WEBM。

  2. Roboflowはアップロードされたビデオを1週間キャッシュし、ユーザーが同じビデオで再度推論を実行できるようにしています。この1週間の期間が過ぎると、ビデオは完全に削除されます。

  3. Roboflowにアップロードされたビデオはダウンロードできません。アップロード機能は推論目的でバックエンドがビデオを処理するためだけに提供されています。

Last updated

Was this helpful?