Managed Deployments
Roboflow は、クラウドインフラを活用してモデルを実行するための、いくつかのマネージドなデプロイオプションを提供しています。これらのオプションは使いやすく、優れたスケーラビリティを備えているため、幅広いアプリケーションに最適です。
Serverless API
その Serverless Hosted API 無限にスケール可能な API を通じて、Roboflow のインフラ上でワークフローとモデルを直接実行できます。これは、モデルをデプロイして inference を始める最も簡単な方法です。
メリット:
スケーラビリティ: API は inference のニーズに合わせて自動的にスケールするため、サーバーのプロビジョニングや管理を気にする必要はありません。
使いやすさ: シンプルな REST API からモデルにアクセスできるため、アプリケーションに inference を簡単に統合できます。
インフラ管理不要: インフラはすべて Roboflow が対応するため、アプリケーションの構築に集中できます。
Workflow サポート: すべての Workflow は Serveless API 上の API エンドポイントとして利用できるため、シンプルな HTTP リクエストで Workflow を簡単に実行できます
制限事項:
ウォームアップリクエスト: まだどのサーバーにも読み込まれていないモデルの読み込みが必要なリクエストを行う場合、最初のリクエストでは数秒のレイテンシ増加が発生することがあります。その後のリクエストでは、現在稼働中のサーバーにモデルがキャッシュされるため、リクエストのレイテンシは大幅に改善されます。
CPU ベース: Serverless Hosted API はモデル inference に CPU を使用します。Dedicated Deployments や self-hosted deployments と比べてレイテンシが高くなる場合があり、GPU を必要とするモデル(Serverless GPU API coming soon).
Workflows
その Serverless Hosted API では、 Workflows を Roboflow cloud 上で実行できます。これにより、自前のインフラを管理することなく、複雑な computer vision アプリケーションを構築・実行できます。
また、 Dedicated Deployments や self hosted inference servers 上で Workflow を実行することもでき、より強力な GPU ベースのモデルを使用し、 Custom Python Blocks.
の作成・テスト・デプロイ方法について、さらに詳しく学ぶことができます こちら.
Model Inference
に加えて workflows 、特定のモデルに対しても Serverless Hosted APIを使って inference できます。Roboflow で学習した任意のモデル、 supported foundation modelsのいずれか、または次の場所で学習済みモデルを持つ project を見つけることができます https://universe.roboflow.com
の使い方の概要 Serverless Hosted API:
Roboflow dashboard から API key を取得します。
画像とモデル情報を指定して API endpoint に POST request を送信します。
JSON 形式で inference 結果を受け取ります。
以下を参照してください Serverless Hosted API 詳細と API specification については docs をご覧ください
Batch Processing
Roboflow Batch Processing は、 Workflows によって提供される完全マネージドなソリューションで、コードを書くことなく大量の動画や画像を処理できます。使いやすい UI での簡単な作業にも、データ処理を自動化するための包括的な API にも対応しており、小規模から大規模までのワークロードに適しています。
構成可能な processing workflows、リアルタイム監視、イベントベースの通知により、Roboflow Batch Processing はデータ処理の効率的な管理、進捗の追跡、他システムとの統合を支援し、目標達成を容易にします。
メリット:
スケーラビリティ: このサービスはデータ量に応じて自動的にスケールし、数百万枚の画像や数千本の動画ファイルを効率的に処理できます。
使いやすさ: このサービスは、シンプルな UI のクリックから CLI コマンドの実行、さらには production-grade automations の構築まで、さまざまな方法で利用でき、システムとシームレスに統合できます。
インフラ管理不要: インフラとデータ管理はすべて Roboflow が対応するため、ビジネスの use-case の解決に集中できます。
制限事項:
処理の非同期性: Batch Processing サービスは、計算リソースが利用可能になると、バックグラウンドで実行される processing job を開始します。必要なサーバーのプロビジョニングには通常数分しかかかりませんが、job の正確な開始時刻は保証されません。そのため、このサービスはリアルタイム処理には適していません。
Custom Python Blocks はサポートされません: このサービスは Roboflow のインフラ上で実行されるため、現在は Custom Python Blocks による任意コードの実行はサポートしていません。
Dedicated Deployments
Dedicated Deployments は、モデルを実行するための専用 GPU と CPU を提供します。このオプションは、一貫したパフォーマンス、リソースの分離、強化されたセキュリティを備えており、リソース分離やカスタムコード実行を必要とする要求の厳しいアプリケーションや production workload に適しています。
メリット:
一貫したパフォーマンス: 専用リソースにより、モデルのパフォーマンスが安定します。
リソース分離: モデルは分離されたリソース上で実行されるため、他のユーザーからの干渉を防げます。
GPU サポート: Dedicated Deployments では、GPU サポートを必要とする大規模モデル(例: SAM2、CogVML)を実行できます
制限事項:
米国ベースのデータセンターに限定: 現在、Dedicated Deployments は米国ベースのデータセンターでのみ利用可能であり、他地域のユーザーにとってはレイテンシが高くなる可能性があります。
最終更新
役に立ちましたか?