Foundation Models
Foundation modelsは、大規模で事前に学習されたモデルで、単独で、またはビジョンワークフローの一部として、コンピュータビジョンの問題を解決するために使用できます。
次のモデルを実行するためにRoboflowクラウドAPIを使用できます:
YOLO-World
YOLO-Worldはゼロショット物体検出モデルで、検出したい項目を記述するだけで、訓練なしに物体検出を行うことができます。
CLIP
CLIPは画像とテキストを一緒に理解し、膨大な量のインターネット上のテキストと画像で学習されることによって、それらを意味的に関連付けることができます、 OpenAIによって作られました。Roboflow API経由およびRoboflow Inferenceを使用したオンデバイスで利用可能です。
OCR
DocTRを使用して、画像内の単語やテキストを機械可読なテキストに変換します。
これらのモデルをデプロイすることもできます Roboflow Inferenceを使用してご自身のハードウェアで.
\
Last updated
Was this helpful?