기반 모델(Foundation Models)

Foundation models는 단독으로 또는 비전 워크플로의 일부로 사용되어 컴퓨터 비전 문제를 해결할 수 있는 대규모 사전학습 모델입니다.

다음 모델을 실행하려면 Roboflow 클라우드 API를 사용할 수 있습니다:

YOLO-World

YOLO-World는 감지하려는 항목을 설명하기만 하면 어떠한 학습 없이도 객체 감지를 수행할 수 있는 제로샷 객체 감지 모델입니다.

CLIP

CLIP은 이미지와 텍스트를 함께 이해하여 방대한 양의 인터넷 텍스트와 이미지로 학습됨으로써 이들을 의미론적으로 연관시킬 수 있습니다, built by OpenAI. Roboflow API를 통해서와 Roboflow Inference를 사용한 온디바이스에서 이용할 수 있습니다.

OCR

DocTR을 사용하여 이미지 내의 단어와 텍스트를 기계가 읽을 수 있는 텍스트로 변환하세요.

이 모델들은 또한 배포할 수 있습니다 자체 하드웨어에서 Roboflow Inference로.

특정 경우 TRT 컨테이너를 특정 GPU 또는 vGPU에서 실행하려면 다음을 지정할 수 있습니다:

Last updated

Was this helpful?