For the complete documentation index, see llms.txt. This page is also available as Markdown.

Model 유형별 Training Resolution

학습 해상도는 모델 정확도, 추론 속도, 학습 시간에 영향을 줍니다. 각 모델 아키텍처에는 이러한 요소의 균형을 맞추는 기본 해상도가 있습니다. 기본적으로 Roboflow는 선택한 모델 아키텍처에 대한 기본 학습 해상도를 제안합니다.

아래 표는 각 모델 아키텍처와 크기에 대한 기본 학습 해상도를 보여줍니다. 새로 데이터셋 버전.

객체 탐지

모델 유형
패밀리 및 크기
기본 학습 해상도

객체 탐지

RF-DETR Nano

384×384

객체 탐지

RF-DETR Small

512×512

객체 탐지

RF-DETR Medium

576×576

객체 탐지

RF-DETR Large

704×704

객체 탐지

RF-DETR X Large

700x700

객체 탐지

RF-DETR 2X Large

880x880

객체 탐지

Roboflow 3.0 - Fast

640×640

객체 탐지

Roboflow 3.0 - Accurate

640×640

객체 탐지

Roboflow 3.0 - Medium

640×640

객체 탐지

Roboflow 3.0 - Large

640×640

객체 탐지

Roboflow 3.0 - Extra Large

640×640

객체 탐지

YOLOv26(n/s/m/l/x)

640×640

객체 탐지

YOLOv12 (n/s/m/l/x)

640×640

객체 탐지

YOLOv11 (n/s/m/l/x)

640×640

객체 탐지

YOLOv10 (n/s/m/b/l/x)

640×640

객체 탐지

YOLOv9 (s/m/c/e)

640×640

객체 탐지

YOLOv8 (n/s/m/l/x)

640×640

객체 탐지

YOLOv5 (n/s/m/l/x)

640×640

객체 탐지

YOLOv7 (legacy)

640×640

객체 탐지

YOLO‑NAS Small

640×640

객체 탐지

YOLO‑NAS Medium

640×640

객체 탐지

Roboflow Instant

1008x1008

인스턴스 세그멘테이션

모델 유형
패밀리 및 크기
기본 학습 해상도

인스턴스 세그멘테이션

RF-DETR Seg Nano

312x312

인스턴스 세그멘테이션

RF-DETR Seg Small

384x384

인스턴스 세그멘테이션

RF-DETR Seg Medium

432x432

인스턴스 세그멘테이션

RF-DETR Seg Large

504x504

인스턴스 세그멘테이션

RF-DETR Seg X Large

624x624

인스턴스 세그멘테이션

RF-DETR Seg 2X Large

768x768

인스턴스 세그멘테이션

Roboflow 3.0 - Fast (Seg)

640×640

인스턴스 세그멘테이션

Roboflow 3.0 - Accurate (Seg)

640×640

인스턴스 세그멘테이션

Roboflow 3.0 - Medium (Seg)

640×640

인스턴스 세그멘테이션

Roboflow 3.0 - Large (Seg)

640×640

인스턴스 세그멘테이션

Roboflow 3.0 - Extra Large (Seg)

640×640

인스턴스 세그멘테이션

YOLO-seg (v8/10/11/12)

640×640

인스턴스 세그멘테이션

SAM3 (Segment Anything 3)

1008x1008

인스턴스 세그멘테이션

시맨틱 세그멘테이션 (DeepLabV3+)

≥ 512×512

시맨틱 세그멘테이션

모델 유형
패밀리 및 크기
기본 학습 해상도

시맨틱 세그멘테이션

YOLO26-SEM (n/s/m/l/x)

1024×1024

시맨틱 세그멘테이션

DeepLabV3+

≥ 512×512

분류 및 포즈

모델 유형
패밀리 및 크기
기본 학습 해상도

분류 및 포즈

Resnet-18/34/50

224x224

분류 및 포즈

YOLO-cls (v8/11)

224x224

분류 및 포즈

Vision Transformer (ViT)

224x224

분류 및 포즈

YOLO-pose (키포인트)

640x640

키포인트 탐지

RF-DETR Keypoint (미리보기)

576x576

멀티모달/VLM

모델 유형
패밀리 및 크기
기본 학습 해상도

멀티모달/VLM

PaliGemma 2 - 3 B

448x448

멀티모달/VLM

PaliGemma 2 - 10 B/28 B

448x448

멀티모달/VLM

Florence-2

448x448

멀티모달/VLM

QWEN 2.5 VL

448x448

멀티모달/VLM

SmolVLM2

384x384

마지막 업데이트

도움이 되었나요?