이미지 전처리
모델을 위한 데이터 준비를 위한 이미지 전처리 단계입니다.
전처리는 데이터셋이 표준 형식(예: 모든 이미지가 동일한 크기)으로 되어 있는지 확인합니다. 이 단계는 모델을 학습하기 전에 데이터셋의 일관성을 보장하는 데 필수적입니다.
전처리는 학습, 검증, 테스트 세트의 모든 이미지에 적용됩니다 ( 증강은(는) 학습 세트에만 적용되는 것과 달리).
Roboflow 플랫폼은 다음과 같은 전처리 옵션을 제공합니다:
자동 방향 맞춤
크기 조정
그레이스케일
자동 대비 조정
객체 분리
고정 크롭
타일링
클래스 수정
Null 필터
태그별 필터
각 옵션에 대한 설명은 아래와 같습니다.
자동 방향 맞춤
자동 방향 맞춤은 이미지의 EXIF 데이터를 제거하여 디스크에 저장된 방식과 동일하게 이미지를 표시합니다.
EXIF 데이터는 특정 이미지의 방향을 결정합니다. (Mac의 미리보기와 같은) 애플리케이션은 이 데이터를 사용하여 디스크에 저장된 방향과 다르더라도 이미지를 특정 방향으로 표시합니다. 자세한 내용은 이 Hacker News 첫 페이지 토론을 참고하세요. 이로 인해 객체 탐지 모델이 조용히 망가질 수 있습니다.
Roboflow는 기본적으로 이 옵션을 켜 두고, 추론 시 이미지가 모델에 어떻게 입력되는지 확인할 것을 권장합니다.
이미지를 자동 방향 맞춤해야 할지에 대해 더 알고 싶다면, 저희 블로그를 참고하세요.
크기 조정
크기 조정은 이미지의 크기를 변경하고, 선택적으로 원하는 치수로 비율을 맞춥니다. 주석도 비례적으로 조정됩니다(아래의 “채우기”는 예외).
현재는 축소만 지원합니다. 사용 사례에 맞는 적절한 크기 조정 옵션에 대한 가이드.
늘리기: 이미지를 원하는 픽셀 단위 치수로 늘립니다. 주석도 비례적으로 조정됩니다. 이미지는 정사각형이지만 왜곡되고, 원본 이미지 데이터는 손실되지 않습니다.
채우기(중앙 크롭): 생성된 이미지는 원하는 출력 치수의 중앙 크롭입니다. 예를 들어, 원본 이미지가 2600x2080이고 크기 조정 옵션이 640x640이면, 출력 이미지는 원본 이미지의 중앙 640x640이 됩니다. 종횡비는 유지되지만, 원본 이미지 데이터는 일부 손실됩니다.
내부 맞춤: 원본 치수는 종횡비를 유지하면서 출력 이미지의 치수에 맞게 조정됩니다. 예를 들어, 원본 이미지가 2600x2080이고 크기 조정 옵션이 640x640이면, 더 긴 치수(2600)는 640으로, 짧은 치수(2080)는 약 512픽셀로 조정됩니다. 이미지 종횡비와 원본 데이터는 유지되지만, 정사각형은 아닙니다.
내부 맞춤(가장자리 반사): 원본 치수는 종횡비를 유지하면서 출력 이미지의 치수에 맞게 조정되고, 새로 생성된 패딩은 원본 이미지의 반사입니다. 예를 들어, 원본 이미지가 2600x2080이고 크기 조정 옵션이 416x416이면, 더 긴 치수(2600)는 416으로, 짧은 치수(2080)는 약 335.48픽셀로 조정됩니다. 남은 픽셀 영역(416-335.48, 즉 80.52픽셀)은 원본 이미지의 반사 픽셀입니다. 특히 Roboflow는 기본적으로 주석도 반사합니다. 이미지는 정사각형이고, 패딩이 있으며, 종횡비와 원본 데이터가 유지됩니다.
내부 맞춤(검은색 가장자리): 원본 치수는 종횡비를 유지하면서 출력 이미지의 치수에 맞게 조정되고, 새로 생성된 패딩은 검은색 영역입니다. 예를 들어, 원본 이미지가 2600x2080이고 크기 조정 옵션이 416x416이면, 더 긴 치수(2600)는 416으로, 짧은 치수(2080)는 약 335.48픽셀로 조정됩니다. 남은 픽셀 영역(416-335.48, 즉 80.52픽셀)은 검은색 픽셀입니다. 이미지는 정사각형이고, 검은색 패딩이 있으며, 종횡비와 원본 데이터가 유지됩니다.
내부 맞춤(흰색 가장자리): 원본 치수는 종횡비를 유지하면서 출력 이미지의 치수에 맞게 조정되고, 새로 생성된 패딩은 흰색 영역입니다. 예를 들어, 원본 이미지가 2600x2080이고 크기 조정 옵션이 416x416이면, 더 긴 치수(2600)는 416으로, 짧은 치수(2080)는 약 335.48픽셀로 조정됩니다. 남은 픽셀 영역(416-335.48, 즉 80.52픽셀)은 흰색 픽셀입니다. 이미지는 정사각형이고, 흰색 패딩이 있으며, 종횡비와 원본 데이터가 유지됩니다.
그레이스케일
RGB 채널이 있는 이미지를 단일 그레이스케일 채널 이미지로 변환하여 메모리를 절약할 수 있습니다. 각 그레이스케일 픽셀의 값은 해당 빨강, 초록, 파랑 픽셀의 가중 합으로 계산됩니다: Y = 0.2125 R + 0.7154 G + 0.0721 B.
이 가중치는 CRT 형광체 에서 사용되며, 동일한 가중치보다 빨강, 초록, 파랑에 대한 인간의 인식을 더 잘 반영합니다. (출처: Scikit-Image.)
자동 대비 조정
대비가 낮은 이미지를 향상시킵니다. 저희는 전처리 단계로 대비를 사용할지 여부.
대비 스트레칭이미지는 2번째와 98번째 백분위수 내에 속하는 모든 강도를 포함하도록 다시 스케일됩니다. 더 보기.
히스토그램 평활화이미지에서 가장 빈번한 강도 값을 "분산"시킵니다. 평활화된 이미지는 모든 픽셀 색상이 거의 균등하게 나타나는 균일한 분포를 가집니다. 더 보기.
적응형 평활화대비 제한 적응형 히스토그램 평활화(CLAHE). 이미지의 다양한 타일 영역에서 계산된 히스토그램을 사용하는 국소 대비 향상 알고리즘입니다. 따라서 이미지의 대부분보다 더 어둡거나 밝은 영역에서도 국소 세부 정보가 향상될 수 있습니다. (출처: Scikit-Image.)
고급 전처리 기능
객체 분리
객체 분리 변환은 각 바운딩 박스를 개별 이미지로 잘라내고 추출합니다. 이 단계는 객체 탐지 데이터셋을 분류 데이터셋으로 변환합니다.
데이터셋에 유사한 클래스가 많은 경우, 두 개의 모델을 연속적으로 사용하는 것이 일반적입니다. 첫 번째 모델(객체 탐지)은 객체를 찾고, 두 번째 모델(분류)은 객체가 무엇인지 식별합니다. 객체 분리 변환은 두 번째 모델 학습에 필요한 데이터셋을 만드는 데 유용합니다.
고정 크롭

타일링
타일링은 작은 객체를 탐지할 때(특히 항공 이미지나 현미경 이미지 등) 도움이 될 수 있습니다. 기본 설정은 2x2 타일링이지만, 필요에 따라 조정할 수 있습니다. 타일링은 크기 조정 전에 전처리 파이프라인에서 수행됩니다.

클래스 수정
특정 클래스를 생략하거나(이름을 바꿔) 클래스 맵핑을 할 때 사용하는 전처리 도구입니다. 이러한 변경 사항은 생성된 버전에만 적용됩니다. 기본 데이터셋에는 영향을 주지 않습니다.


Null 필터
Null 필터 변환을 사용하면 데이터셋의 일부 이미지가 반드시 주석이 달려 있어야 하도록 요구할 수 있습니다. Modify Classes 도구를 적용한 후 null 주석 또는 "주석 없음"으로 표시된 이미지에만 Filter Null을 사용할 때 영향을 미칩니다.
이 변환은 데이터셋의 많은 부분에 관심 객체가 포함되어 있지 않은 경우에 유용합니다.

이 도구를 사용하기 전에 데이터셋 내 모든 이미지를 올바르게 주석 처리했는지, 적절한 이미지를 null 주석으로 지정했는지, 불필요한 클래스를 생략했는지 반드시 확인하세요.
태그별 필터
태그별 필터 변환을 사용하면, 어떤 태그 가 적용되었는지에 따라 버전에 포함할 이미지와 포함하지 않을 이미지를 필터링할 수 있습니다. 이 변환은 새로운 데이터 하위 집합으로 모델을 학습하거나 원하지 않는 이미지를 학습에서 제외할 때 유용합니다.
각 태그에 대해 세 가지 옵션을 사용할 수 있습니다:
필수: 필수 태그가 있는 이미지만 버전에 포함됩니다.
제외제외 태그가 있는 이미지는 버전에 포함되지 않습니다.
허용: 허용 태그가 있는 이미지는 제외 및 필수 규칙에 따라 버전에 포함됩니다.

do-not-include
태그. Last updated
Was this helpful?