> For the complete documentation index, see [llms.txt](https://docs.roboflow.com/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.roboflow.com/roboflow/roboflow-ko/datasets/dataset-versions/image-preprocessing.md).

# 이미지 전처리

전처리는 데이터셋이 표준 형식(예: 모든 이미지가 동일한 크기)으로 되어 있도록 보장합니다. 이 단계는 모델을 학습하기 전에 데이터셋의 일관성을 확보하는 데 필수적입니다.

전처리는 Train, Valid, Test 세트의 모든 이미지에 적용됩니다(와는 달리 [Augmentations](/roboflow/roboflow-ko/datasets/dataset-versions/image-augmentation.md)는 Train 세트에만 적용됩니다).

Roboflow 플랫폼은 다음과 같은 전처리 옵션을 제공합니다:

* Auto-Orient
* Resize
* Grayscale
* Auto-Adjust Contrast
* Isolate Objects
* Static Crop
* Tile
* Modify Classes
* Filter Null
* Filter by Tag

각 옵션은 아래에 설명되어 있습니다.

### Auto-Orient

Auto-orient는 이미지의 EXIF 데이터를 제거하여, 디스크에 저장된 방식과 동일하게 이미지가 표시되도록 합니다.

EXIF 데이터는 주어진 이미지의 방향을 결정합니다. (Mac의 Preview와 같은) 애플리케이션은 이 데이터를 사용해, 디스크에 저장된 방향과 다르더라도 이미지를 특정 방향으로 표시합니다.

* Roboflow는 기본적으로 이 옵션을 켜 둔 상태로 두고, inference에서 이미지가 모델에 어떻게 입력되는지 확인할 것을 권장합니다.
* 이미지를 auto-orient해야 하는지 여부에 대해 더 알아보고 싶다면, [블로그를 확인해 보세요](https://blog.roboflow.com/exif-auto-orientation/).

### Resize

Resize는 이미지 크기를 변경하고, 필요에 따라 원하는 차원의 크기로 스케일 조정합니다. 주석은 비례하여 조정됩니다(아래의 “fill”의 경우는 제외).

현재로서는 축소만 지원합니다. 다음에 대한 안내를 제공합니다. [어떤 resize 옵션이 사용 사례에 가장 적합한지](https://blog.roboflow.com/you-might-be-resizing-your-images-incorrectly/).

* **Stretch to:** 이미지를 원하는 픽셀 단위의 크기로 늘립니다. 주석은 비례하여 스케일 조정됩니다. 이미지는 정사각형이 되며 왜곡되지만, 원본 이미지 데이터는 손실되지 않습니다.
* **Fill (with center crop) in:** 생성된 이미지는 원하는 출력 크기로 중앙을 기준으로 크롭된 이미지입니다. 예를 들어 원본 이미지가 2600x2080이고 resize 옵션이 640x640으로 설정되어 있다면, 출력된 resize 결과는 원본 이미지의 중앙 640x640입니다. 종횡비는 유지되지만, 원본 이미지 데이터는 손실됩니다.
* **Fit within:** 원본 이미지의 종횡비를 유지하면서 원본 차원의 크기를 출력 이미지의 차원에 맞게 스케일 조정합니다. 예를 들어 원본 이미지가 2600x2080이고 resize 옵션이 640x640으로 설정되어 있다면, 더 긴 차원(2600)은 640으로 스케일 조정되고 두 번째 차원(2080)은 약 512픽셀로 스케일 조정됩니다. 이미지의 종횡비와 원본 데이터는 유지되지만, 정사각형은 아닙니다.
* **Fit (reflect edges) in:** 원본 이미지의 종횡비를 유지하면서 원본 차원의 크기를 출력 이미지의 차원에 맞게 스케일 조정하고, 새로 생성되는 패딩은 원본 이미지의 반사본입니다. 예를 들어 원본 이미지가 2600x2080이고 resize 옵션이 416x416으로 설정되어 있다면, 더 긴 차원(2600)은 416으로 스케일 조정되고 두 번째 차원(2080)은 약 335.48픽셀로 스케일 조정됩니다. 남는 픽셀 영역(416-335.48, 즉 80.52픽셀)은 원본 이미지의 반사된 픽셀입니다. 특히 Roboflow는 기본적으로 주석도 반사합니다. 이미지는 정사각형이며 패딩이 추가되고, 종횡비와 원본 데이터는 유지됩니다.
* **Fit (black edges) in:** 원본 이미지의 종횡비를 유지하면서 원본 차원의 크기를 출력 이미지의 차원에 맞게 스케일 조정하고, 새로 생성되는 패딩은 검은색 영역입니다. 예를 들어 원본 이미지가 2600x2080이고 resize 옵션이 416x416으로 설정되어 있다면, 더 긴 차원(2600)은 416으로 스케일 조정되고 두 번째 차원(2080)은 약 335.48픽셀로 스케일 조정됩니다. 남는 픽셀 영역(416-335.48, 즉 80.52픽셀)은 검은 픽셀입니다. 이미지는 정사각형이며 검은색 패딩이 추가되고, 종횡비와 원본 데이터는 유지됩니다.
* **Fit (white edges) in:** 원본 이미지의 종횡비를 유지하면서 원본 차원의 크기를 출력 이미지의 차원에 맞게 스케일 조정하고, 새로 생성되는 패딩은 흰색 영역입니다. 예를 들어 원본 이미지가 2600x2080이고 resize 옵션이 416x416으로 설정되어 있다면, 더 긴 차원(2600)은 416으로 스케일 조정되고 두 번째 차원(2080)은 약 335.48픽셀로 스케일 조정됩니다. 남는 픽셀 영역(416-335.48, 즉 80.52픽셀)은 흰색 픽셀입니다. 이미지는 정사각형이며 흰색 패딩이 추가되고, 종횡비와 원본 데이터는 유지됩니다.

### Grayscale

RGB 채널이 있는 이미지를 단일 grayscale 채널 이미지로 변환하여 메모리를 절약할 수 있습니다. 각 grayscale 픽셀의 값은 해당하는 빨강, 초록, 파랑 픽셀의 가중 합으로 계산됩니다: Y = 0.2125 R + 0.7154 G + 0.0721 B.

이 가중치는 CRT 형광체에서 사용되며, 동일한 가중치보다 빨강, 초록, 파랑에 대한 인간의 인지를 더 잘 나타내기 때문입니다. (출처: [Scikit-Image](https://scikit-image.org/docs/dev/auto_examples/color_exposure/plot_rgb_to_gray.html).)

### Auto-Adjust Contrast

대비가 낮은 이미지를 향상합니다. 우리는 [대비를 전처리 단계로 사용할지 여부를 살펴보았습니다.](https://blog.roboflow.com/when-to-use-contrast-as-a-preprocessing-step/).

* **Contrast Stretching**: 이미지가 2번째 및 98번째 백분위수에 해당하는 모든 강도 값을 포함하도록 다시 스케일 조정됩니다. [자세히 보기](http://homepages.inf.ed.ac.uk/rbf/HIPR2/stretch.htm).
* **Histogram Equalization**: 이미지에서 “가장 자주 나타나는 강도 값들을 넓게 분산”시킵니다. equalized된 이미지는 대략 균일한 분포를 가지며, 모든 픽셀 색상이 거의 동일한 비율로 표현됩니다. [자세히 보기](https://en.wikipedia.org/wiki/Histogram_equalization).
* **Adaptive Equalization**: Contrast Limited Adaptive Histogram Equalization(CLAHE). 이미지의 서로 다른 타일 영역에서 계산된 히스토그램을 사용하여 지역 대비를 향상하는 알고리즘입니다. 따라서 이미지의 대부분보다 더 어둡거나 밝은 영역에서도 세부 정보가 향상될 수 있습니다. (출처: [Scikit-Image](https://scikit-image.org/docs/dev/api/skimage.exposure.html#skimage.exposure.equalize_adapthist).)

## 고급 전처리 기능

### Isolate Objects

Isolate Objects 변환은 각 바운딩 박스를 개별 이미지로 잘라내고 추출합니다. 이 단계는 Object Detection 데이터셋을 Classification 데이터셋으로 변환합니다.

데이터셋의 여러 클래스가 서로 비슷한 경우, 두 개의 모델을 순차적으로 사용하는 것이 일반적입니다. 첫 번째 모델(Object Detection)은 객체를 찾고, 두 번째 모델(Classification)은 그 객체가 무엇인지 식별합니다. Isolate Objects 변환은 두 번째 모델을 학습하는 데 필요한 데이터셋을 만드는 데 유용합니다.

### Static Crop

![static crop 기능과 예시 출력입니다.](/files/c17e235a038f45d02cc3134a37b036ed95f738f5)

### Tile

Tiling은 작은 객체를 탐지할 때 도움이 될 수 있습니다(특히 항공 이미지나 현미경 이미지와 같은 상황에서). 기본 설정은 2x2 tiling이지만, 필요에 따라 조정할 수 있습니다. Tiling은 *전에* 전처리 파이프라인에서 resizing이 수행됩니다.

![tiling 도구와 출력의 미리보기(“grid”로 표시됨)입니다.](/files/40bcd16f96702ec1475cae14a116fa884460d4dd)

### Modify Classes

데이터셋의 새 버전을 생성할 때 특정 클래스를 제외하거나 클래스 매핑(이름 변경)하는 데 사용하는 전처리 도구입니다. 이러한 변경 사항은 생성하는 버전에만 적용됩니다. 기본 데이터셋에는 변경이 적용되지 않습니다.

![“Apple leaf” 클래스를 제외합니다.](/files/8bd2094f07fdbfc67a7a0133df8f091ce383c001)

![“scratches” 클래스를 “scratch”로 매핑합니다.](/files/04478ea4dddb5e89346a64738030c48821736853)

### Filter Null

Filter Null 변환을 사용하면 사용자가 데이터셋의 이미지 중 일정 비율이 주석 처리되도록 요구할 수 있습니다. null annotation으로 표시된 이미지, 또는 Modify Classes 도구 적용 후 “unannotated”로 표시된 이미지만 Filter Null 사용 시 영향을 받습니다.

이 변환은 데이터셋의 큰 비율이 관심 객체를 포함하지 않는 경우에 유용합니다.

![Filter Null 전처리 단계를 적용하는 모습입니다.](/files/5c9e479b4616e30933f2a2f6dc18ac5ce2ce8f0b)

{% hint style="warning" %}
이 도구를 사용하기 전에 데이터셋 내의 모든 이미지가 올바르게 주석 처리되었는지, 적절한 이미지가 null annotation으로 지정되었는지, 그리고/또는 불필요한 클래스가 제외되었는지 확인하세요.
{% endhint %}

{% hint style="info" %}
[누락된 주석과 Null 주석의 차이](https://blog.roboflow.com/missing-and-null-image-annotations/)

“Missing Annotations”는 이미지에 주석이 없는 경우에 발생합니다(이미지를 주석 없이 두면 학습된 데이터셋의 성능에 문제가 생기며, 학습 실패로 이어질 수 있습니다). Null annotation은 *아무것도* 없고, 모델이 탐지하길 원하는 대상이 그 이미지 안에 있을 때만 적용해야 합니다.
{% endhint %}

### Filter by Tag

Filter by Tag 변환을 사용하면 [Tags](https://docs.roboflow.com/datasets/add-tags-to-images) 가 적용된 항목에 따라 어떤 이미지를 버전에 포함하거나 제외할지 필터링할 수 있습니다. 이 변환은 새로운 데이터 하위 집합으로 모델을 학습하거나 원치 않는 이미지를 학습에서 제외할 때 유용합니다.

각 Tag에는 세 가지 옵션을 사용할 수 있습니다:

* **Require:** Required 태그가 있는 이미지만 버전에 포함됩니다.
* **제외**: Excluded 태그가 있는 이미지는 버전에 포함되지 않습니다.
* **허용:** Allowed 태그가 있는 이미지는 Exclude 및 Require 규칙에 따라 버전에 포함됩니다.

<figure><img src="/files/0307e342fc935cf1e57f8b8d700cc67ebaa9fa2a" alt=""><figcaption><p>이 예시에서 결과 Version에는 <code>do-not-include</code> 태그가 없는 이미지만 포함됩니다.</p></figcaption></figure>


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter:

```
GET https://docs.roboflow.com/roboflow/roboflow-ko/datasets/dataset-versions/image-preprocessing.md?ask=<question>&goal=<endgoal>
```

`ask` is the immediate question: it should be specific, self-contained, and written in natural language.
`goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal.

The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
