이미지 증강

모델 성능 향상을 위해 증강 이미지를 만드세요.

이미지 증강은 데이터셋에서 "Train"으로 표시된 기존 이미지에 증강을 적용하는 단계입니다. 이 과정은 모델이 일반화하는 능력을 향상시켜, 보지 못한 이미지에 대해 더 효과적으로 작동하도록 도와줍니다.

증강은 몇 가지 주요 이유로 학습 시점이 아니라 데이터셋 버전("오프라인 증강")을 통해 적용됩니다:

  1. 모델 재현성이 향상됩니다Roboflow를 사용하면 각 이미지가 어떻게 증강되었는지 복사본을 보유할 수 있습니다. 예를 들어, 모델이 어두운 이미지보다 밝은 이미지에서 더 잘 작동한다면, 더 많은 저조도 학습 데이터를 수집해야 합니다.

  2. 학습 시간이 단축됩니다증강은 CPU에 의해 제한되는 작업입니다. GPU에서 학습을 진행하면서 실시간으로 증강을 수행하면, GPU가 각 에폭마다 CPU가 증강된 데이터를 제공할 때까지 대기하게 됩니다. 이 시간이 누적됩니다!

  3. 학습 비용이 절감됩니다증강이 CPU에 의해 제한되는 작업이기 때문에, 비싼 임대 GPU가 종종 학습용 이미지를 기다리게 됩니다.

증강 적용 방식

증강은 항상 학습 이미지에 전처리 단계이후에 적용됩니다. 선택한 증강들은 함께 쌓여, 증강 설정에 무작위성이 적용되고 각 설정의 값이 각 증강 이미지에 적용됩니다. 이 과정에서 중복된 이미지가 나타나면 해당 이미지는 생성된 버전에서 필터링됩니다.

예를 들어, "수평 뒤집기"와 "소금과 후추 노이즈" 증강을 선택하면, 주어진 이미지는 무작위로 수평으로 뒤집히고 무작위 소금과 후추 노이즈가 적용됩니다.

증강 제한하기

증강이 포함된 데이터셋 버전을 생성할 때, "최대 버전 크기" 옵션을 통해 포함할 증강 이미지의 최대 개수를 선택할 수 있습니다.

예를 들어, 3x를 선택하면 최종 데이터셋 버전에는 각 학습 원본 이미지에 전처리 단계 가 적용되고, 선택한 설정에 따라 각 이미지의 무작위 증강 2개가 추가됩니다.

데이터셋에 100개의 이미지가 있고 train/valid/test 분할이 70/20/10이며 3x 증강을 선택했다면, 최종 데이터셋은 대략 210/20/10 분할이 됩니다.

버전의 최종 이미지 수는 이 예상치보다 작을 수 있습니다. 이는 이미지 중복 제거 및 "Filter Null"과 같은 특정 옵션이 출력에서 이미지를 제거할 수 있기 때문입니다.

증강 옵션

Roboflow의 증강은 "Basic" 또는 "Enhanced"일 수 있으며, 두 가지 다른 수준에서 적용할 수 있습니다.

이미지 레벨 증강

이미지 레벨 증강은 개별 객체나 영역이 아닌 전체 이미지에 변환을 적용하여 새로운 학습 데이터를 만듭니다. 전체 이미지를 수정함으로써 개발자는 더 다양한 시각적 조건을 시뮬레이션할 수 있어, 모델이 새로운 데이터에 더 잘 일반화할 수 있도록 도와줍니다.

바운딩 박스 레벨 증강

바운딩 박스 레벨 증강은 원본 이미지의 바운딩 박스 내용만 변경하여 새로운 학습 데이터를 만듭니다. 이를 통해 개발자는 문제 조건에 더 적합한 학습 데이터를 만들 수 있습니다.

A 2019년 논문 Google 연구원들은 바운딩 박스만 증강하여 모델에 최적화된 데이터를 만드는 아이디어를 소개했습니다. 이 논문에서 연구자들은 바운딩 박스만 수정해도 체계적인 개선이 이루어지며, 특히 작은 데이터셋에 적합한 모델에서 효과가 크다는 것을 보여주었습니다.

Enhanced Augmentations와 Bounding Box Augmentations는 프리미엄 기능입니다.

최신 요금제와 관련 기능에 대한 정보는 가격 페이지.

자세히 알아보기

Last updated

Was this helpful?