画像拡張(Image Augmentation)

モデル性能を改善するための拡張画像を作成します。

画像増強は、データセット内で「Train」とマークされた既存の画像に増強処理を適用する工程です。このプロセスはモデルの汎化能力を向上させ、見たことのない画像に対してより効果的に動作するのに役立ちます。

circle-check

増強はトレーニング時ではなくデータセットバージョンを通じて(「オフライン増強」)適用されます。その理由はいくつかあります:

  1. モデルの再現性が向上する。Roboflowでは、各画像がどのように増強されたかのコピーが残ります。たとえば、モデルが暗い画像より明るい画像でより良く動作することが分かれば、低照度のトレーニングデータをより多く収集すべきです。

  2. トレーニング時間が短くなる。増強はCPUに依存する処理です。GPUでトレーニングを行いながらオンザフライで増強を実行すると、エポックごとにCPUが増強済みデータを用意するのをGPUが待つことになりがちです。それが積み重なります!

  3. トレーニングコストが削減される。増強はCPU依存の処理であるため、高価なレンタルGPUがトレーニング用の画像を供給されるのを待つ時間が発生しやすくなります。

増強の適用方法

増強は常にトレーニング画像に対して 前処理ステップの後に適用されます。選択された増強は積み重ねられ、増強設定と各設定値はランダム化されて各増強画像に適用されます。この過程で重複する画像が出た場合は、作成されたバージョンから除外されます。

例えば、「左右反転」と「ソルト&ペッパーノイズ」を選択した場合、ある画像はランダムに左右反転され、ランダムなソルト&ペッパーノイズが付与されます。

増強の制限

増強を含むデータセットバージョンを作成する際、「Maximum Version Size」オプションで含める増強済み画像の最大数を選択できます。

例えば、3xを選択すると、最終データセットバージョンには各トレーニング元画像が 前処理ステップ 適用され、選択した設定に基づく各画像のランダムな2つの増強が含まれます。

データセットに100枚の画像があり、train/valid/test を70/20/10に分割していて3x増強を選んだ場合、最終データセットはおおよそ210/20/10の分割になります。

circle-info

バージョンの最終的な画像数は、画像の重複排除や「Filter Null」のような特定のオプションによって出力から画像が除外されるため、この推定より小さくなることがあります。

増強オプション

Roboflowの増強は「Basic」または「Enhanced」のいずれかで、2つの異なるレベルで適用できます。

画像レベル増強

画像レベル増強は、個々の物体や領域ではなく画像全体に変換を適用して新しいトレーニングデータを作成します。画像全体を変更することで、より幅広い視覚条件をシミュレートでき、モデルが新しいデータに対してよりよく汎化することを助けます。

バウンディングボックスレベル増強

バウンディングボックスレベル増強は、ソース画像のバウンディングボックスの内容だけを変更して新しいトレーニングデータを作成します。これにより、問題の条件により適したトレーニングデータを作成するための制御性が高まります。

A 2019年の論文arrow-up-right Googleの研究者による論文は、バウンディングボックスのみの増強を用いてモデルにとって最適なデータを作成するというアイデアを紹介しています。この論文では、バウンディングボックスのみの修正が体系的な改善を生むこと、特に小規模データセットで適合させたモデルに効果があることが示されました。

circle-info

Enhanced Augmentations と Bounding Box Augmentations は プレミアム 機能です。

プランとそれに関連する機能の最新情報は、当社の 価格ページarrow-up-right.

画像レベル増強
バウンディングボックス増強
増強タイプ

詳細を学ぶ

Last updated

Was this helpful?