ボックスプロンプト

例を重ねるごとに改善されるAIラベリングツールで画像にアノテーションを付けます。

ボックスプロンプティングは多くの中の一つです AIラベリング 機能です。この機能を使用すると クレジット が、当社の クレジットページ.

アノテーションツールバーでボックスプロンプティングを有効にします。

ボックスプロンプティングは、1つ以上のプロンプトバウンディングボックスを使って、類似したオブジェクトのアノテーションを生成します。各例はモデルを微調整し、画像ごとに精度が向上します。ボックスプロンプティングを使えば、データセット内で複数回現れるオブジェクトのバウンディングボックスを手動で描く時間を大幅に節約できます。

ステップ1:各クラスの例を少なくとも1つアノテーションする

ボックスプロンプティングでは、予測生成の例として少なくとも1つのバウンディングボックスアノテーションを作成する必要があります。

ステップ2:ボックスプロンプティングツールを有効にする

ボックスプロンプティングツールが有効になっていることを確認して、マジックを体験しましょう!ボックスプロンプティングはあなたのアノテーションに基づいて予測を生成します。予測は、アノテーションを保存または削除するたびに点線で表示されます。

予測はアノテーションではなく、画像から離れると保存されません。予測を保存する方法はステップ4をご覧ください。

ステップ3:予測を微調整する

ここからできること:

信頼度を調整する

スライダーを使って信頼度のしきい値を調整し、表示される予測の数を変更します。信頼度が高いほど予測数は少なくなります。

信頼度のしきい値を変更して表示される予測数を調整します。

ネガティブ例を提供する

誤った予測があった場合、ボックスを右クリックして「ネガティブに変換」を選択できます。これにより、今後このタイプのオブジェクトをラベル付けしないようモデルに教えることができます。ネガティブ例は色付きで表示されます。

既存のアノテーションも同じ右クリックメニューからネガティブに変換できます。

誤った予測を右クリックして ネガティブに変換 してネガティブプロンプトを提供します。

追加の例を追加する

他のラベルで作成した追加のアノテーションは、画像内の異なるオブジェクトをモデルが区別するのに役立ちます。例を追加した後、「予測」をクリックして新しい予測を生成できます。

最良の結果を得るには、画像内のすべてのユニークなオブジェクトに1~2例を提供してください。

信頼度を高く設定するよりも、信頼度を下げて余分な予測をネガティブに変換する方が、予測の微調整が簡単な場合があります。

ステップ4:予測を承認する

予測が満足いくものになったら、「予測を承認」をクリックします。これにより、すべての予測がアノテーションに変換され、離れても保存されます。

ここからは、通常通りアノテーションの編集や削除ができます。

予測を承認して画像に保存します。

ステップ5:さらに多くの画像で実行する

アノテーションを行うと、画像がトレーニングセットに追加されます。

画像にアノテーションを付けると、ボックスプロンプティングは人が描いた、または編集したアノテーションがある画像でトレーニングされます。(編集なしで承認された予測は含まれません。)

つまり、新しい画像でボックスを1つも描かずに「予測」をクリックしても予測を生成できます!ツールメニューでトレーニングセットに含まれる画像数を確認できます。

ベストプラクティス

見た目が異なる各オブジェクトの例を提供してください。

見た目が似ている複数のオブジェクトが含まれる画像では、主要な色、サイズ、カメラアングルごとに少なくとも1例を提供すると効果的です。

類似した画像は同じアノテーションセッションでアノテーションしてください。

ボックスプロンプティングは、画像の内容が似ている場合に最も効果を発揮し、トレーニング例を素早く再利用しながら予測を生成できます。

バウンディングボックスをきつくして誤差の蓄積を防ぎましょう。

予測されたバウンディングボックスはしばしば本来より大きくなりがちなので、背景の一部を誤って含めないようサイズを小さくしましょう。

ボックスプロンプティングは写真や静止画で最も効果を発揮します。

ドキュメントやコンピュータグラフィックスにも予測を提供できますが、ボックスプロンプティングは写真内の繰り返しアイテムの識別に最適です。

精度向上のためにネガティブ例を提供しましょう。

特定のアノテーションクラスで誤検出が多い場合、右クリックして「ネガティブに変換」を選択し、ボックスプロンプティングモデルにネガティブ例を提供できます。

制限事項

ボックスプロンプティングモデルは推論時に画像をダウンスケールする必要があります。そのため、大きな画像で小さなアイテムを検出しようとすると満足のいく結果が得られない場合があります。

どちらかの辺が1000px以下の画像で最適な結果が得られます。画像が2000px以上でバウンディングボックスが小さい(幅/高さの約5%未満)場合はうまく動作しない旨の警告が表示されます。

これらの制限はボックスプロンプティングのみに適用されます。モデル学習時には、 前処理ステップ としてタイル処理をバージョン生成時に適用し、学習済みモデルでこれらの影響を防ぐことができます。

Last updated

Was this helpful?