> For the complete documentation index, see [llms.txt](https://docs.roboflow.com/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.roboflow.com/roboflow/roboflow-jp/datasets/dataset-health-check.md). # Dataset Health Check Dataset Health Checkでは、プロジェクトに関連付けられたデータセットに関するさまざまな統計情報を表示します。次の情報を確認できます: * データセット内の画像数; * アノテーション数; * 平均画像サイズ; * 画像比率の中央値; * 欠落しているアノテーション数; * nullアノテーション数; * データセット全体の画像の寸法; * オブジェクト数のヒストグラム; * アノテーション位置のヒートマップ。 Dataset Health Checkを使うと、データセットについてさまざまな洞察を得ることができます。たとえば、nullアノテーションがない場合は、作業しているプロジェクトに応じていくつか追加することを検討するとよいでしょう。欠落しているアノテーションがある画像があれば、必要なアノテーションを追加するためにさらに詳しく確認できます。プロジェクトのHealth Checkを表示するには、Datasetページを開き、"Health Check"タブをクリックします:

すると、Health Checkタブが開きます:

このページでは、次の内容を確認できます: * train、test、valid の各データセットに含まれる画像のクラス数の内訳。 * データセット内の画像サイズとアスペクト比の概要。 * アノテーションが最も多い場所を示すヒートマップ。 * データセット内の各画像でアノテーションされているクラス数を示すヒストグラム。 ### Dimension Insights Dimension Insightsセクションでは、データセット内の元画像のサイズとアスペクト比を説明します。プロジェクトバージョンを作成する際にResize augmentationを適用すると、ほぼすべてのユースケースで強く推奨されますが、バージョン内の画像はリサイズされても、元画像はそのまま維持されます。

### Annotation Heat Map モデルを学習させる際には、データセットがモデルのデプロイ先の条件を反映していることが重要です。モデルを、アノテーションがカメラフレーム内のどこにでも現れる可能性がある環境にデプロイする場合、たとえば異なるサイズの物体がリアルタイムで動いている工場ラインや、物体をスマートフォンで撮影した画像などでは、画像内のさまざまな場所に現れる物体にアノテーションを付けることが重要です。画像のさまざまな部分にある物体にラベル付けすることで、モデルが特定の場所にある物体だけを識別するように過学習するのを防げます。 Annotation Heat Mapでは、画像内のどの場所にアノテーションが多いか少ないかを表示します。これにより、データセットのアノテーションが特定の場所に偏りすぎているシナリオを特定できます。

Heat Map上の任意の領域をドラッグすると、選択した範囲の画像を表示できます:

### 画像ごとのオブジェクト数のヒストグラムこれは、各画像にどれだけのアノテーション済みオブジェクトが含まれているかの分布を示します。モデルに通す画像に1つのオブジェクトの複数インスタンスが含まれる可能性がある場合は、データセットにさまざまな数のオブジェクトインスタンスを含む画像があることを確認することをおすすめします。これにより、関心対象のオブジェクトがない画像、1つある画像、複数ある画像に対してもモデルが適切に一般化できるようになります。以下はヒストグラムの例です:

ヒストグラム上の任意の棒を選択すると、指定した件数の画像を表示できます: