# Dataset Health Check

Dataset Health Check は、プロジェクトに関連付けられたデータセットに関するさまざまな統計情報を表示します。以下の情報を確認できます:

* データセット内の画像数;
* アノテーション数;
* 画像の平均サイズ;
* 画像比率の中央値;
* 不足しているアノテーション数;
* null アノテーション数;
* データセット全体の画像の寸法;
* オブジェクト数のヒストグラム、および;
* アノテーション位置のヒートマップ。

Dataset Health Check を使用すると、データセットについてさまざまなインサイトを得られます。たとえば、null アノテーションが 0 件であれば、作業中のプロジェクトに応じていくつか追加することを検討できます。アノテーションが不足している画像がある場合は、必要なアノテーションを追加するためにさらに詳しく確認できます。

プロジェクトの Health Check を表示するには、Dataset ページを開き、「Health Check」タブをクリックします:

<figure><img src="/files/3b5deee939a23dbc6917851cc42c248b185be21e" alt=""><figcaption></figcaption></figure>

すると Health Check タブが開きます:

<figure><img src="/files/4a81e80cd4172fc198fce79d3f7744b57e86e85a" alt=""><figcaption></figcaption></figure>

このページでは、以下を確認できます:

* train、test、valid データセット内の画像に含まれるクラス数の内訳。
* データセット内の画像のサイズとアスペクト比の概要。
* アノテーションが最も多い場所を示すヒートマップ。
* データセット内の各画像に何クラスがアノテーションされているかを示すヒストグラム。

### Dimension Insights

Dimension Insights セクションでは、データセット内の元画像のサイズとアスペクト比を説明します。

プロジェクト バージョンを作成するときに Resize augmentation を適用した場合 — これはほとんどすべてのユースケースで強く推奨されます — バージョン内の画像はリサイズされますが、元画像はそのまま残ります。

<figure><img src="/files/5257985495865046c75716f74f4bdf19d601169e" alt=""><figcaption></figcaption></figure>

### Annotation Heat Map

モデルをトレーニングする際は、データセットがモデルをデプロイする条件を代表していることが重要です。

モデルが、アノテーションがカメラフレーム内のどこにでも現れうる環境でデプロイされる場合 — たとえば、さまざまなサイズの物体がリアルタイムで動いている工場ラインや、スマートフォンで撮影した物体の画像など — 画像内のさまざまな場所に現れる物体にアノテーションを付けることが重要です。

画像のさまざまな部分にある物体へラベル付けすることで、モデルが特定の場所にある物体の識別方法だけを学習して過学習するのを防げます。

Annotation Heat Map は、画像内のどこにアノテーションが多いか少ないかを示します。これは、データセットのアノテーションが特定の場所に集中しすぎているシナリオを特定するのに役立ちます。

<figure><img src="/files/18cfaf034759c4cf3e05a4aa1822b99a7a88ea8a" alt=""><figcaption></figcaption></figure>

Heat Map 上で領域をドラッグすると、選択した範囲の画像を表示できます:

<figure><img src="/files/3b3051b0ef82fffa6056df28ac4e87512a834148" alt=""><figcaption></figcaption></figure>

### 画像ごとのオブジェクト数のヒストグラム

これは、各画像にいくつのアノテーション済みオブジェクトがあるかの分布を示します。

モデルに入力する画像に複数のオブジェクト インスタンスが含まれる可能性がある場合は、データセットに異なる数のオブジェクト インスタンスを含む画像を用意することをおすすめします。これにより、関心対象のオブジェクトがない画像、1 つある画像、複数ある画像のすべてに対して、モデルがうまく汎化できるようになります。

ここにヒストグラムの例があります:

<figure><img src="/files/09499223272cbd8960edc80de98634019b30e959" alt=""><figcaption></figcaption></figure>

ヒストグラム上の任意のバーを選択すると、その件数の画像を表示できます:

<figure><img src="/files/a3dbff94584ff1253ab1c3e686eabe9bed7c16f5" alt=""><figcaption></figcaption></figure>


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.roboflow.com/roboflow/roboflow-jp/datasets/dataset-health-check.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
