# Dataset Analytics

Dataset Analytics は、プロジェクトに関連付けられたデータセットに関するさまざまな統計情報を表示します。次の情報を確認できます:

* データセット内の画像数;
* アノテーション数;
* 平均画像サイズ;
* 画像の比率の中央値;
* 欠落しているアノテーション数;
* null のアノテーション数;
* データセット全体の画像の寸法;
* オブジェクト数のヒストグラム;
* アノテーション位置のヒートマップ。

Dataset Analytics を使用すると、データセットについてさまざまな洞察を得ることができます。たとえば、null のアノテーションがない場合、作業中のプロジェクトに応じていくつか追加することを検討するとよいでしょう。欠落しているアノテーションがある画像がある場合は、必要なアノテーションを追加するためにさらに詳しく調べることができます。

プロジェクトの Dataset Analytics を表示するには、プロジェクトの左サイドバーにある「Analytics」をクリックします:

<figure><img src="/files/3b5deee939a23dbc6917851cc42c248b185be21e" alt=""><figcaption></figcaption></figure>

すると Dataset Analytics タブが開きます:

<figure><img src="/files/4a81e80cd4172fc198fce79d3f7744b57e86e85a" alt=""><figcaption></figcaption></figure>

このページでは、次の内容を確認できます:

* train、test、valid の各データセットに含まれる画像内のクラス数の内訳。
* データセット内の画像のサイズとアスペクト比の概要。
* アノテーションが最も多い場所を示すヒートマップ。
* データセット内の各画像にいくつのクラスがアノテーションされているかを示すヒストグラム。

### Dimension Insights

Dimension Insights セクションでは、データセット内の生画像のサイズとアスペクト比を説明します。

プロジェクトバージョンを作成するときに Resize の拡張を適用する場合 — ほとんどすべてのユースケースで強く推奨します — そのバージョン内の画像はリサイズされますが、生画像はそのまま維持されます。

<figure><img src="/files/5257985495865046c75716f74f4bdf19d601169e" alt=""><figcaption></figcaption></figure>

### Annotation Heat Map

モデルを学習するときは、データセットがモデルをデプロイする環境を反映していることが重要です。

モデルを、アノテーションがカメラフレーム内のどこにでも現れる可能性がある環境にデプロイする場合 — たとえば、異なるサイズの物体がリアルタイムで動いている工場ラインや、物体を撮影したスマートフォン画像など — 画像内のさまざまな場所に現れるオブジェクトにアノテーションすることが重要です。

画像の異なる部分にあるオブジェクトにラベル付けすることで、モデルが特定の場所にあるオブジェクトを識別する方法だけを学習してしまう過学習を防げます。

Annotation Heat Map は、画像内のどこにアノテーションが多いか少ないかを示します。これは、データセットのアノテーションが特定の場所に集中しすぎている状況を特定するのに役立ちます。

<figure><img src="/files/18cfaf034759c4cf3e05a4aa1822b99a7a88ea8a" alt=""><figcaption></figcaption></figure>

Heat Map 上で領域をドラッグすると、選択した範囲の画像を表示できます:

<figure><img src="/files/3b3051b0ef82fffa6056df28ac4e87512a834148" alt=""><figcaption></figcaption></figure>

### 画像ごとのオブジェクト数のヒストグラム

各画像にアノテーションされたオブジェクトがいくつ含まれているかの分布を示します。

モデルに入力する画像にオブジェクトの複数のインスタンスが含まれる可能性がある場合は、データセットにオブジェクトのインスタンス数が異なる画像を含めることをおすすめします。これにより、対象オブジェクトがない画像、1つある画像、複数ある画像に対しても、モデルが適切に一般化できるようになります。

これはヒストグラムの例です:

<figure><img src="/files/09499223272cbd8960edc80de98634019b30e959" alt=""><figcaption></figcaption></figure>

ヒストグラム上の任意のバーを選択すると、指定した件数の画像を表示できます:

<figure><img src="/files/a3dbff94584ff1253ab1c3e686eabe9bed7c16f5" alt=""><figcaption></figcaption></figure>


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.roboflow.com/roboflow/roboflow-jp/datasets/dataset-health-check.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
