# Datasetバージョンを作成する

バージョンとは、データセットのある時点のスナップショットです。これらのバージョンを保持するのは、モデルの各反復でどの画像、前処理、拡張手順が使われたかを正確に追跡することで、結果を再現する能力を維持できるためです。これにより、データパイプラインのバグや変更によるものではなく、モデルの変更に起因する結果であると確信しながら、さまざまなモデルやフレームワークにわたって科学的にテストできます。

<a href="../../workspaces/key-concepts" class="button primary">重要な概念: Workspaces と Projects とは？</a>

{% hint style="info" %}
一度バージョンが作成されると、それはその時点で固定されます。つまり、画像、アノテーション、その他のデータの追加・削除を含むプロジェクトへの変更は、それ以前に作成されたバージョンには影響しません。
{% endhint %}

### データセットバージョンの作成方法

データセットバージョンを作成するには、Roboflow プロジェクトに関連付けられたサイドバーで「Versions」をクリックします。次に、「Generate New Version」をクリックします。

このページから、新しいデータセットバージョンの train/test/valid の分割を設定し、前処理ステップと拡張を指定できます。

<figure><img src="https://3740591140-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2F-M6S9nPJhEX9FYH6clfW%2Fuploads%2Fgit-blob-15210ee011b26459ed30a427ac60bdfb85934980%2FScreenshot%202023-06-22%20at%2015.37.50.png?alt=media" alt="" width="375"><figcaption></figcaption></figure>

適用したい前処理ステップと拡張を指定したら、「Generate」をクリックします。これにより新しいデータセットバージョンが生成されます。その後、このデータセットバージョンを使用して Roboflow でモデルを学習できます。また、 [データセットをエクスポートして](https://docs.roboflow.com/roboflow/roboflow-jp/datasets/dataset-versions/exporting-data) モデルの手動学習に使用することもできます。

### Train/Validation/Test 分割の再調整

バージョン作成の過程で、学習・検証・テストセットの分割バランスを再調整することもできます。これを行うには、「Step 2: Train/Test Split」に移動し、「Rebalance」ボタンをクリックします。

<figure><img src="https://3740591140-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2F-M6S9nPJhEX9FYH6clfW%2Fuploads%2Fgit-blob-4c91693393b132f1503c086f5ebf67f27dd9a4b9%2Fimage.png?alt=media" alt="" width="375"><figcaption></figcaption></figure>
