> For the complete documentation index, see [llms.txt](https://docs.roboflow.com/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.roboflow.com/roboflow/roboflow-jp/annotate/annotate-multimodal-data.md).

# Multimodal Data をアノテーション

Multimodal project の一部であるデータセットにラベリングする場合、画像へのアノテーションにプレフィックスを使用します。

プレフィックスは次のいずれかです：

* 次のような識別子 `<PREFIX>`で、 [VLM](https://blog.roboflow.com/what-is-a-vision-language-model/) のようなモデルにプロンプトを与えるために使われるもの、または；
* 「この画像には何がありますか？」のような質問で、GPT-4o のような一般的な VQA モデルでの使用に最適です。

たとえば Florence-2 の fine-tuning では、選択したプレフィックスはモデルに与えるプレフィックスプロンプトに対応します。Florence-2 では、プレフィックスは次の形式である必要があります `<PREFIX>`、たとえば `<TOTAL>`.

GPT-4o では、プレフィックスは「このレシートの合計はいくらですか？」のようにできます。

識別したいオブジェクト内の total、subtotal、tax などの異なる特徴ごとに、異なるプレフィックスを追加したい場合があります。

### Add Prefixes

プレフィックスを追加するには、Roboflow のサイドバーで「Classes & Tags」をクリックし、次に「Add 」ボタンをクリックします：

<figure><img src="/files/f4760b4897928453a9ea985204350d697af2be4b" alt=""><figcaption></figcaption></figure>

次に、プレフィックスを入力します。これは、「この画像には何がありますか？」のような質問や、「\<RECEIPT>」のような一意の ID になります。どのモデルをトレーニングするかによって異なります。

「+」ボタンで複数のプレフィックスを追加できます。

プレフィックスを追加するには、「Add Prefixes」をクリックします。

プレフィックスを設定すると、アノテーションエディタで質問として利用できるようになります：

<figure><img src="/files/b08a93334e70bd3a128ec7eea5b1ee7b9ed8f06e" alt=""><figcaption></figcaption></figure>


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.roboflow.com/roboflow/roboflow-jp/annotate/annotate-multimodal-data.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
