見出し画像

画像アノテーションプロジェクトを開始する為に必要な8つの情報

昨今、あらゆる産業でのAIの活用ニーズが高まっている中、それに伴い、教師データ作成のアウトソースの需要が急激に拡大しています。
弊社でも、画像アノテーション案件のお引き合いを多数頂いておりますが、その中で、数多くの質問・お問い合わせを受けて参りました。

特に、はじめてアノテーション業務をアウトソースする法人様からは、「そもそも、アノテーション対象の画像・動画以外に、どのような情報を伝えれば、作業可能か?」というお問い合わせをよく頂きます。

今回は、アノテーション作業を行わせて頂く上で、御客様からご共有頂く必要のある情報についてまとめてみたいと思います。

下記の8点です。

1.アノテーション対象
2.ボリューム
3.アノテーションツール
4.アノテーションルール(仕様)
5.インプット・アウトプットの受け渡し方法
6.アウトプット形式
7.インプットご提供タイミング
8.納期

1.アノテーション対象

→どのような画像 or 動画を対象とするのか?何が写っているどのような画像 or 動画か?等、アノテーション対象のインプットデータについての情報をご共有頂きます。
 動画としてお持ちの素材を静止画として切り出すような前処理も含めて、おまかせ頂く場合もございます。

2.ボリューム(画像の枚数、動画の長さ)

→画像であれば、何万枚なのか、また、どれほどの長さの動画が何本であるのか。
 あまりにも少ない場合は、お受けできない場合もございますが、最終的に全体作業量(「平均作業工数/枚 × 画像の枚数」)として評価させて頂いた上で、お受けできるか否かについて回答させて頂いております。

3.アノテーションツール

→御客様独自のアノテーションツールを使用する、あるいは、ご指定頂いたツールで作業させて頂くことがほとんどですが、過去には、アノテーションツールの選定も含めて、ご相談頂いた際には、MicrosoftのVoTTや、日本製のAnnoFabのツールをご提案させて頂きました。

4.アノテーションルール(仕様)

→「どのように物体検出し」、「その検出した物体に何のラベルを付けるのか?」等、アノテーションの仕様について可能な限り定義頂いております。
 たとえば、物体検出については、矩形、ポリゴン、ライン、ドットあるいはsemantic segmentation等、どのように対象を特定するのか?、ラベル付けについては、その対象に文字、名称、状態等、どのようなラベルを貼り付けるのか?というような情報を、可能な限り、細かく頂けるようお願いしております。
 御客様から頂いたルールで見積を行いますが、その見積作業の中で、ルールに対しての不明点、疑問点等、確認を要する点も出て参りますので、その都度、御客様とコミュニケーションさせて行きながら、ルールの精度を上げていくことになります。

5.インプット・アウトプットの受け渡し方法

→御客様によっては、独自の外部ストレージアプリをお持ちの場合もありますが、基本的にはDropbox、Box、S3(AWS)、Blob(Azure)等の外部ストレージサービス等をご指定頂く場合がほとんどです。御客様に拘りがない場合は、DropBoxを使わせて頂きますが、御客様側でDropboxアカウントを取得頂く必要がございます。

6.アウトプット形式

→基本的には、御客様独自のアノテーションツールを使用する場合が多く、ツールの指定に伴い、JSON、PascalVOC、XML等のアウトプット形式も決まって参りますが、アノテーションツールに拘りが無い場合は、ご指定頂くケースがほとんどです。

7.インプットご提供タイミング

→見積用、(ご契約させて頂いた後の)本作業用、各々のインプットを頂けるタイミングを伺っております。また、五月雨式にインプットを頂く(作業を行う)場合、前半のアノテーション結果次第で、後半にご提供頂けるインプットデータを変えるケース(※)もございますが、その五月雨式のインプット共有スケジュールについても可能な限り、ご共有頂いております。
※例えば、通常、各々のラベルに対して、同量のサンプル数を期待される場合が多いのですが、その場合、1度目のインプットの共有の後、作業を行い、特定のラベルのサンプル数が他のラベルに比べて少ないようであれば、2度目のインプットの共有では同ラベルを多めに頂く等のケースです。

8.納期

→一括 or 五月雨式の納品となるのか?五月雨式であれば、どのようなボリュームをどのような頻度で納めさせて頂くかについて、予め見込みベースで合意させて頂きます。

まとめ

今回、ご紹介した内容を準備すれば、アノテーションプロジェクトを開始することは可能です。

ただ、飽くまでも、プロジェクトを始めるための最低限な情報となりますので、さらにプロジェクトを着実に進めていくには、さらに失敗しない為のツボを抑える必要があります。次回は、その失敗しない為に行うべき3つのポイントについて、紹介させて頂きます。

画像アノテーションプロジェクトを失敗させない為に抑えるべき3つのポイント

弊社記事を読んでくださり誠にありがとうございます。 サポートを頂くのも嬉しいのですが、できれば、それよりも↑のリンクから弊社ホームページを訪問頂き、より、私達を知って頂けますと幸いです。