見出し画像

AI品質向上に不可欠なアノテーション

アノテーションとは

アノテーションという言葉をご存知でしょうか。

AI(人工知能)開発において、その学習に不可欠なものが「アノテーション」です。

テキスト・画像・音声など、さまざまな形式のデータに対して、コンピュータが理解できるようにタグをつけていくのがアノテーションです。

アノテーションを行って正解のデータを付与し、何が正しいかをAIに学習させます。次に、未知のデータを読み込ませ、そのデータが正解であるか否かをAIに正しく判断させます。次第に精度を高めていき、実装していく、という流れです。完全にAIによってデータの読み込みから判断までの作業を自動化できれば、画像や動画などのデータを指定のカテゴリに分類してくれるようになるのです。迷惑メールの自動振り分けなど、そのメリットは多岐に渡ります。

アノテーションは代行するもの?

AI開発にはアノテーションが重要となりますが、アノテーションの「タグ付け」という作業は決して簡単なものとは言えません。

AIを開発していく上では大量のデータを扱っていく必要がありますし、そのデータも多種多様なものになる可能性があります。その大量のデータを適切に扱っていくことは簡単ではありませんし、何より専門的な知識が求められます。そのため、専門的な知識を持つ従業員がいない企業が一からアノテーションを含めたAI開発に着手するのは現実的とは言えないでしょう。とはいえ、専門知識を持つ担当者がいないというだけでAIの開発や運用を諦めてしまう必要もありません。最近ではアノテーション作業や品質チェックなどの代行サービスを提供する企業が増加しているからです。

その一例として、アノテーション作業や品質管理、そして管理進行まで、すべての業務を任せていくことが可能なプラットフォーム(アプリケーションが動作する環境)が増加しつつあります。こういったプラットフォームを活用していけば、専門知識を持つ担当者が存在しない企業や、開発コストの捻出が難しい企業などでも、AIの運用を検討していくことができるでしょう。

アノテーション専門の支援をする企業に外注することをおすすめします。

アノテーション代行企業

アノテーション支援企業の中で特におすすめの3社をご紹介します。

Lionbridge AI
https://www.telusinternational.com/
Lionbridge AIは、ライオンブリッジジャパン株式会社が提供するサービスです。数十年に渡りAI教師データ提供してきたノウハウと、100万人以上のアノテーターを擁することから、大量のデータをすばやく処理することができます。また、自社開発のプラットフォームは、固有表現抽出、感情タグ、画像のバウンディングボックスなど、さまざまなアノテーションやデータタイプに対応することができます。
アノテーションプロジェクト内の作業が、自社で抱える認定ワーカーに自動割り当てされ、作業がシームレスに進行される他、ワーカーの品質管理および作業の品質評価機能によって、高品質なアノテーション作業が実行される仕組みとなっています。

ANNOTEQ
https://annoteq.com/
ANNOTEQは、2001年に設立された株式会社ユニメディアが提供するサービスです。ANNOTEQでは、実働100万人以上のクラウドワーカーを抱えており、最大限に活用することで大量のアノテーション作業を高速で実施することが可能です。また、書き込んだデータと元データを比較して、内容が違っていないかチェックするコンペアという機能による高精度のデータの抽出機能を活用しています。BPO(ビジネスで発生する業務を外注すること)事業者としての品質管理にも力を入れており、セキュリティ基準やアノテーション要件等を踏まえ、アノテーション作業ごとに専任作業者及びクラウドワーカーを最適に活用しています。

こころとアノテーション
https://ai-annotation.cocoroto-human.co.jp/lp/
こころとアノテーションは、株式会社こころとヒューマンが提供するアノテーションサービスです。こころとアノテーションの特徴は、200名規模の障がい者が作業を担当することです。クラウドワーカーではなく雇用する障がい者がセキュリティセンター内で実施することで、大規模なアノテーションにおいてルールの教育や変更、品質の管理が容易になります。働く障がい者は発達障害傾向のある方を中心とした能力の高い方です。国内の人材だけで低価格大規模のアノテーションを実現する唯一のサービスといえるでしょう。アノテーションはオフショアと考えられがちですが、障がい者の雇用創出にもつながります。