見出し画像

精度99.9%!PIXTAのアノテーションが高品質な3つの理由②

こんにちは、野本です!
この記事はシリーズ第2弾です。よろしければ理由①の記事からご覧ください。

タイトルにもある通り、PIXTAのアノテーションサービスの精度は99.98%。納品完了後に、ほとんど修正が発生することがありません。
なぜこんなに高精度なアノテーションを実現できているのか?
理由は3つあります。

① ストックフォト審査経験を活かしたスキルと技術
② AI開発経験から学んだデータの価値が分かっている
③ 品質を確保するための徹底した工程管理

今回はその理由2つ目、
② AI開発経験から学んだデータの価値が分かっている』についてお伝えします!

アノテーション委託に関して、
・納品されたデータが思ってたのと違った
・納品後の修正対象が沢山発生してしまった
・修正のために追加費用も時間もかかった
といったご経験をお持ちの方にとって、参考になれば幸いです。


開発経験から感じるデータの重要さ

ピクスタ社では、様々なAI開発を行い、各事業に活かしています。
たとえば、理由①で紹介したPIXTAの自動審査では、被写体を識別するAI技術を使用しています。
PIXTAサイトで販売している9,800万点以上(※2024年10月現在)の膨大なデータから、イメージに合う画像を見つけるための検索画面でも、人の表情や、顔の向き、構図など、画像内の情報を識別するAIを開発して組み込んでいますし、家族向け出張撮影サービスfotowaでも、撮影データからAI技術を用いて自動でフォトブックのレイアウトを組むサービスも展開しています。

実際に開発しているからこそ、わかるんです。
いかに学習データが重要であるかを!

学習データは、ただたくさんあれば良いわけではありません。
開発したいものに合わせた、必要な要件を満たしたデータでなければ、正しい学習がなされないからです。

だからこそ、アノテーションは精度が命なんです。
アノテーションの精度を担保するために、最も重要なのが品質管理、つまり検品の工程。
(みなさんも、アノテーション業者を選定する時はどのように品質管理をしているか、絶対に確認してくださいね!)
PIXTAでも当然、入念な品質管理を行っていますが、この話は理由③に預けるとして、ここでは品質管理以外の、もうひとつ重要な要素をお伝えします。
それが、アノテーターの力量です。

品質を支える「画像のプロ」の知見

アノテーション業者は、大きく分けて5つの分類があります。

  • クラウドソーシング型

  • アウトソーシング型

  • 海外オフショア型

  • 独自ツール型

  • AI開発型

細かい説明は省きますが、ざっくり解説すると、クラウドソーシング型は、自社でクラウドワーカーを抱える企業がクラウドワーカーを活用してアノテーションを行うサービス。
アウトソーシング型は、アウトソーシング業務に長けた企業が品質管理ノウハウを活かしてアノテーション業務を請け負うサービス。
海外オフショア型は、海外拠点を持つ企業が海外スタッフを活用することでアノテーションを提供しています。
独自ツール型は、アノテーターが正確に作業できる独自ツールや自社が保有する様々なソリューションを活用するスタイルのサービスです。
そしてAI開発型は、自社が持つAI技術のノウハウを活用したアノテーションサービスです。

どの型も品質管理を行うことで精度を担保していることを前提に話を進めます。
この5つの中で、アノテーションを付与する人(アノテーター)自身に、AI開発データに対する深い造詣があるのは、「AI開発型」だけです。

そして、PIXTAは冒頭でご紹介した通り、様々なAI開発を行い自社サービスに展開しているAI開発型のアノテーションサービスです。
そのAI開発を行っているのが、子会社PIXTA Vietnamなので、海外オフショア型でもあります。
さらに、自動審査ツールを応用した独自ツールも活用しているので、独自ツール型の要素もある複合型です。

AIデータの重要性を理解し、深い造詣を持ったスタッフが仕様書の作成からアノテーションを行っているということ。
そして、理由その①でご紹介したように、画像審査で画像を目視で識別する能力に長けた画像のプロフェッショナルとも言えるスタッフがアノテーターとして活躍していること。

この2つの強みが、アノテーターの高い力量につながり、精度99.98%を実現しているのです。

造詣が深いからこそ、アノテーション作業前に、どのような目的でデータを利用したいのか、目標達成に十分なアノテーションか、ご指示いただいた使用で問題なく作業できるかの確認も的確に行えます。
的確な仕様書を元に、サンプルデータを作成・ご確認いただいた後に、高い力量を持ったアノテーターが作業を進める。

これが、PIXTAの高い精度のアノテーションの秘密なのです。


==================================
今後、定期的に更新していきますので、
ぜひこちらのアカウントをフォローしていただけると嬉しいです!
この記事への「スキ」もお待ちしています!
PIXTA機械学習用画像・動画データ提供サービス
※資料ダウンロードもすぐに可能です!お気軽にどうぞ。https://pixta.jp/machinelearning-dataset