見出し画像

【最新】YOLOv9の使い方解説+リアルタイムの物体検出を利用した簡単なアプリを実装する【Python】

この記事では、YOLOv9 の基本的な使用方法を学び、YOLOv9 によりリアルタイムに検出した結果を利用した簡単な Python アプリケーションを実装します。


<概要>

はじめに

この本では、最新モデル YOLOv9 の基本的な使用方法を学び、YOLOv9 によりリアルタイムに検出した結果を利用した簡単な Python アプリケーションを実装します。

YOLOv9 のコマンドを動かしながら基本的な使用方法を学んだ後、Webカメラによりリアルタイムに撮影中の動画から YOLOv9 で物体検出を行い、その検出結果を利用した簡単な Python アプリケーションの実装まで行います。

YOLOv9 とは?

YOLO(You Only Look Once)は、リアルタイム物体検出アルゴリズムです。

フリー素材に YOLOv9 を適用

単一のニューラルネットワークを使用して高速かつ効率的に物体を検出します。一度の推論で画像全体をスキャンし、物体の位置とクラスを同時に特定します。このアルゴリズムは、高速性と正確性のバランスに優れており、自動運転、監視システム、人物追跡など、リアルタイム性が重要なタスクに特に適しています。

中でも、「v9」は2024年2月にリリースされたこの本執筆時点(2024年3月)の最新モデルであり、従来よりも高速かつ精度が向上しております。

出典:YOLOv9 - GitHub

YOLOv9は、ディープニューラルネットワーク特有の情報損失の課題を克服する革新的なアプローチを導入しております。YOLOv9はモデルの学習能力を高めるだけでなく、検出プロセス全体を通して重要な情報を確実に保持し、卓越した精度とパフォーマンスを実現しております。

出典:YOLOv9:飛躍的に進歩した物体検出技術

YOLOv9 のライセンスは、「GNU General Public License v3.0」であり、 ライセンス・著作権・出典を開示するなどの条件をクリアすることで、商用でも無料で利用することが可能です。オープンソースで提供されていることが人気の理由の一つでもあります。

出典:YOLOv9 ライセンス

この本で学べること

  • YOLOv9 の基本的な使用方法

  • YOLOv9 でリアルタイムに物体検出を行う方法

  • リアルタイムの検出結果を利用する方法

実務活用例

  • 特定の物体を検出した際に動作する、ロボットアームの目として使用

  • 特定の物体を検出したことをキーとした、暗証鍵として使用

  • 特定の物体を検出した際に駆動する仕掛けとして、謎解きのギミックに使用


注意1:
この本は、以下の本の YOLOv9 版です。両方をご購入される方は、予めご留意下さい。
【Python】YOLOv8の使い方解説+リアルタイムの物体検出を利用した簡単なアプリの実装手順

注意2:
YOLOv9は、将来的に Ultralytics パッケージに統合される予定とのことですが、この本執筆時点(2024年3月)では Ultralytics パッケージに統合されておらず、YOLOv8 ほど使用し易い状態ではありません。それでも精度や速度が向上した YOLOv9 をいち早く試したい方に向けてこの本を執筆しております。Ultralytics パッケージに統合され次第、より使用し易い手順が公開される可能性があります。予めご留意下さい。


<実装準備>

環境

この本では、以下のような開発環境、ツールを使用します。

開発環境

OS:Windows or Mac
エディタ:お好きなテキストエディタ(サクラエディタ、Visual Studio Code、CotEditorなど)

その他:Webカメラ(PCに内蔵されているカメラもしくは外付けのカメラ)

ツール

  • Python(バージョン3.7以上)

  • yolov9

環境構築

Python(バージョン3.7以上)がインストールされていない場合、インストールします。
(既にインストール済みの方は手順をスキップして下さい。)
(その他の必要なものは実装手順の中で説明します。)

  • Python
    Python 公式サイトの「Downloads」よりモジュールをダウンロードし、インストールします。

ここから先は

23,614字 / 21画像

¥ 1,000

期間限定 PayPay支払いすると抽選でお得に!

この記事が気に入ったらサポートをしてみませんか?