はじめてのキーポイント検出 by YOLO
やってみました。意外と楽しいのでシェア。
キーポイント検出とは
キーポイント検出とは、画像や動画に現れる物体のランドマークを検出する行為です。ランドマークとは、間接、目、鼻など、物体中の重要部位のことです。
この技術を用いると、スポーツをしている人のフォーム分析や、料理をしている人の動きの特徴を分析することが可能となります。
YOLOv7 poseによるキーポイント検出の解説として、以下が分かりやすかったので紹介しておきます。
https://learnopencv.com/yolov7-pose-vs-mediapipe-in-human-pose-estimation/
キーポイント検出のプログラミング例
この技術を搭載したYOLOv7 poseのモデルや、そのモデルを用いたアプリケーションプログラムは無償公開されており、それらを用いてキーポイント検出を楽しむことができます。
筆者は、Muhammad Rizwan Munawarさんのプログラム「yolo7-pose-estimation」をGoogle Colab無料枠で動作するように仕立ててみました。こちらからアクセス可能です。.mp4ファイルを準備してお楽しみください。
https://colab.research.google.com/drive/1h3Zg6j1rqQY83hSxDq7p_A5i92IXeZDP?usp=sharing
キーポイント検出の入力となる.mp4ファイルの準備の仕方
筆者は主にiPhoneで動画撮影しているのですが、iPhoneだと直接.mp4を作ることができず、.movファイルを作ることしかできないようです。そこで、.movファイルをWindows11上のフォトとClipchampを用いて、.mp4ファイルに変換しています。
と、今でこそ簡単に解説できるものの、当初は筆者もちょっと苦労しましたので、詳しい手順を「iPhoneで録画した.movファイルをトリミングし、.mp4に変換する無料で安全そうな方法 (Win11)」に記載しておきました。参考にしてみてください m(_)m
今すぐプログラム動作を試したい方のためのサンプルMP4ファイル
サンプルプログラムでは、途中でMuhammad Rizwan Munawarさんのプログラム「yolo7-pose-estimation」をgit cloneにより取り込んでいます。このフォルダの中にfootball1.mp4というファイルが入っていますので、こちらを使って頂くとよいかと思います。
あと、ファイル差し替えのテストに使えるファイルをいちおう準備しておきました。単純すぎる動画なのでキーポイント検出のテストはできませんが、プログラムの動作確認には使用できます。ご活用ください。
以上で動作確認できましたら、ぜひスマホなどで動画撮影して、ご自身の動画のキーポイント検出をやってみて下さい!
.movを途中でMP4に変換した上でキーポイント検出を行うプログラム例 (開発中)
やっぱり、iPhoneで撮影した.movから直接キーポイント検出したいので、そのためのプログラムを開発中です。
この記事が気に入ったらサポートをしてみませんか?