- 運営しているクリエイター
2024年9月の記事一覧
ホモグラフィ変換を使って、選手の画像座標を2Dフィールド座標に変換
こんにちは前回はサッカーの選手動画にモザイク処理をかけました。
今回は
ホモグラフィ変換を使って、選手の画像座標を2Dフィールド座標に変換
にチャレンジします。
ホモグラフィ変換とはホモグラフィ変換は、カメラの視点が斜めになっている場合に必要です。これは、画像上で見えるフィールドが平行四辺形や台形のように歪んでいる場合に、実際のサッカー場の2D平面座標に変換するために使われます。ホモグラフィ
PYTHONでサッカープレイヤーをトラッキングしてモザイク処理をする
こんにちは
今回はPYTHONで動画の一部を切り取り
サッカープレイヤーをトラッキングして
さらに人物にモザイクをかける処理をしてみます。
特定の12秒間の動画にして保存Google Driveのマウント
google.colabのdriveモジュールを使って、Google DriveをColabにマウントします。
from google.colab import drivedrive.m
wsl ubuntu 20.04 ORB_SLAM3環境構築
windows ubuntu LTSなどにORB_SLAM3を構築する手順
初心者を対象とします
ubuntuをwsl上にインストールします。やり方(hyper-v等の仮想環境)などの設定は他サイト手順を真似てください。
ubuntuの環境をupdate
Opencv(※c++等で使用するStandAlone)の物を構築します
SLAMの環境構築 SLAMにはいくつかProjectの種類が
Linux/Ubuntu OpenCV
ROSやSLAM等で直接ビルドしたOpenCVを使用する事はマストです
構築方法は各サイトごとにコマンドをぶん投げる程度で構いませんが
以下サイトが非常に有用なので記載致します
https://www.kkaneko.jp/tools/ubuntu/opencv.html
又は下記を参照
上記は他にもかゆい所に手が届くので他技術紹介等もご覧頂きたく存じます
さて、近年においては依然よりOp
はじめてのキーポイント検出 by YOLO
やってみました。意外と楽しいのでシェア。
キーポイント検出とはキーポイント検出とは、画像や動画に現れる物体のランドマークを検出する行為です。ランドマークとは、間接、目、鼻など、物体中の重要部位のことです。
この技術を用いると、スポーツをしている人のフォーム分析や、料理をしている人の動きの特徴を分析することが可能となります。
YOLOv7 poseによるキーポイント検出の解説として、以下が分
Depth Anything V1とV2の結果を見比べる
概要単眼深度推定モデルDepth Anything (以降はV1として記載します)とそのアップデート版にあたるDepth Anything V2を簡単に比較してみました。
V1に比べV2は輪郭がはっきりしており、細部も予測できるようになった印象を受けました。
推論の速度はほぼ同等で、GPU使用量と重みのファイルサイズは同じでした。
Depth Anything V2のSサイズモデルはApa
OpenAIの画像認識とGoogle検索APIでGoogle Lensを再現可能? ベトナムの観光サポートをしてもらってみた【観光×ChatGPT】
こんにちは、 バイタリフィアジアのNiheiです。
普段は、生成AIを活用したプロダクト開発のアドバイザーとしてプロジェクトのサポートを行ったり、PM / PMO をしたりしています。
解決したいこと旅行先でふらふらと街を歩いていると、有名な雰囲気を醸している建造物や、歴史的に価値がありそうな何かがあったとします。
そのときに「これってなんだろう?」と思うことはないでしょうか?
実際にそう思
Grounded-Segment-Anything(Grounded SAM)をWindows11+WLS2+Anacondaで試す
1.Grounded-Segment-Anythingとは、テキスト入力に基づいてあらゆる物体を検出し、セグメンテーションを行うことができる視覚AIシステム。
このシステムは、Grounding DINOとSegment Anythingを組み合わせることで、オープンワールドのシナリオにおいて多様な視覚タスクを実行する能力を持っています。
ユーザーがテキストで対象物を指定すると、システムはその物体