- 運営しているクリエイター
2024年4月の記事一覧
ゲーム「GTA5」使って未来の自動運転車の安全を鍛える #CVPR2024
世界中のコンピュータビジョンとパターン認識の最先端の論文が集まる国際会議「CVPR2024」採択論文が公開されました。
https://cvpr.thecvf.com/Conferences/2024/AcceptedPapers
採択論文の中に「FAMix」という自動運転車のためのコンピュータビジョン研究で、興味深い論文があったので しらいはかせさん(X@o_ob)が 紹介します。
🍴 FA
エール ―若き画像研究の旗手へ― 第3回 「物体指紋」で画像技術界をバズらせた石山塁博士―モノのタグなし認証技術―
序「物体指紋」の石山塁博士
ビジョン技術の実利用ワークショップ(ViEW2011)のIS会場ゾーン左手奥にて石山塁博士が,はにかみながら熱弁されていた。ViEW2014(機械部品の話題)の時だと本人はおっしゃるが,ViEW2011(メロンの話題)である。その様子が他にない強い印象であった。
初めてお声かけしたときの記憶は鮮明である。石山さんの所属は「NEC情報メディアプロセッシング研究所」であ
アノテーションせずに物体検知してみた(YOLO-World v2モデル)
分析屋の町田です。
AIによる画像認識を行う場合、通常、膨大な数の画像をアノテーションする必要があります。しかしながら、2024年に発表されたYOLO-World v2というモデルを使用することにより、アノテーションを全く行わずに物体検知を実現することが可能となります。今回は、アノテーションレスの物体検知を実現するAIモデル「YOLO-World」の概要と実際の使い方を紹介します。
YOLO-
画像からテキストを検出するwebアプリを開発してみました
はじめに自己紹介
むぎなすびと申します。むぎは飼い猫の名前です。職業はメーカーの研究開発職(非IT業務)で、プログラミングの初心者です。DXスキルを身につけるために、アプリ開発にチャレンジしました。
背景
この記事は筆者が通うプログラミングスクール Aidemy Premium のカリキュラムの一環で卒業制作の記録として書いたもので、受講修了条件を満たすために公開しています。
タイ
【中級】Marigold(AI深度マップ生成)を使う
想定する読者AI深度マップ生成を利用して Blender で使いたい人
Blender の基本的な操作ができる人
はじめにMarigold(Repurposing Diffusion-Based Image Generators for Monocular Depth Estimation)という手法を使うと、任意の画像からAIで深度マップを作成する事ができます。このソフトウェアを利用し、Bl
Ultralyticsの自動アノテーションを試してみた
概要ultralyticsライブラリのセグメンテーション向け自動アノテーション関数auto_annotateを試してみました。
YOLO形式での出力時に塞がれてしまう🍩の穴を復活させる方法を調査して試してみました。
実施内容Google ColabのCPU環境で試しました。
準備
ライブラリインストールとリポジトリのクローンします。
!pip install ultralytics!