マガジンのカバー画像

CV

146
運営しているクリエイター

2024年4月の記事一覧

ゲーム「GTA5」使って未来の自動運転車の安全を鍛える #CVPR2024

ゲーム「GTA5」使って未来の自動運転車の安全を鍛える #CVPR2024

世界中のコンピュータビジョンとパターン認識の最先端の論文が集まる国際会議「CVPR2024」採択論文が公開されました。
https://cvpr.thecvf.com/Conferences/2024/AcceptedPapers
採択論文の中に「FAMix」という自動運転車のためのコンピュータビジョン研究で、興味深い論文があったので しらいはかせさん(X@o_ob)が 紹介します。

🍴 FA

もっとみる
SAR衛星画像で能登半島地震の被災状況を把握する初めてのトライ

SAR衛星画像で能登半島地震の被災状況を把握する初めてのトライ

はじめに地震や、台風などの自然災害が発生した時に、一番重要なのは被害状況を迅速に把握することです。それによって、迅速かつ適切な救援や、復旧、生活再建活動を行うことができます。災害地の状況を迅速に把握するために、衛星画像を解析した結果を利用することができます。

朝日新聞社メディア研究開発センターの福沢です。令和6年1月1日16時10分に、日本の石川県の能登半島地下16kmで発生した最大震度7の内陸

もっとみる
エール ―若き画像研究の旗手へ― 第3回 「物体指紋」で画像技術界をバズらせた石山塁博士―モノのタグなし認証技術―

エール ―若き画像研究の旗手へ― 第3回 「物体指紋」で画像技術界をバズらせた石山塁博士―モノのタグなし認証技術―

序「物体指紋」の石山塁博士
 ビジョン技術の実利用ワークショップ(ViEW2011)のIS会場ゾーン左手奥にて石山塁博士が,はにかみながら熱弁されていた。ViEW2014(機械部品の話題)の時だと本人はおっしゃるが,ViEW2011(メロンの話題)である。その様子が他にない強い印象であった。
 初めてお声かけしたときの記憶は鮮明である。石山さんの所属は「NEC情報メディアプロセッシング研究所」であ

もっとみる
アノテーションせずに物体検知してみた(YOLO-World v2モデル)

アノテーションせずに物体検知してみた(YOLO-World v2モデル)

分析屋の町田です。

AIによる画像認識を行う場合、通常、膨大な数の画像をアノテーションする必要があります。しかしながら、2024年に発表されたYOLO-World v2というモデルを使用することにより、アノテーションを全く行わずに物体検知を実現することが可能となります。今回は、アノテーションレスの物体検知を実現するAIモデル「YOLO-World」の概要と実際の使い方を紹介します。

YOLO-

もっとみる
画像からテキストを検出するwebアプリを開発してみました

画像からテキストを検出するwebアプリを開発してみました



はじめに自己紹介

 むぎなすびと申します。むぎは飼い猫の名前です。職業はメーカーの研究開発職(非IT業務)で、プログラミングの初心者です。DXスキルを身につけるために、アプリ開発にチャレンジしました。

背景

 この記事は筆者が通うプログラミングスクール Aidemy Premium のカリキュラムの一環で卒業制作の記録として書いたもので、受講修了条件を満たすために公開しています。
 タイ

もっとみる
【中級】Marigold(AI深度マップ生成)を使う

【中級】Marigold(AI深度マップ生成)を使う

想定する読者AI深度マップ生成を利用して Blender で使いたい人

Blender の基本的な操作ができる人

はじめにMarigold(Repurposing Diffusion-Based Image Generators for Monocular Depth Estimation)という手法を使うと、任意の画像からAIで深度マップを作成する事ができます。このソフトウェアを利用し、Bl

もっとみる

Ultralyticsの自動アノテーションを試してみた


概要ultralyticsライブラリのセグメンテーション向け自動アノテーション関数auto_annotateを試してみました。

YOLO形式での出力時に塞がれてしまう🍩の穴を復活させる方法を調査して試してみました。

実施内容Google ColabのCPU環境で試しました。

準備

ライブラリインストールとリポジトリのクローンします。

!pip install ultralytics!

もっとみる