![見出し画像](https://assets.st-note.com/production/uploads/images/95285627/rectangle_large_type_2_77842ce324e8d9f72663cceb744f2e45.jpeg?width=1200)
Google ColaboratoryでのYOLOの使い方
初めてのブログ投稿です。
今回は画像認識を簡単に使える方法について紹介したいと思います。
一般的に、画像認識を行うためには高スペックのパソコンが必要になります。
詳しく言うと、GPU付きのパソコンが必要になりますが、普通のパソコンより高額になるため、お持ちでない方もいらっしゃるかと思います。
今日はGPU付きのパソコンがない方でも、
Googleアカウントさえあれば簡単に画像認識を行うことができる方法についてお話します。
1. Google Colaboratory
Googleでは、GPU付きのクラウドコンピュータを無料で使えるサービスを提供しています。
Google Colaboratory(ここから、Colabと書きます)というサービスです。
このサービスは、環境構築を行う必要がなく、すぐにPythonでプログラミングを行うことができます。
今日はこのColabを使って、画像認識ライブラリであるYOLOを使う方法について紹介します。
2. ノートブックの新規作成
まずは、コードを書き込むファイルを新規作成します。
Colabでは、ファイルのことをノートブック(Notebook)と言います。
下の図のように、メニューから「File」→「New notebook」を選択してください。
![](https://assets.st-note.com/img/1673274175179-SR5vSMQMsz.png?width=1200)
次に、ノートブックのファイル名を変更します(必須ではありません)。
![](https://assets.st-note.com/img/1673274240160-7DSdB4BnXn.png?width=1200)
初期設定では、CPUを使うようになっているため、GPU設定に変更する必要があります。
メニューから「Runtime」→「Change runtime type」を選択します
Hareware acceleratorが「None」で設定されていますが、「GPU」に変更し、右下の「Save」ボタンを押してください。
![](https://assets.st-note.com/img/1673274323630-n9Vyqw38nK.png?width=1200)
これで下準備は完了です。
3. YOLOのインストール
Colabはクラウドコンピューティング環境であるため、毎回使用するライブラリをインストールする必要があります(これがデメリットのひとつかと思います)。
コードを入力するセルに下記のコマンドを入力してください。
!git clone https://github.com/ultralytics/yolov5
その後、左の実行ボタンを押してください。
![](https://assets.st-note.com/img/1673274446992-KISwT5MHfG.png?width=1200)
特に問題がなければ、上の図のように完了メッセージが表示されると思います。
ちゃんとインストールされたか、確認したい方は左側にあるフォルダのアイコンをクリックしてみてください。
![](https://assets.st-note.com/img/1673274503424-yDHmLLdBSH.png?width=1200)
「yolov5」というフォルダが表示されていれば、ちゃんとインストールされたということです。
![](https://assets.st-note.com/img/1673274548021-xT5FoKqeiA.png?width=1200)
4. サンプル画像の認識
では、サンプル画像を使って画像認識を行ってみましょう。
やり方は簡単です。
左上の「+Code」ボタンを押して入力セルを追加し、下記のコマンドを動かしてください。
!python yolov5/detect.py --weights yolov5s.pt --img 640 --conf 0.25 --source yolov5/data/images/
![](https://assets.st-note.com/img/1673274610550-2AEn79BgBf.png?width=1200)
特に問題がなければ、次のようなメッセージが表示されると思います。
![](https://assets.st-note.com/img/1673274654580-WG3bDu5Z7Q.png?width=1200)
矢印で示しているのは、認識結果が保存されている場所のパスです。
左側にあるエクスプローラから、該当の場所に移動してみてください。
![](https://assets.st-note.com/img/1673274688141-rx4SCw5LfF.png?width=1200)
上のように、2つのファイルが入っているかと思います。
確認したいファイルをダブルクリックしてみてください。
![](https://assets.st-note.com/img/1673274732688-2D6Np4UeaW.jpg?width=1200)
![](https://assets.st-note.com/img/1673274748239-pbgM3XfqL2.jpg?width=1200)
エラーなく、認識ができれいれば、上のような結果になっているかと思います。
認識された物体の周りに色付きの矩形と、その左上にラベル名が表示されます。
この色付きの矩形のことをバウンディングボックス(bounding box)と言います。
また、ラベル名の右に表示される数字は「確信度」になります。
どれほど、この認識結果を自信持って言えるか、を表す数値です。
もちろん、数字が大きければ大きいほど、自信持って結果を言えるということです。
いかがでしょうか。
数行のコードで簡単に画像認識ができました!!
この記事が気に入ったらサポートをしてみませんか?