見出し画像

【AI】TensorFlowとKerasを使った画像認識による乗り物の分類

学べること

このノートでは、Python でクローリングして画像データを収集し、乗り物の画像分類モデルを作ります。データの収集からモデル定義・評価まで、AI 開発の一連の流れを学ぶことができます。

・Google Colaboratoryの基本的な使い方
・PythonとAPIを使用した画像のクローリング
・TensorFlowとKerasを使った画像分類モデルの開発手法

このノートは以下のような業務で活用されています。

・中古車販売企業での車種分類作業
・料理画像のタグ付け
・アパレル EC 企業で衣服の写真を使用したアイテムの分類作業

*こちらのマガジンでは、毎月4本程度の有料ノートをお届けします。月に2本以上読むなら、月額マガジン購読の方がお得です。

概要

このノートでは、まず Flickr を使用して AI モデルの学習データに使用する画像の収集を行います。

AI モデル開発では学習で使用するために必要なデータが足りない時が多々あります。そのような場合に、インターネット上に公開されている画像をクローリングして、必要なデータを準備します。

また、クローリングによって収集した画像データを交差検証用に分割します。交差検証とは。データを学習用とテスト用に分割し、学習用のデータを使用してモデルを開発して、テスト用のデータでモデルをテストすることで、作られたモデルの妥当性を検証するための手法のことです。

次に、学習データを使って実際に AI モデルを開発していきます。モデル開発には TensorFlow と Keras を使用します。TensorFlow とは Google がオープンソースで開発している機械学習用のソフトウェアライブラリのことです。Keras は、TensorFlow の上部で動作して、ユーザーが TensorFlow を使って Deep Learning を行うときに、より簡単にモデル開発をできるようにしたライブラリです。

TensorFlow と Keras を用いてモデルを定義し、準備した学習データを TensorFlow が処理できる形式に変換して、モデルに学習データを与えることでモデルを作成します。

最後に、作成したモデルとテストデータを使って実際にモデルがどの程度適切に画像を分類できているか検証します。

実行環境

・Google Colaboratory

ライブラリ・ツール

・Python3(実行環境: 3.7)
・OpenCV
・Jupyter Notebook
・Flickr

事前準備

このノートでは Flickr API を使用して乗り物のデータを収集します。Flickr API を使用するためにはアカウントの登録が必要なため、下記の URL から Flickr のアカウント登録と API キーの発行を行ないましょう。

まずは Flickr のサイトからアカウント登録を行なってください。

Flickr のアカウント作成が完了したら、API キーを発行していきましょう。以下の URL にアクセスをしてください。(事前にアカウント登録を行い、ログインをしておく必要があります。)

画面右上にある「Create an App」をクリックして、アプリを作成していきます。

画像1

「Get your API Key」のセクションにある、「Request an API Key」をクリックして、API キーの発行をリクエストします。

画像2

今回は商用目的ではないため、「APPLY FOR A NON_COMMERCIAL KEY」を選択します。

画像3

アプリの詳細を記載します。次の項目をそれぞれ以下のように入力します。

- What's the name of your app?: vehicle image classification
- What are you building?: vehicle image classification with deep learning.

その後、利用規約等にチェックを入れて、「SUBMIT」をクリックします。

画像4

これでアプリの作成が完了しました。「Key」の箇所に皆さんのアプリの API キーとシークレットが発行されているので、こちらをメモしておきましょう。

1. 実装 - Flickr API を使用して学習データを準備する

それでは、Flickr API を使用して、乗り物の画像データを取得していきます。今回のノートでは以下の3つの乗り物の画像を分類していきましょう。

- 電車(train)
- 車(car)
- 自転車(bicycle)

Google Colaboratory を開くてください。

ここから先は

7,270字

¥ 980

サポートして頂くと、こちらからもサポート返しさせて頂きます。