- 運営しているクリエイター
2019年2月の記事一覧
Google Imageのデータの分類
fast.aiの練習で,自分でGoogle Imageでデータをダウンロードしてきて,それを畳み込みニューラルネットで分類するとというのがある.講義では,手作業でChromeからJavaScriptでデータを落としていたが,自分でやるのは大変面倒くさい.
調べてみたら,ダウンローダが開発されているようだ.Google Colab上での手順は以下の通りで簡単なので,色々試すことができる.
まずイ
how to learn deep learning
Beautiful.AIで深層学習のビデオ教材の紹介スライドを作成してみました。
上の囲みを押すと開始します。以前書いた原稿と同じですが、そのままビデオに飛びます。
dtreevizによる決定木の可視化
機械学習といえばランダム森だが、それの元になる決定木の可視化で特徴分析をすると性能が上がる。そのための可視化ツールは色々あるが、プロ仕様のはdtreeviz(https://github.com/parrt/dtreeviz)だ。
例として、講義で最初に使用する広告のデータを用いる.これは、テレビ(TV),ラジオ(Radio),新聞(Newspaper)への広告から売り上げ(Sales)を予測す
fastai v3 on kaggle
fastai v3の講義用のファイルがkaggle上のクラウドで動くようになったようだ。
上のリンクから入れる。Google Colabと同様に無料だが、fastaiが事前にインストールされており,講義のデータファイルやドキュメントも入っているので試すにはこちらの方が楽だ。
ただし6時間で切れることや、5Gしかディスクが使えないなど、実験に使うのは問題があるが、体感速度はこちらの方が速い気がす
fastaiのデータ作成法
fastaiパッケージは訓練は簡単だが,データを生成する部分はちょっと混乱する.
パスにデータ(例として画像データ)を展開しておいて,一気にデータ束(DataBunch)インスタンスを作ることができる.
data = ImageDataBunch.from_folder(path)
これをするには,パスにtrainとvalidと名付けたフォルダを作成しておき,それぞれに訓練データと検証データ
fastaiにおける概念,略語,使用例のまとめ
fastaiを使いこなすには,ソースコードまで読む必要がある.ソースはJupyter上で??を付ければみることができる.
fastaiでは,略語を用いることが多い.開発者の意向で,Javaのように長い用語をうつのは面倒だし,論文と同じ記号を用いたいという理由なのだが,慣れないと読みにくい.
https://docs.fast.ai/dev/abbr.html を訳したものを,まとめておく.