見出し画像

Google Colaborator が遅いのでクライアントでやるべきか悩んでいる件

Kaggleでいろいろ試していて、ランダムフォレストによる予測を行っています。

おそらくランダムフォレストを使って学習で次にグリッドサーチを行い、最適なパラメータを見つけていく方法もあるかなとおもうのですが。。。。

なんせ遅いんです!

どれくらいかというと、グリッドサーチを入れる前が約1分で出力ファイルが出力されたのが、下のコードをいれると10分経過しても表示されないままなのです。

Google Colaborator だと、探索するパラメータを増やすには、 param_grid 変数に追加することで行うとおもうのですが、これをやると途端に速度が遅くなってます。

# ランダムフォレストのハイパーパラメータの候補を指定する
param_grid = {
    'n_estimators': [100, 200, 300],
    'max_depth': [3, 5, 7, 10, 15],
    'min_samples_split': [2, 4, 8, 16],
    'min_samples_leaf': [1, 2, 4, 8],
    'max_features': ['auto', 'sqrt', 'log2']
}

# グリッドサーチを行う
rfc = RandomForestClassifier(random_state=0)
grid_search = GridSearchCV(rfc, param_grid, cv=5)
grid_search.fit(X_train, y_train)

# 最適なパラメータを取得する
best_params = grid_search.best_params_
print(best_params)


なんかコードが悪いのかな??

パソコンにいろいろ入れたくないのでGoogle Colaborator を使っているのですけどもPCのスペックを考えるとクライアントで作業すべきなのかもしれません。

困った困った。

この記事が気に入ったらサポートをしてみませんか?