古典機械学習を学ぶ

本

線形回帰、ロジスティック回帰、正則化、決定木、サポートベクトルマシン、クラスタリング、次元削減などの機械学習の仕組みを解説していく予定です。

運営しているクリエイター: 澁谷直樹

#scikit_learn

scikit-learn機械学習㉘パイプラインと便利ツール

前回は、ニューラルネットワークを解説しました。これまで分類タスクを中心として、よく知られた教師あり学習のモデルを紹介してきました。これらのモデルを使って実験をすると、scikit-learnのモデルはどれも似たようなインターフェースを持っているのがわかります。また、どのモデルを使っても同じような訓練から評価への流れがあります。 # 訓練データとテストデータの準備X_train, X_test, y_train, y_test = ....# モデルの準備model =

scikit-learn機械学習㉑k-NN実践編

前回は、ノンパラメトリック手法であるk近傍アルゴリズム（k近傍法、k-Nearest Neighbors、k-NN）の紹介をしました。特に、KDツリーの構造について解説しました。今回は、scikit-learn の KNeighborsClassifier を使った実験を行います。以前に実験したGBC（勾配ブースティング）などと比較してどのような性能を発揮するでしょうか。また、層化サンプリングについても解説します。

scikit-learn機械学習⑭ランダム・フォレスト実践編

前回は、ランダム・フォレスト（Random Forest）の理論的な側面を解説しました。今回は、scikit-learnを使って実験を行います。データセットとしては、scikit-learn.datasetsからワイン（wine)を使用します。今回初めて使うデータセットなので、簡単な分析をしてグラフなどを見ていきます。あとは、いつものようにデータセットを訓練用とテスト用に分割します。訓練用のデータセットにランダム・フォレストをフィットさせます。そして、学習を終えたモデ

scikit-learn機械学習⑫決定木（Decision Tree）実践編

前回は、決定木（Decision Tree）の理論的な側面を解説しました。今回は、scikit-learnを使って実験を行います。データセットとしては、scikit-learn.datasets からアイリス（iris、アヤメ）を使用します。タスクは、このデータセットに含まれる花の特徴から花の種類を予測することです。ナイーブ・ベイズの実践編でも使ったので、結果を比較できます。まずは、データセットを訓練用とテスト用に分割します。次に、訓練用のデータセットから決定木を作成

scikit-learn機械学習⑪決定木（Decision Tree）

前回は、ナイーブ・ベイズを実装しました。今回は、決定木（Decision Tree）を解説します。決定木は、データセットを分割し、木構造を作ります。下図は、アイリス（Iris）のデータセットを使用して訓練された決定木モデルの可視化です。scikit-learnで生成することが出来ます。詳細は記事の中で解説しますが、この決定木モデルは、花の特徴（花弁とがく片の長さと幅）に基づいて、アイリスの3種類（Setosa、Versicolor、Virginica）に分類しています

scikit-learn機械学習④多変量線形回帰：実践編

今回は、複数の変数から値を予測する多変量線形回帰をscikit-learn を使って実装します。データセットとしてカルフォルニアの住宅の値段に関する california_housing を使います。これは、scikit-learn に付属するもので手軽に使えるので便利です。このデータには、家の値段とその家の属性に関するデータが入っています。例えば、築年数や部屋数などの属性が含まれており、これら複数の変数から家の値段を予測することを考えます。仮に、築年数と部屋数だけで