記事一覧
機械学習5:過学習を抑える回帰モデル
こんばんは。自己学習のための機械学習勉強、第5回め。 #過学習を抑える方法 # ①学習(訓練)データの数を増やす # ②(モデルを簡単なものにする) # ③正則化を実施す…
機械学習5:過学習を抑える回帰モデル
こんばんは。自己学習のための機械学習勉強、第5回め。
#過学習を抑える方法
# ①学習(訓練)データの数を増やす
# ②(モデルを簡単なものにする)
# ③正則化を実施する
#「正則化」とは、過学習を防いで汎化性能(未知のデータへの対応能力)を高めるためのテクニックの一つで、モデルに「正則化項」というものを付けることでモデルの形が複雑になりすぎないように調整しようとするもの
→過学習の制御を行う
機械学習④ 線形モデル
#線形回帰
#線形回帰 、もしくは通常最小二乗法(ordinary least squares:OLS)は、最も単純で、最も古典的な線形回帰手法である。線形回帰では、訓練データにおいて予測と真の回帰ターゲットyとの平均二乗誤差(mean squared error)が最小になるように、パラメータwとbを求める。平均二乗誤差は、予測と真の値との差を二乗したものの平均値である。
y=w[1]x[1]
機械学習3〜KNN〜
教師あり学習ある入力に対して特定の出力を予測したい場合で、 入力出力のペアの例が入手できる際に用いられる。 入力出力のペアが訓練セットとなり、それから機械学習モデルを構築する。目的は、新しい見たことのないデータに対して正確な予測を行うことである。
“教師あり機械学習問題は2つに大別することができる。
クラス分類(classification)と回帰(regression)だ。
クラス分類問題
機械学習②Irisdataを見てみる
機械学習でよく使われるIrisのデータみる
Irisdataは、R言語でもよく使われるdataで懐かしいと思った。
from sklearn.datasets import load_irisiris_dataset = load_iris()
dataの中身は下記。
dataはIris150個の花びらの長さと幅、ガクの長さと幅をセンチメートル単位で測定したもの。
targetとtarget_
コミュ障解消のためにラジオを聞く
人と話すのの練習の意味を込めて。
昔からラジオを聞くようにして、人の話し方を真似るようにしようと思います。
昔、声優の平野綾さんもマンガをみながら自分でアテレコしてたとか。そういう感じに近いかもしれません。
どうやったら面白く伝わるのか、わかりやすく伝わるのか、オチをどうやって持っていくか。そういうのを学んでいる気がしてます。
それをやっていたら、ラジオを聞くのがルーチンになってきたかも。
始めるにあたって何書こうか考えてます。
好きなこと、勉強したこと、感じたこと
自由に記載していきたいと思います。
読まれる人を意識しすぎると窮屈になってしまい、
書きたいことがかけなくなってしまいそうで怖くてどうしたらいいかなーと。