train_test_splitの引数について詳しく調べてみた
kaggleなどのコンペで、学習データと評価用データに分ける際に使うtrain_test_split。引数が多く、整理のためにここにまとめておく。
一般的にデータを分割する際には以下のようなコードを記述すると思う。
from sklearn.model_selection import train_test_splitX_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, strat