Machine Morning

機械学習やWebについて学んだことを記録しています。

2018-07-06から1日間の記事一覧

sklearnのtransformとfit_transform

fitは与えられたデータセットの統計量を算出し、transformはデータセットの統計量を元にデータを変換(標準化、正規化)する。 fit_transformはfitとtransformを両方順に行う。 訓練用データには統計量を算出するfit_transform、テスト用データには訓練用デ…

層化抽出法(stratified sampling)とは

sklearnのtrain_test_split(sklearn.model_selection.train_test_split — scikit-learn 0.20.2 documentation )に引数stratifyを渡せるがstratifyって何?と思ったので調べてみた。 層化抽出法は簡潔に言うと”母集団の分布と同じになるようにサンプリング…