前回学習したロジスティック回帰を実際にPythonで確認してみましょう!
目次
モデルの使い方
STEP
新規ノートブックを作る
STEP
データを用意する
STEP
データを訓練データと学習データに分ける
STEP
ロジスティック回帰のモデルに学習させる
STEP
予測を行い正解率をテスト
STEP
散布図で確認!
以上の流れで今回も機械学習を行っていきます!
上記の書式を用いて線形回帰のモデルはLogisticRegressionで作成します。学習させたモデルにpredict命令で説明変数Xを渡すと予測結果が帰ってきます。
データを用意する
ロジスティック回帰で使用するデータセットを自動生成しましょう。
ランダムの種:5
特徴量:2
塊数:2
ばらつき:1
点の数:300
そして作成したデータの特徴量とターゲット変数yの値を確認しておきましょう!
コード
# ランダムの種:5、特徴量:2、塊数:2、ばらつき:1、点の数:300個のデータセットを作成
from sklearn.datasets import make_blobs
X, y = make_blobs( #1
random_state=3,
n_features=2,
centers=2,
cluster_std=1,
n_samples=300)
df = pd.DataFrame(X)
print(df.head())
print(y)
参考資料:Python3年生機械学習のしくみ
実行結果
続けて散布図も表示して確認しましょう。
コード
# 1番目の引数を「None」にして散布図のみを表示
plot_boundary(None, df[0], df[1], y, "df [0]", "df [1]")
参考資料:Python3年生機械学習のしくみ
実行結果
2つに分類ができそうなデータを作成することができました!