030_【分類】ロジスティック回帰のモデルの使い方

前回学習したロジスティック回帰を実際にPythonで確認してみましょう!

目次

モデルの使い方

STEP
新規ノートブックを作る
STEP
データを用意する
STEP
データを訓練データと学習データに分ける
STEP
ロジスティック回帰のモデルに学習させる
STEP
予測を行い正解率をテスト
STEP
散布図で確認!

以上の流れで今回も機械学習を行っていきます!

上記の書式を用いて線形回帰のモデルはLogisticRegressionで作成します。学習させたモデルにpredict命令で説明変数Xを渡すと予測結果が帰ってきます。

ここから

で作成したplot_boundary関数を使っていくためこの関数をあらかじめ実行し、読み込ませておいてください!

データを用意する

ロジスティック回帰で使用するデータセットを自動生成しましょう。
ランダムの種:5
特徴量:2

塊数:2
ばらつき:1
点の数:300

そして作成したデータの特徴量とターゲット変数yの値を確認しておきましょう!

コード

# ランダムの種:5、特徴量:2、塊数:2、ばらつき:1、点の数:300個のデータセットを作成


from sklearn.datasets import make_blobs

X, y = make_blobs(    #1
    random_state=3,
    n_features=2,    
    centers=2,
    cluster_std=1,
    n_samples=300)

df = pd.DataFrame(X)
print(df.head())
print(y)

参考資料:Python3年生機械学習のしくみ

実行結果

続けて散布図も表示して確認しましょう。

コード

# 1番目の引数を「None」にして散布図のみを表示

plot_boundary(None, df[0], df[1], y, "df [0]", "df [1]")

参考資料:Python3年生機械学習のしくみ

実行結果

2つに分類ができそうなデータを作成することができました!

目次