今回からは分類のアルゴリズムについて学んでいきましょう!
以前説明したように分類とは、これは何なのかを予測したいときに使う手法です。この分類の中でも今回はYESかNOか分類して、回帰を使って予測するアルゴリズム「ロジスティック回帰」を紹介します!
目次
ロジスティック回帰とは
ロジスティック回帰は、ある結果が「YES」か「NO」かを予測するための方法です。もっと専門的に言うと、データを使って分類(グループ分け)をするアルゴリズムです。たとえば、
- メールがスパムかどうかを予測する
- 病気になるかどうかを予測する
みたいな問題を解くために使います。
普通の線を使って「YES」と「NO」を分けようとすると、結果が2つ(YESかNO)の場合には、直線では限界があるのです。
なので、ロジスティック回帰では、シグモイド関数(ロジスティック関数)というものを使います。
ロジスティック関数は、どんな数字でも0~1の間の値に変換してくれる特別な曲線です。
- 確率が0.5以上 → 「YES」
- 確率が0.5未満 → 「NO」
この曲線が、データに合う形で結果を分ける手助けをしてくれるのです!
次回から実際にこのモデルの使い方を確認していきましょう!