分類を行うとき、特徴を見つけることがとても大切です。
ものを「分ける」ためには、違いがはっきりわかる特徴(色や大きさなど)を見つけることが重要です。例えば、オレンジとグレープフルーツを比べるなら「色」や「大きさ」に注目すると、簡単に見分けられます!
目次
SVM(サポートベクターマシン)とは?
SVMは「特徴を見つけて、できるだけ公平な線を引く」ための方法です。
SVMは「サポートベクトル」という、境界線に一番近い点を使って計算します。境界線とサポートベクトルの距離(これを マージン と言います)をできるだけ広くすることで、正しく分けるようにします。
境界線を引くときは、できるだけ「両方のグループから遠い線」を引くようにします。これによって、どちらのグループにも近すぎない「公平な境界線」が作られます。
カーネルトリックについて
直線で分割できないデータの場合、「両方のグループから遠い線」を引くのは難しいです…。
そんな時は、カーネルトリックを使います!カーネルトリックとは「2次元で分割できないのであれば、次元を増やして、別の視点で見てみよう!」という考えです。