目次
機械学習の精度を良くするために必要なこと
機械学習の精度を良くするために必要なこと2つ!
- たくさんのデータを用意しよう!
- 意味のあるデータを用意しよう!
データの量や質の良さは学習の精度に大きく影響します。
良いデータを集めることは機械学習においてとても重要な作業です!
たくさんのデータを用意しよう
もし、少ないデータで学習すると偏った学習となる可能性があります。
それを防ぐためにたくさんのデータを用意することはとても大事な作業です。
犬と猫の判別をする学習を例に考えてみましょう。
犬と猫の判別をさせるためにコンピュータへ猫の画像3枚、犬の画像3枚の計6枚を学習データとして学習させるとします。
それぞれ3枚の画像から発見できたことだけが、コンピュータにとって犬と猫を判別する材料となってしまいます。
するとどういった問題が起きるでしょうか?
テストデータの例です。ロシアンブルーですね。
皆さんは「猫だ!」とすぐ判別できますが、コンピュータが知る猫と犬は学習データのそれぞれ3枚しかありません。発見できる特徴はどうしても少なくなります。
色や大きさが学習データとまったく違うロシアンブルーは判別できないかもしれません。
このことを避けるために、たくさんの学習用データを用意することは、コンピュータが特徴を見つけるための材料が増えて必要なんです!
意味のあるデータを用意しよう
また、意味のないデータを使用してしまうと変な学習になります。
例えば、犬と猫の判別をしたいのに果物の画像ばかりを学習データとして学習するともちろん犬猫の判別はできませんよね?
ただ学習データをとりあえず用意するのではなく意味のあるデータを準備しましょう!
参考資料:Python3年生機械学習のしくみ