003_機械学習を始める前に1

目次

機械学習の精度を良くするために必要なこと

機械学習の精度を良くするために必要なこと2つ!

  • たくさんのデータを用意しよう!
  • 意味のあるデータを用意しよう!

データの量や質の良さは学習の精度に大きく影響します。
良いデータを集めることは機械学習においてとても重要な作業です!

たくさんのデータを用意しよう

もし、少ないデータで学習すると偏った学習となる可能性があります。
それを防ぐためにたくさんのデータを用意することはとても大事な作業です。
犬と猫の判別をする学習を例に考えてみましょう。
犬と猫の判別をさせるためにコンピュータへ猫の画像3枚犬の画像3枚の計6枚を学習データとして学習させるとします。


それぞれ3枚の画像から発見できたことだけが、コンピュータにとって犬と猫を判別する材料となってしまいます。
するとどういった問題が起きるでしょうか?


テストデータの例です。ロシアンブルーですね。

皆さんは「猫だ!」とすぐ判別できますが、コンピュータが知る猫と犬は学習データのそれぞれ3枚しかありません。発見できる特徴はどうしても少なくなります。
色や大きさが学習データとまったく違うロシアンブルーは判別できないかもしれません。

このことを避けるために、たくさんの学習用データを用意することは、コンピュータが特徴を見つけるための材料が増えて必要なんです!

意味のあるデータを用意しよう


また、意味のないデータを使用してしまうと変な学習になります。


例えば、犬と猫の判別をしたいのに果物の画像ばかりを学習データとして学習するともちろん犬猫の判別はできませんよね?

ただ学習データをとりあえず用意するのではなく意味のあるデータを準備しましょう!

参考資料:Python3年生機械学習のしくみ
                                      

目次