物体検知とは

物体検知は、コンピュータが画像や動画から物体を見つける技術です。

物体検知って何?

物体検知は、コンピュータが写真や動画の中で物体を見つけることができるすごい技術です。
例えば、猫や犬、車など、さまざまな物体を自動的に見つけることができます。

どうやって動いてるの?

物体検知は、コンピュータが学習することでできます。
まず最初に、コンピュータにたくさんの写真や動画を見せてどんな物体が写っているかを教えます。
それから、コンピュータはその情報をもとに新しい写真や動画で物体を見つける方法を覚えます。

具体的にはどうやって見つけてるの?

物体検知は、画像を小さなピクセル(画素)に分解してそれぞれのピクセルの特徴を学びます。
例えば、猫の耳や目の形、車の車輪の形など、物体ごとに特有のパターンを見つけます。
そして、そのパターンを組み合わせて画像全体で物体を見つけます。

なぜ物体検知が大切なの?

物体検知は、自動運転車やセキュリティカメラ、顔認識などさまざまな分野で使われています。
例えば、交差点で信号を見つけて停まるようにしたり、お店のセキュリティカメラで不審な物体を見つけるのに使ったりします。

物体検知は、私たちの生活を便利で安全にするために使われています。


写真:momotechの教室内

YOLO(You Only Look Once)は、物体検知に使われるアルゴリズムで、例としてyolov8nモデルを使用した画像の出力結果を説明します。

出力画像では、検出された物体が囲まれ単語と数字が表示されています。
たとえば、「キーボード 0.53」は、コンピュータが「keyboard」として認識し、その物体がキーボードである信頼度が53%であることを示しています。

物体検知の信頼度は、検出された物体が正しいかどうかを示す指標で、数字が高いほど信頼度が高いことを意味します。
ただし、誤検知も発生することがあり、特定の物体が検出されない場合もあります。

新しい物体を検出したり、精度を向上させたい場合は、モデルに学習をさせる必要があります。
モデルの作成者が予め学習させたい物体を教えることで、モデルはそれを認識できるようになります。

自分で新しいモデルを作成することで、オリジナルの物体を検出することが可能です。