CNNとRCNNの違いと、最適な使用方法について

35 views (last 30 days)
HY
HY on 4 Dec 2020
Commented: HY on 5 Dec 2020
こんにちは。
画像認識において、一枚の画像に複数の物体が写っている場合、例えば犬と猫と鳥が写っている場合、CNNですとその写真が「犬と猫と鳥が写っている」と判断するのに対して、RCNN(YOLOとか)は「ここに犬がいてここに猫がいてここに鳥が写っている」と判断すると思うのですが、このように複数の物体がある画像を複数同時に分類する場合は、RCNNのような物体検出ができるネットワークを使用するのが良いのでしょうか。
CNNですと画像全体の特徴から分類すると思うので、1つの物体を認識するのには向いているように感じます。RCNNなら画像全体の特徴から場所を特定してそれが何であるのか判断すると思うので、部分的に認識できていると理解しています。ですが、RCNNは単に物体の位置だけを判断しているだけで、その物体が何なのかを判断するのは画像全体の特徴を使用したCNNによるものだとすれば、位置はとくに気にしない複数の物体が写った画像認識は、すべてCNNを使用したほうが良いのでしょうか。
わかりずらい質問となっていしまい申し訳ありませんが、よろしくお願いいたします。

Accepted Answer

Kenta
Kenta on 5 Dec 2020
こんにちは、はい、おおむねおっしゃる通りと思います。
>位置はとくに気にしない複数の物体が写った画像認識は、すべてCNNを使用したほうが良いのでしょうか
はい、その画像自体がどういうカテゴリーになるかだと、CNNによる分類でよいと思います。ただ、その画像に猫と犬の両方が映っていたりしていないか注意する必要がありますね。
  3 Comments
Kenta
Kenta on 5 Dec 2020
そうですね、猫と犬が両方映っていると、その画像はどのカテゴリが何に属すかCNNでは判別できなくなってしまいます。R-CNNやYOLO, SSDなどでは物体の位置を知りたいときに使います。例えば人がどの位置にいて、間隔を取って並んでいるか、とか、人の顔を検出して、熱情報のとれるカメラから体温を予測する、などですかね。このようなタスクだと分類だけではうまく行かないと思います。物体検出、などでキーワード検索したらいろいろと応用事例が出てくるのでまた見てみてください
HY
HY on 5 Dec 2020
なるほど… CNNだとカテゴリが複数の場合は、うまく機能しないと言うことですね。 詳しく教えてくださりありがとうございます! RCNNについても色々と調べてみます!

Sign in to comment.

More Answers (0)

Community Treasure Hunt

Find the treasures in MATLAB Central and discover how the community can help you!

Start Hunting!