CNNとRCNNの違いと、最適な使用方法について

Question

0 votes

こんにちは。

画像認識において、一枚の画像に複数の物体が写っている場合、例えば犬と猫と鳥が写っている場合、CNNですとその写真が「犬と猫と鳥が写っている」と判断するのに対して、RCNN(YOLOとか)は「ここに犬がいてここに猫がいてここに鳥が写っている」と判断すると思うのですが、このように複数の物体がある画像を複数同時に分類する場合は、RCNNのような物体検出ができるネットワークを使用するのが良いのでしょうか。

CNNですと画像全体の特徴から分類すると思うので、１つの物体を認識するのには向いているように感じます。RCNNなら画像全体の特徴から場所を特定してそれが何であるのか判断すると思うので、部分的に認識できていると理解しています。ですが、RCNNは単に物体の位置だけを判断しているだけで、その物体が何なのかを判断するのは画像全体の特徴を使用したCNNによるものだとすれば、位置はとくに気にしない複数の物体が写った画像認識は、すべてCNNを使用したほうが良いのでしょうか。

わかりずらい質問となっていしまい申し訳ありませんが、よろしくお願いいたします。

0 Comments
Show -2 older comments Hide -2 older comments

Sign in to comment.

Sign in to answer this question.

Follow Question

Answer 1

Kenta on 5 Dec 2020

0 votes

こんにちは、はい、おおむねおっしゃる通りと思います。

>位置はとくに気にしない複数の物体が写った画像認識は、すべてCNNを使用したほうが良いのでしょうか

はい、その画像自体がどういうカテゴリーになるかだと、CNNによる分類でよいと思います。ただ、その画像に猫と犬の両方が映っていたりしていないか注意する必要がありますね。

3 Comments
Show 1 older comment Hide 1 older comment

Kenta on 5 Dec 2020

そうですね、猫と犬が両方映っていると、その画像はどのカテゴリが何に属すかCNNでは判別できなくなってしまいます。R-CNNやYOLO, SSDなどでは物体の位置を知りたいときに使います。例えば人がどの位置にいて、間隔を取って並んでいるか、とか、人の顔を検出して、熱情報のとれるカメラから体温を予測する、などですかね。このようなタスクだと分類だけではうまく行かないと思います。物体検出、などでキーワード検索したらいろいろと応用事例が出てくるのでまた見てみてください

HY on 5 Dec 2020

なるほど… CNNだとカテゴリが複数の場合は、うまく機能しないと言うことですね。詳しく教えてくださりありがとうございます！ RCNNについても色々と調べてみます！

Sign in to comment.

CNNとRCNNの違いと、最適な使用方法について

0 Comments
Show -2 older comments Hide -2 older comments

Accepted Answer

3 Comments
Show 1 older comment Hide 1 older comment

More Answers (0)

Categories

Tags

Community Treasure Hunt

CNNとRCNNの違いと、最適な使用方法について

0 Comments Show -2 older comments Hide -2 older comments

Accepted Answer

3 Comments Show 1 older comment Hide 1 older comment

More Answers (0)

Categories

Tags

See Also

Community Treasure Hunt

0 Comments
Show -2 older comments Hide -2 older comments

3 Comments
Show 1 older comment Hide 1 older comment