Fast R-CNN の ROI レイヤーの目的は何ですか? 質問する

Fast R-CNN の ROI レイヤーの目的は何ですか? 質問する

これ物体検出に関するチュートリアルでは、高速 R-CNN について言及されています。ROI (関心領域) レイヤーについても言及されています。

最終的な畳み込み層の活性化関数 (各セル内) に従って領域提案のサイズが変更されると、数学的には何が起こりますか?

ベストアンサー1

関心領域(RoI)プーリング:

これはプーリング層の一種であり、最大プーリング不均一なサイズの入力 (ここでは、convnet 特徴マップ) に基づいて、固定サイズ (たとえば 7x7) の小さな特徴マップを生成します。この固定サイズの選択はネットワーク ハイパーパラメータであり、事前に定義されています。

このようなプーリングを行う主な目的は、トレーニングとテストの時間を短縮し、システム全体をエンドツーエンドで(共同で)トレーニングすることです。

このプーリング層の使用により、トレーニングとテストの時間が元の(バニラ?)R-CNNアーキテクチャに比べて高速になり、それが名前の由来です。高速 R-CNN。

簡単な例(deepsense.io による関心領域プーリングの説明):

RoIプーリングの視覚化

おすすめ記事