Objection Detection Evolution

2-nd-DL-CVMarathon Learning Notes1

Two Stage

特色
- 運用Selective Search 提出Region Proposal
- Resize到相同到大小
- 透過SVM做分類，分類完再使用Regrssor修正BBOX
問題
- 那 R-CNN 有什麼樣的問題呢？
- 簡而言之就是『速度慢』，其原因主要有以下兩點
  1. 經由 Selective Search 提出的 Region Proposal 都要獨自經過CNN 做特徵提取，運算速度相當緩慢。
  2. 經過 CNN 得到 feature map，再用這些 feature 當成 SVM 的input 當成訓練資料，因此並不是一個 end-to-end 模型 ( SVM 的LOSS 並不會改動到 feature map 的數值)

Fast R-CNN 解決了什麼問題？

Fast R-CNN 有什麼問題？

特色
- 原圖直接通過 CNN 提取特徵
- 透過 RPN(Region Proposal Network) 結構提出 Region Proposal
- 一樣要運用 ROI Pooling 將候選框變成一樣大小，後面結構則是跟 FastRCNN相同
問題

Faster R-CNN 解決了什麼問題？

不用 Selective Search，而改用 (Region Proposal Network) 來提取proposals ，達到真正的 End-to-End

Faster R-CNN 有什麼問題？

One Stage 核心觀念-不要先浪費時間提出 Region Proposal，而是以 Default Anchor Box 取代

Yolo 與 RCNN 系列的比較

YoloV1解決了什麼問題

YoloV1 有什麼問題？

SSD 解決了什麼問題

SSD 有什麼問題？

RetinaNet 的主架構與 SSD 很像，重點在於加入了 Feature Pyramid Network (FPN) 的結構，把淺層的 Feature Map 與深層的 Feature Map 疊加後做預測，確保淺層語義訊息也能夠豐富。

RetinaNet 解決了什麼問題?

RetinaNet 有什麼問題？