WEJUMP YOLO report

有別於分類與定位分開做(例如classifier + sliding window, or classifier + selective search)，YOLO打算一次做到兩件事情，即分類(cliassification)+定位(locoalization)，如此一來在當時的歷史背景下，可以讓inference time降低非常多達到效能上的提高
怎麼做到? 將localization視為一個regression問題，並且在prediction中加入bounding box的預測$(x, y, w, h)$
優點 : 速度快，FPS - 45FPS
缺點 : 小物體預測效果較差
Step1 - 先9宮格化
讓我們先關注如何將資料上標籤，畫出9宮格之後(或是任何$N\times N$)的方格，depends on your labeled data
output的prediction / groud truth會是一個k dimension的vector，分成幾個部分
- pc : 物件是否存在在網格中(存在的機率)
- bx, by, bh, bw - bounding box info
- c1, c2, c3, class label
其中c1, c2, c3是可以隨著要辨識的物體增加而增加
Training, 其實就是CNN : 作者在第一版使用darknet，小型且快速
評斷?
Non-Max Suppression
- 其實也就是怎樣叫做好的偵測...
- IoU
- probability + IoU

Questions