YOLOv4: Optimal Speed and Accuracy of Object Detection
推論コストを上げず、学習手法と学習コストのみ変更させ、精度を改善する手法
Random Erase
推論コストを少しだけ上げて、物体検知の精度を大幅に上げる手法
4 つの画像を混ぜる
spatial-wise から pointwise attention へ修正
PAN (Path Aggregation Network for Instance Segmentation)
addition から concatenation に変更
Cross-Iteration Batch Normalization (CBN) (2020/02/13 on arXiv) をベースにして、改良を加えた
CutMix, Mosaic, Label Smoothing, Mish の効果が大きい
(BoF: 学習時の手法)
(BoS: 推論時のテクニック・追加モジュール)
In the future we plan to expand significantly the content of Bag of Freebies (BoF) for the detector, which theoretically can address some problems and increase the detector accuracy, and sequentially check
エッジ領域である、Jetson AGX XavierはFPSが割と小さく、TensorRTに変換及び量子化等の対応が必要
Jetson AGX Xavier上で32FPS程度
Ref: https://github.com/AlexeyAB/darknet/issues/5386#issuecomment-621169646)
ちなみに