㈠ 目標檢測One-stage經典網路模型
目標檢測領域中,一系列經典的一階段模型不斷涌現,它們以高效和精確為特點,推動了技術的革新。YOLOv1作為先驅者,以其單一階段的結構、實時性及統一的Image Classification和Object Detection設計,奠定了基礎。YOLOv1採用CNN網路,每個7*7的單元格輸出包含類別概率、邊界框置信度和邊界框信息,雖簡單但速度和精度兼具。
緊隨其後的SSD在2015年出現,針對YOLO的不足,通過多尺度特徵圖檢測不同大小的目標,使用卷積層替代FC層,並引入多個不同尺度的先驗框,提高了精度。RetinaNet在2017年則通過Focal Loss解決了一階段模型的類別不平衡問題,提升了精度與速度。YOLOv3和YOLOv4則是這一系列中的重要里程碑,YOLOv3通過加深網路結構和引入FPN,YOLOv4則實現了更優的速度和准確性,並在實時檢測上取得了突破。
EfficientDet在2019年探索了模型精度與解析度、深度和寬度的關系,構建出高效的特徵提取backbone,BiFPN和Box prediction net的結合使其在COCO數據集上達到SOTA。YOLOv4作為YOLOv3的後續,不僅保持了系列的延續性,還實現了視頻流上的實時檢測,標志著目標檢測技術進入了全新的實用階段。
這些經典的一階段模型,無論是YOLOv1的革新性設計,還是SSD、RetinaNet、YOLOv3和EfficientDet的不斷優化,都在推動著目標檢測技術的發展,為各種應用場景提供了強大的工具。