Yolo v12 結合 CNN 和 Transformer

Yolo v12 是第一個以注意力機制為核心的 YOLO 模型，它將 CNN 和 Transformer 結合，以實現超高速的準確物件檢測。目前注意力機制在訓練模型時侯的能力，已經超越卷積神經網路（CNN），而 YOLO 過往只著重 CNN 的改進。YOLO v12 今次嘗試兼顧注意力機制的優點和 CNN 的準確度，透過引入區域注意力模組（Area Attention Module）和高效層聚合網路（R-E LAN），可以保證速度的同時，亦提升檢測的準確性。YOLO 是什麼

YOLOv12 Explained and How to use it

Watch this video on YouTube