본문 바로가기

논문/object_detection3

You Only Look Once:Unified, Real-Time Object Detection Abstract 저자들은 새로운 object detection 접근법인 yolo를 발표합니다. 이전의 객체탐지 연구에서는 classifier를 재 활용해서 detection 작업을 수행했습니다. 대신에 저자들은 object detection을 공간적으로 분리된 bounding box와 확률에 대한 회귀 문제로 설정하였습니다. 한개의 neural network로 bounding box와 class 확률을 예측합니다. 전체 detection pipeline은 single network라서 그것은 end-to-end로 최적화될 수 있습니다. 저자들의 변형된 아키텍쳐는 매우 빠릅니다. YOLO모델은 2초에 45프레임을 처리할 수 있습니다. Introduction 현재 detection 시스템은 classifie.. 2024. 2. 27.

Feature Pyramid Networks for Object Detection Abstract Feature Pyramid는 다른 scale에서 detection object를 위한 recognition에서 가장 기본적인 구성요소입니다. 그러나 현재 딥러닝 object detector는 계산과 메모리를 많이 요구하기 때문에 pyramid 표현을 피합니다. 이 논문에서 저자들은 깊은 convoutional netowrk의 본질적인 multi-scale, pyramid 계층 구조를 활용하여 추가 비용이 거의 없는 feature pyramid를 구축합니다. 측면 연결이있는 top-down 아키텍쳐 연결은 high-level semantic feature map을 모든 sclae에서 구축했습니다. 이 아키텍쳐를 FPN이라고 부르며 여러 어플리케이션에서 일반적은 feature 추출에서 상당.. 2024. 1. 2.

RetinaFace: Single-stage Dense Face Localisation in the Wild Abstract 비제어 환경에서의 얼굴 탐지에 있어서 많은 발전이 이루어졌지만, wild 에서의 정확하고 효율적인 얼굴 위치 파악은 여전히 해결되지 않은 도전 과제로 남아 있습니다. 이 논문은 RetinaFace를 제안하고 다양한 크기의 얼굴에 대해 픽셀 단위로 얼굴의 위치를 파악하는 task를 수행하며 이는 추가적인 extra-supervised와 self-supervised의 장점을 활용한 다중 작업 학습을 통해 이루어진다고합니다. 저자들은 5가지를 기여했다고합니다. 1. 저자들은 WIDER FACE데이터 세트에서 5개의 얼굴 특징점을 수동으로 표시하였고, 이는 extra supervision 신호의 도움으로 어려운 얼굴탐지에서 중요한 개선을 관찰했습니다. 2.또한 저자들은 기존의 supervised.. 2023. 12. 30.

이전 1 다음

티스토리툴바