본문 바로가기

전체 글73

AI vision 프로젝트 ppt 2024. 2. 13.
Feature Pyramid Networks for Object Detection Abstract Feature Pyramid는 다른 scale에서 detection object를 위한 recognition에서 가장 기본적인 구성요소입니다. 그러나 현재 딥러닝 object detector는 계산과 메모리를 많이 요구하기 때문에 pyramid 표현을 피합니다. 이 논문에서 저자들은 깊은 convoutional netowrk의 본질적인 multi-scale, pyramid 계층 구조를 활용하여 추가 비용이 거의 없는 feature pyramid를 구축합니다. 측면 연결이있는 top-down 아키텍쳐 연결은 high-level semantic feature map을 모든 sclae에서 구축했습니다. 이 아키텍쳐를 FPN이라고 부르며 여러 어플리케이션에서 일반적은 feature 추출에서 상당.. 2024. 1. 2.
RetinaFace: Single-stage Dense Face Localisation in the Wild Abstract 비제어 환경에서의 얼굴 탐지에 있어서 많은 발전이 이루어졌지만, wild 에서의 정확하고 효율적인 얼굴 위치 파악은 여전히 해결되지 않은 도전 과제로 남아 있습니다. 이 논문은 RetinaFace를 제안하고 다양한 크기의 얼굴에 대해 픽셀 단위로 얼굴의 위치를 파악하는 task를 수행하며 이는 추가적인 extra-supervised와 self-supervised의 장점을 활용한 다중 작업 학습을 통해 이루어진다고합니다. 저자들은 5가지를 기여했다고합니다. 1. 저자들은 WIDER FACE데이터 세트에서 5개의 얼굴 특징점을 수동으로 표시하였고, 이는 extra supervision 신호의 도움으로 어려운 얼굴탐지에서 중요한 개선을 관찰했습니다. 2.또한 저자들은 기존의 supervised.. 2023. 12. 30.
DeepFaceLab: Integrated, flexible and extensible face-swapping framework_논문정리 Abstract Deepfake는 detection의 연구를 요구할뿐만아니라 generation methods의 영향도 요구합니다. 그러나 현재 deepfake methods는 worflow에서 모호함을 겪고 성능도 더 안좋습니다. 이러한 문제를 해결하기위해서 저자들은 저명한 deep-fake framework인 face-swapping을 제안합니다. 이 프레임워크는 필요한 도구를 제공해줄뿐만아니라 높은 퀄리티의 face-swapping을 해줍니다. 이프레임워크는 복잡은 boilerplate 코드를 작성하지 않고도 파이프라인을 다른 기느들로 강화해야하는 사람들은 위한 유연하고 느슨한 결합 구조를 제공합니다. 저자들의 원리들의 세부사항은 DeepFace Lab의 영향을 보여주고 그것의 pipeline을 소.. 2023. 12. 29.