본문 바로가기

논문/text detection2

SRFormer: Text Detection Transformer with Incorporated Segmentation andRegression Abstract현재 text detetion분야는 segmentation-based 와 regression-based 방법이 있습니다.저자들은 segmentation과 regression을 혼합한 DETR-base모델을 사용합니다.저자들의 주요한 분석은 우수한 decoder layer에서 우수한 segmentation 예측을 얻을수 있음을 나타냅니다.이점을 고려해서 저자들은 segmentation branch를 초기 몇 개의 디코더 층에만 포함시키고, 이후 점진적인 회귀 개선을 사용하여 mask로인한 computation load를 최소화하며 성능 향상을 달성했습니다.게다가 저자들은 Mask-informed Query Enhancement module을 제안합니다.저자들은 segmentation 결과를 .. 2024. 7. 4.
TextFuseNet: Scene Text Detection with Richer Fused Features Abstract자연스러운 장면에서 Arbitary shape text detection은 도전적인 과제입니다.이논문은 feature representation의 한계가 있는 기존 논문들과는 달리 다른 접근방식을 사용합니다.저자들은 세가지의 단계를 사용합니다.1. character-2. word-3. global-levelproposal-free 방식의 텍스트 세그멘테이션 모델들이 단일 수준의 특징만을 활용했던 것에 비해, 이 모델은 문자, 단어, 글로벌 수준의 다양한 특징을 융합하여 더 강력한 텍스트 탐지 성능을 달성하고자 합니다. multi-level feature representation은 각각의 characters를 세분화하면서 전반적인 의미정보를 유지해 적절하게 텍스트를 묘사할 수 있습니다.Te.. 2024. 7. 1.