본문 바로가기
논문/classification

cv(computer vision) googlenet 논문

by dohunNewte 2023. 3. 7.
반응형

구글넷논문

googleNet.pdf
1.16MB

논문의 초록

The main hallmark of this architecture is the improved utilization of the computing resources inside the network.

네트워크안에서 컴퓨팅 리소르를 효율적이게 향상시킬려고했었다.

This was achieved by a carefully crafted design that allows for increasing the depth and width of the network while keeping the computational budget constant.

이전의 모델은 deep만 신경을 썼다면 googlenet은 dept와 width를 신경썼다는것을 알 수 있다.

22 layers deep network, the quality of which is assessed in the context of classification and detection

googlenet은 22개의 레이어를 쌓았다.

 

본문

 

모델을 깊게 효율적으로 깊게쌓고싶어했고 depth와 width를 언급합니다.

Alexnet은 7x7필터를 사용했는데 vggnet 저자들은 7x7보다 3x3필터가 더 효율적이라고 생각해서 3x3을 썼었는데

 

googlenet은 처음부분에 7x7필터를 사용합니다.(스티커부분은 pass!)

 

Auxiliary classifier : 보조분류기

원래는 끝에 softmax를 이용해 끝에서만 loss를 신경썼었는데 googlenet은 보조분류기를 이용해 중간중간에도 loss를 신경써주었다.

vgg까지는 flatten을 사용했었는데 googlenet은 Global Average pooling을 이용합니다.

Global Average pooling : 평균내서 필터사이즈값 하나로 만들어버리는 것(feature을 1차원 벡터로 만듬)

파란색네모(얼굴)가 5x5고 빨간색네모(눈)가 3x3이라하자 3x3을하면 세부적인 객체는 잘 볼 수 가있다.

그러나 얼굴같은 큰객체는 5x5가 3x3보다 더 잘 본다. 3x3을 쓰면 정보의 다양화의 면에서 손해가있어서

작은 한가지의 필터만쓰면 큰객체를 포함하기가 어렵다.

그래서 그림을보면 3x3도 쓰고 5x5도 쓴걸 볼 수 있다.(채널을 다양한정보를 가져가도록하기위해서 노력한것을 볼 수 있다 - 다양한필터를 사용)

googlenet은 컴퓨팅 리소스를 신경썼었는데 vggnet에서 3x3필터가 효율적인것을 찾았다. 하지만 위의 그림처럼 5x5도 사용해야하는데 그러면 컴퓨팅 리소스를 많이 사용하게된다. 그래서 googlenet은 효율적인 컴퓨팅 리소스를위해 1x1conv를 사용해준다.(1x1conv를 사용하면 채널축 사이즈를 다룰수있다, 1x1conv는 한칸씩 보기때문에 객체를 포착하는것에는 의미가 없지만 비선형성을 주게된다, 192개의 채널을 한장으로 만들어주기때문에 값들이 정리가된다 - 1x1conv를 이용하면 채널수를 내 마음대로 조정이가능)

3x3, 5x5를 효율적으로 사용할 수 있게되었다. <- width를 넓혀서 정보를 다양하게 가져옴

 

 

parameter정리본

인셉션모듈의 naive버전과 demension-reductions버전

1x1conv를 효율적으로 사용함으로써 파라미터 개수를 훨씬줄여준다.

 

GoogLenet정리

width라는 개념을 도입해서 다양한 사이즈의 filter(필터)를 이용했다.

computation 복잡도를 고려하여 1x1필터를 효율적으로 사용하였다. <- 레이어를 깊게 쌓을 수 있었다.

 

 

결론 : googlenet은 1x1conv를 사용함으로써 width를 신경을 써주는 모습을 보여주었다.(깊게쌓으면서 효율적)

728x90

'논문 > classification' 카테고리의 다른 글

A ConNet for the 2020s 논문정리  (0) 2023.10.25
cv(computer vision) resnet논문  (1) 2023.03.12
cv(computer vision) vggnet 논문  (1) 2023.03.05

댓글