본문 바로가기

논문/segmentation2

논문 U-Net U-Net은 Fully Conv 아키텍쳐로 되어있다. Fully Conv 아키텍쳐 - 입력사이즈에 대한 제한이없다. vggent은 나중에 Flatten을 해주기때문에 입력사이즈의 제한을 받았다. fully conv는 3x3으로 훑기만하기때문에 입력사이즈의 제한이없다. 맨위에 input image tile의 input의 conv를 적용해주면 사이즈손실은 거의없고 채널이 64개로 늘어나게된다.. 그리고 빨간색 화살표로 maxpooling을 하게되는데 그러면 사이즈가 줄어든다. 572x572에서 284x284로 줄어들은것을 알 수 있다. 반복해주면 채널수가 1024가 되는데(이미지의 맨아래부분) 여기까지를 인코더(incoder,contract_path, 압축)라고한다. 그리고 나머지 반을 디코더(decoder.. 2023. 4. 2.
FCN(Fully Convolution Network) end-to-end : 처음부터 끝까지 알아서 학습을 다해간다. piexels-to-pixels : 학습을 하고 분류를 하는 모델 기본적인 딥러닝구조 : conv로 featuremap들을 만들고 만든다음 flatten하고 fc_layer에 넣어줌 분류모델은 fc_layer가 들어가지만 FCN은 fc_layer을 빼버리고 전체의 네트워크 구조를 convolution 구조로 가져감 FCN은 AlexNet, GoogleNet, VGGnet을 finefuning해서 사용했다. FCN은 cnn구조안에서 pooling_1, pooling_2, pooling_3, pooling_4, pooling_5 하게되는데 이때 크기가 1/2, 1/4, 1/8, 1/16, 1/32로 작아지게되고 이렇게 작아진픽셀을 다시 곱하기2.. 2023. 3. 27.