본문 바로가기

Paper Review/Image Segmentation6

[논문 리뷰] FCBFormer: FCN-Transformer Feature Fusion for Polyp Segmentation (2022) Paper: https://arxiv.org/pdf/2208.08352v1AbstractFCBFormer는 대장 내시경 영상의 대장암 부분의 영역을 검출하기 위해 제안된 모델이다.폴립(용종) 분할은 병변 탐지 및 분류에 핵심이지만, 수동으로 작업하는 것은 시간 소모가 크다.딥러닝으로 자동화는 가능하지만, 과적합 문제와 장비 다양성에 따른 일반화 성능 저하가 있다. 최근 transformer 기반의 모델들은 성능은 높지만, 출력 해상도가 $(\frac{H}{4} \times \frac{W}{4})$인 한계가 존재했다.해상도의 저하없이 성능을 유지하기 위해, 두 개의 branch로 구성된 architecture를 제안하였다.Primary BranchTransformer Branch(TB) → 중요한 특징 추.. 2025. 7. 7.
[논문 리뷰] DeepLabV3+: Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation (2018) Paper: https://arxiv.org/pdf/1802.02611v3Spatial Pyramid Pooling(SPP)와 Encoder-Decoder 구조는 semantic segmentation 분야에서 사용된다.SPP는 multi-scale contextual 정보를 인코딩할 수 있게 하고, Encoder-Decoder 구조는 object의 경계를 더 디테일하게 포착할 수 있게 한다.본 논문에서는 위 두 방법의 결합을 제안하며, DeepLabV3에 간단하지만 효과적인 decoder를 추가한 DeepLabV3+ 모델을 소개한다. 또한, Xception 모델의 Depthwise Separable Convolution을 ASPP와 Decoder에 적용하였다.ASPP이전의 DeepLab 모델 논문 리.. 2024. 8. 27.
[논문 리뷰] U-Net++: A Nested U-Net Architecture for Medical Image Segmentation (2018) Paper: https://arxiv.org/pdf/1807.10165 AbstractU-Net++ 모델은 U-Net 모델의 업그레이드 버전이다.U-Net++의 구조를 보면 기존과 동일한 각각 Contracting Path와 Expanding Path에 해당하는 Encoder-Decoder 형태이다. 이러한 구조는 Expanding Path에서 원하는 해상도로 up-sampling 시에 정보 손실이 발생한다. 기존의 U-Net은 정보 손실을 줄이기 위해 Contracting Path의 feature map과 Expanding Path의 feature map을 concat을 하였다.그러나, 이런 방법으로는 손실된 정보를 보완했다고 하기엔 부족하였다. 그렇기에 connection 부분을 좀 더 dense하고.. 2024. 8. 18.
[논문 리뷰] DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs (2017) Paper: https://arxiv.org/pdf/1606.00915Abstract본 논문에서는 딥러닝을 사용하여 semantic segmentation task를 다루고 크게 세 가지 기능을 제시한다.1. upsampling된 필터와 함께 convolution을 강조하며, 이를 확장된 컨볼루션(Atrous Convolution = Dilated Convolution)이라고 한다.2. 다중 스케일에서 물체를 견고하게 분할하기 위해 확장된 공간 피라미드 풀링(ASPP)을 제안한다.3. DCNNs(Deep Convolutional Neural Networks)와 확률적 그래픽 모델의 방법을 결합하여 객체 경계의 위치를 개선한다. Atrous Convolution은 밀집 예측 작업에서 강력한 도구로 작용한다.. 2024. 5. 19.
[논문 리뷰] U-Net: Convolutional Networks for Biomedical Image Segmentation (2015) Paper: https://arxiv.org/pdf/1505.04597 2015년도에 발표된 U-Net 모델은 Image Segmentation 분야에서 커다란 영향을 끼친 모델이다. 논문을 통해 자세하게 알아보도록 하자.AbstractDeep Network를 제대로 학습하기 위해서는 많은 annotation이 달린 훈련 샘플이 필요하다. 본 눈문에서는 보다 효율적으로 annotation을 사용하기 위해 데이터 증강을 강력하게 활용하는 전략을 제시한다.제시한 모델 architecture는 context를 포착하는 contracting path와 대칭적으로 정밀한 위치 지정을 가능하게 하는 expansive path로 구성되어 있다. 이런 구조는 아주 적은 이미지에서도 end-to-end로 훈련될 수 있고.. 2024. 5. 19.
[논문 리뷰] FCN: Fully Convolutional Networks for Semantic Segmentation (2015) Paper: https://arxiv.org/pdf/1411.4038 Architecture FCN의 핵심 아이디어는 임의의 크기로 input을 받고 그에 상응하는 output을 생성하는 Fully Convolutional Network를 구축하는 것이다.Classification 신경망(AlexNet, GoogLeNet, VGGNet)을 segmentation task에 맞게 fine-tuning하여 사용한다. 이후, coarse layer에서 얻은 semantic information(deep)와 fine layer에서 얻은 appearance information(shallow)를 결합하는 새로운 architecture(skip architecture)를 정의하여 정확하고 자세한 segmentat.. 2024. 5. 17.