목차

표제지

목차

국문요약 9

1. 서론 11

1.1. 효율적 용종 분할 모델의 필요성 11

1.2. 연구 목적 13

2. 관련 연구 14

2.1. 전통적인 대장내시경 자동화 알고리즘 14

2.2. 특징기반 용종 분할 알고리즘 16

2.3. 딥러닝 기반 용종 분할 알고리즘 17

2.3.1. 영상 데이터를 위한 딥러닝 모델 17

2.3.2. 인코더-디코더 구조 18

2.3.3. 대장내시경 용종 분할 알고리즘 21

2.3.4. 경량화된 딥러닝 분류 모델 25

3. 연구 방법 및 결과 29

3.1. 모델 구조 29

3.2. 용종 모델을 위한 모델 탐색 30

3.3. 실험 환경 30

3.3.1. 데이터셋 30

3.3.2. 손실 함수 30

3.3.3. 세부 실험 환경 31

3.4. 용종 모델 간 비교 33

3.5. 하이퍼파라미터 조정 33

3.5.1. Output stride 34

3.5.2. Decoder channel 34

3.5.3. Atrous rate 36

3.5.4. 손실 함수 37

3.5.5. 옵티마이저 40

3.6. 최종 모델 선정 42

4. 토의 44

5. 결론 45

참고문헌 46

ABSTRACT 54

〈표 1〉 인코더로 선정된 모델들에 대한 정보, Top1-acc는 정확도와 동일한 의미로 ImageNet 데이터셋을 기준으로 함 30

〈표 2〉 모델 학습을 위한 학습 환경 상세 32

〈표 3〉 모델 간 실험 결과 33

〈표 4〉 Output stride에 대한 성능 비교 34

〈표 5〉 Decoder channel에 대한 성능 비교 35

〈표 6〉 Atrous rate에 대한 성능 비교 36

〈표 7〉 손실 함수에 대한 성능 비교 38

〈표 8〉 옵티마이저에 대한 성능 비교 40

〈표 9〉 최종 조정 모델 비교 42

〈표 10〉 제안된 모델과 기존 모델 간의 성능 비교 44

[그림 1] 2010 ~ 2019 국내 암 발병자수 및 사망자수 통계 12

[그림 2] 용종 절제술의 예시 12

[그림 3] 용종의 다양한 패턴 및 용종 분할 예시 13

[그림 4] Tan et al.이 제안한 region growing 알고리즘 14

[그림 5] 대장 영상에 대한 Edge detection 알고리즘 간의 비교[8]. 좌측 상단부터 (a) Sobel, (b) LOG, (c) Fuzzy, (d) Small intensity difference, (e)... 15

[그림 6] 캡슐 내시경으로 촬영한 용종이 포함된 대장 영상 및 분할 영상 16

[그림 7] Condessa et al.이 제안한 분할 알고리즘[12]. (a) 전처리된 영상, (b) LPA 없이 영상 개선한 곡률 특징 맵, (c) LPA를 적용한 곡률 특징 맵, (d) (b)와... 17

[그림 8] CNN을 이용한 영상 분류 모델 LeNet 18

[그림 9] Vision Transformer[15]와 Swin Transformer[16]의 구조 18

[그림 10] U-Net의 인코더-디코더 구조 19

[그림 11] DeepLabV3+에서 제안된 개념[19]. (c)에서 볼 수 있듯이 DeepLabV3+는 Spatial pyramid pooling과 인코더-디코더 구조를 결합함 20

[그림 12] DeepLabV3+의 전체 구조 20

[그림 13] ResUNet++[25], DoubleU-Net[31]의 전체 구조 21

[그림 14] MSRF-Net의 전체 구조(a)와 디코더 구조(b) 22

[그림 15] BiFusion 모듈을 포함한 TransFuse의 전체 구조 23

[그림 16] SSFormer의 전체 구조와 LE 구조 24

[그림 17] HarDNet[38]의 전체 구조와 HarDNet 블록의 구조 25

[그림 18] RFB 모듈 및 Aggregation 모듈의 구조 25

[그림 19] SqueezeNet의 구조(좌) 및 Fire 모듈의 구조(우) 26

[그림 20] MobileNetV2과 MobileNetV3의 블록 구조[45]. MobileNetV3는 기존 MobileNetV2의 Residual 블록에 Squeeze and Excite 레이어를 적용하였음 27

[그림 21] Semantic 분할 문제에 대한 MobileNetV3의 성능[45]. OS는 Output Stride로 16일 경우 Atrous convolution이 적용되었으며, MAdd는 Multiply-Adds로... 27

[그림 22] EfficientNet에 적용된 Compound scaling의 구조와 수식[51]. α, β, γ는 Small Grid Search를 통해 결정되는 상수, ϕ는 하이퍼파라미터로 주어진... 28

[그림 23] EfficientNet과 다른 Convolution 모델간의 성능 비교 28

[그림 24] 본 연구에서 제안하는 모델 29

[그림 25] 서로 다른 Output stride 간 분할 마스크 비교 34

[그림 26] 서로 다른 Decoder channel 간 분할 마스크 비교 35

[그림 27] 작은 용종에 대한 서로 다른 Atrous rate 간 분할 마스크 비교 36

[그림 28] 큰 용종에 대한 서로 다른 Atrous rate 간 분할 마스크 비교 37

[그림 29] 서로 다른 손실 함수 간 분할 마스크 비교 39

[그림 30] 서로 다른 옵티마이저 간 분할 마스크 비교 41

[그림 31] 최종 조정 모델 간 분할 마스크 비교 43

[그림 32] 비교 모델 간의 성능 차이에 대한 그래프, X축은 파라미터 수, Y축은 Dice Coefficient, 원의 크기는 1/GFLOPs를 의미함. 원의 크기의 경우... 45