본문 바로가기 주메뉴 바로가기
국회도서관 홈으로 정보검색 소장정보 검색

목차보기

표제지

Abstract

목차

1장 서론 17

1.1. 연구 배경 17

1.2. 연구 내용 18

2장 관련 연구 21

2.1. CRISPR-Cas9 21

2.1.1. 개요 21

2.1.2. 핵산 22

2.1.3. tRNA 23

2.1.4. Mechanism 25

2.2. 신경망 32

2.2.1. 개요 32

2.2.2. 가중치 34

2.2.3. 바이어스 34

2.2.4. 활성화 함수 35

2.2.5. 손실 함수 36

2.3. 딥러닝 38

2.3.1. 개요 38

2.3.2. CNN 38

2.3.3. GoogLeNet 41

3장 PreCA-Net 45

3.1. 특징 45

3.2. 구조 48

3.2.1. 데이터 전처리 50

3.2.2. 입력층 51

3.2.3. 합성곱층 51

3.2.4. Flatten 층 54

3.2.5. Concatenate 층 55

3.2.6. Fully-Connected 층 55

3.2.7. 출력층 56

3.2.8. 손실 함수 56

3.3. 과적합 방지 기법 57

3.3.1. Early-stopping 58

3.3.2. Batch normalization 58

3.4. Fine Tuning 기법 61

3.4.1. 부분 학습 62

3.4.2. 학습률 63

3.4.3. 옵티마이저 63

4장 구현 및 평가 67

4.1. 구현 67

4.1.1. 데이터 분석 67

4.1.2. 구현 방법 68

4.1.3. 구현 알고리즘 72

4.2. 성능 평가 76

4.4.1. 사전 학습 모델의 성능 평가 76

4.4.2. CRISPR-Cas9 유전자 가위 별 성능 평가 82

4.4.3. Occlusion experiments 85

5장 결론 89

Reference 92

표목차

표 4-1. 기존 모델[5]과 PreCA-Net 성능 비교 85

그림목차

그림 2-1. RNA and DNA are chains of nucleotides 23

그림 2-2. tRNA 구조 24

그림 2-3. PAM을 찾는 Cas9 26

그림 2-4. Target sequence와 결합된 Guide RNA 27

그림 2-5. CRISPR-Cas9 28

그림 2-6. Guide RNA 29

그림 2-7. Guide RNA structure 31

그림 2-8. 신경 세포 뉴런 32

그림 2-9. 신경망 유닛 33

그림 2-10. 활성화 함수 36

그림 2-11. 합성곱 연산 과정 39

그림 2-12. 합성곱 신경망 40

그림 2-13. 일반 신경망 40

그림 2-14. GoogLeNet 구조도 42

그림 2-15. Inception module 44

그림 3-1. 기존 논문 모델 46

그림 3-2. PreCA-Net 구조 49

그림 3-3. One-hot encoding된 target sequence 50

그림 3-4. PreCA-Net의 합성곱층 feature map 생성 과정 52

그림 3-5. 변형 Inception Module 54

그림 3-6. 모델의 과소적합과 과대적합 57

그림 3-7. Early-stopping 58

그림 3-8. Batch normalization 59

그림 3-9. Fine tuning을 위해 동결된 하위층과 특화된 FC층 62

그림 4-1. PreCA-Net source 구성도 69

그림 4-2. 손실 함수 별 사전 학습 모델 성능 77

그림 4-3. 학습률 별 사전 학습 모델 성능 79

그림 4-4. Batch normalization vs. dropout 별 사전 학습 모델 성능 81

그림 4-5. CRISPR-Cas9 유전자 가위 별 PreCA-Net 성능 83

그림 4-6. Occlusion experiments 86

그림 4-7. Target sequence에 한 nucleotide를 차단한 입력 87

그림 4-8. CRISPR-Cas9 유전자 가위 별 occlusion experiments 88

초록보기

 CRISPR-Cas9 유전자 가위는 최근 병충해에 강한 농축산물 연구뿐만 아니라 질환을 유발하는 유전자를 교정하거나 제거하여 질병 치료에 사용하는 등 여러가지 분야에서 다양하게 연구되고 있다. 하지만, 그동안 생명공학 연구자들은 더 높은 효율을 나타내는 유전자 가위를 찾기 위해 다양한 유전자 가위와 guide RNA를 대상으로 실험을 반복하여 많은 시간과 노력을 필요로 해왔다.

이러한 문제를 해결하기 위해 본 논문에서는 최신 CNN 모델의 다양한 기법을 적용하여 CRISPR-Cas9 유전자 가위의 효율을 예측하는 딥러닝 모델인 PreCA-Net을 제안한다. PreCA-Net은 합성곱층을 사용하여 CRISPR-Cas9 유전자 가위들의 일반적인 feature map을 만들고, 특히 여러 크기의 kernel을 사용한 변형 inception module로 유전자 가위 sequence의 다양한 pattern을 학습할 수 있다.

그리고, PreCA-Net은 batch normalization을 통해 학습 과정에서 internal covariate shift를 방지하고, 학습률을 크게 줌으로써 더 빠르게 학습 모델을 만들 뿐만 아니라, fine tuning을 통해서 CRISPR-Cas9 각 유전자 가위에 특화된 모델을 만든다. 손실 함수도 일반적인 mean squared error뿐만 아니라, 모델의 성능 평가 지표로 사용된 Pearson correlation을 사용자 정의 손실 함수로 사용하여 CRISPR-Cas9 유전자 가위 효율의 예측 값과 실제 값의 양의 선형 관계도 동시에 학습할 수 있는 특징을 가지고 있다. 본 논문의 PreCA-Net을 이용하여, 생명공학 연구자들이 연구하고자 하는 유전자에 대해 원하는 유전자 가위와 높은 효율을 보이는 guide RNA를 선택함으로써 시간과 노력을 줄이고 높은 연구 효과를 낼 수 있는 CRISPR-Cas9 유전자 가위 design의 기준을 제시하고자 한다.