[표지] 1
최종보고서 2
요약문 3
목차 7
1. 연구개발과제의 개요 29
2. 연구개발과제의 수행 과정 및 수행 내용 30
(1) 1차년도 30
(2) 2차년도 98
(3) 3차년도 179
(4) 4차년도 266
(5) 5차년도 348
3. 연구개발과제의 수행 결과 및 목표 달성 정도 421
1) 연구수행 결과 421
(1) 정성적 연구개발성과 421
(2) 정량적 연구개발성과 427
(3) 세부 정량적 연구개발성과 429
(4) 계획하지 않은 성과 및 관련 분야 기여사항[내용없음] 433
2) 목표 달성 수준 435
4. 목표 미달 시 원인분석 436
1) 목표 미달 원인(사유) 자체분석 내용 436
2) 자체 보완활동 436
3) 연구개발 과정의 성실성 436
5. 연구개발성과의 관련 분야에 대한 기여 정도 437
6. 연구개발성과의 관리 및 활용 계획 437
1) 시스템 관리체계 437
2) 활용계획 437
3) 추가 연구의 필요성 438
별첨 자료 439
〈별첨1-1〉 1차년도 환경 임상·오믹스 데이터 아카이브 설계 440
〈별첨1-2〉 1차년도 환경성 질환 오믹스DB 시스템 설계 505
〈별첨1-3〉 1차년도 환경성질환 영향 분석 정보관리 통합 플랫폼 설계 532
〈별첨2〉 2차년도 시스템 프로토타입 설계/개발 549
〈별첨3〉 3차년도 환경유해인자 노출정보 데이터베이스 및 시스템 개발 581
〈별첨4〉 4차년도 환경성질환 영향 분석 정보관리 통합 플랫폼 개발 622
[뒷표지] 663
〈표 1〉 멀티오믹스 데이터 항목 31
〈표 2〉 NGS 메타데이터 항목 31
〈표 3〉 Array 메타데이터 항목 33
〈표 4〉 보건의료용어표준 34
〈표 5〉 요구사항 도출 목록(세부 내용은 별첨1-1 "요구사항 도출" 참고) 36
〈표 6〉 메뉴 구조별 화면 정의(세부 내용은 별첨1-1 "화면 정의 및 설계서" 참고) 38
〈표 7〉 테이블 및 컬럼 정의(세부 내용은 별첨1-1 "컬럼 정의서" 참고) 42
〈표 8〉 기본 분석 완료 데이터 현황 44
〈표 9〉 데이터셋 가시화 및 분석방법 현황 45
〈표 10〉 표준 참조 유전체 데이터베이스 구성 46
〈표 11〉 요구사항 도출 목록(세부 내용은 별첨1-2 "요구사항 도출" 참고) 46
〈표 12〉 메뉴 구조별 화면 정의(세부 내용은 별첨1-2 "화면 정의 및 설계서" 참고) 49
〈표 13〉 테이블 및 컬럼 정의(세부 내용은 별첨1-2 "컬럼 정의서" 참고) 50
〈표 14〉 시스템 사용자 구분 58
〈표 15〉 환경 및 보건 관련 시스템 현황 분석 59
〈표 16〉 환경보건센터 지정‧운영 현황(2021.09.06. 기준) 62
〈표 17〉 환경보건센터 정보 제공 현황 63
〈표 18〉 환경유해인자 및 환경성질환 영향 분석 연구수행 절차 및 결과물 65
〈표 19〉 국민건강영향조사 원시자료(DB) 정보제공 항목 66
〈표 20〉 건강보험 데이터 이용절차 및 방법 69
〈표 21〉 환경보건포털 주요 정보 72
〈표 22〉 국내 환경보건 관련 정보제공 항목 비교 75
〈표 23〉 해외 환경보건 관련 정보제공 항목 비교 75
〈표 24〉 국내외 환경보건 정보 제공 장단점 비교 76
〈표 25〉 환경부 정책담당과별 수행업무 및 정책근거 79
〈표 26〉 호흡기질환 관련 환경보건 DB 현황 80
〈표 27〉 환경보건센터 설문 DB 81
〈표 28〉 신경/발달질환 관련 환경보건 DB 현황 82
〈표 29〉 요구사항 수집 83
〈표 30〉 요구사항 분석 절차 83
〈표 31〉 요구사항의 종류 85
〈표 32〉 요구사항 분류 및 구성 86
〈표 33〉 요구사항 도출 목록(세부 내용은 별첨1-3 "요구사항 도출" 참고) 87
〈표 34〉 요구사항 검증 89
〈표 35〉 환경성질환 영향 분석 정보관리 통합 플랫폼 공통 기능 91
〈표 36〉 환경성질환 영향 분석 정보관리 통합 플랫폼 관리자 기능 91
〈표 37〉 환경유해인자 노출정보 데이터베이스 기능 91
〈표 38〉 환경보건 DB 표준화 코드 설명서에 따른 환경보건 DB 분류 93
〈표 39〉 원시자료 메타 정보 96
〈표 40〉 원시자료 구성 항목 96
〈표 41〉 원시자료 메타 정보 96
〈표 42〉 관련 문서 정보 96
〈표 43〉 역할에 따른 사용자 그룹 분류 100
〈표 44〉 임상데이터 등록정보 100
〈표 45〉 오믹스데이터 등록정보 100
〈표 46〉 임상 및 오믹스 데이터 분양 절차 및 설명 100
〈표 47〉 분양 상태 설명 102
〈표 48〉 수은농도와 아토피 관련 SNPs 118
〈표 49〉 메틸파라벤에 의한 유전자 발현 프로파일 분석(세포주: HepG2) 125
〈표 50〉 수은에 의한 유전자 발현 프로파일 분석(세포주: HepG2) 126
〈표 51〉 비스페놀-A에 의한 유전자 발현 프로파일 분석(세포주: HepG2) 127
〈표 52〉 메틸파라벤에 의한 유전자 발현 프로파일 분석(세포주: H1299) 130
〈표 53〉 수은에 의한 유전자 발현 프로파일 분석(세포주: H1299) 133
〈표 54〉 비스페놀-A에 의한 유전자 발현 프로파일 분석(세포주: H1299) 136
〈표 55〉 하드웨어 아키텍처(2 Tier) 140
〈표 56〉 상용/오픈소스 소프트웨어 비교 141
〈표 57〉 환경성질환 영향 분석 정보관리 통합 플랫폼 소프트웨어 아키텍처 141
〈표 58〉 개발환경 구성 143
〈표 59〉 시스템 별 배포 요소 145
〈표 60〉 WEB 시스템 레이어 구성 145
〈표 61〉 컴포넌트 유형 및 구성 147
〈표 62〉 구성 요소간 호출 관계 149
〈표 63〉 Log Level의 구분 150
〈표 64〉 데이터 아키텍처 레이어 151
〈표 65〉 데이터 모델링 프로세스 152
〈표 66〉 코드관리정책 153
〈표 67〉 채번관리정책 153
〈표 68〉 제약조건 정책 155
〈표 69〉 DB 오브젝트 적용 정책 155
〈표 70〉 환경보건 정보제공 시스템 업무 프로세스 158
〈표 71〉 설문조사 공통 변수(예시) 160
〈표 72〉 건강검진 공통 변수(예시) 162
〈표 73〉 생체시료 공통 변수(예시) 162
〈표 74〉 환경요인 공통 변수(예시) 162
〈표 75〉 환경유해인자 노출정보 데이터베이스 기능(프로토타입) 163
〈표 76〉 환경유해인자 노출 분석대상물질 164
〈표 77〉 모체 코호트 데이터에서 추출된 환경성 질환 165
〈표 78〉 모체 코호트 분석 대상 환경유해인자 166
〈표 79〉 코호트데이터 관리 테이블 목록(프로토타입) 168
〈표 80〉 DB 테이블 생성 스크립트(프로토타입) 169
〈표 81〉 환경유해인자 노출정보 데이터베이스 입력 데이터(프로토타입) 169
〈표 82〉 분석: 데이터의 부분집합을 추출 172
〈표 83〉 분석: 데이터의 항목을 수치형으로 변환 173
〈표 84〉 분석: 데이터의 각 항목을 범주형 데이터로 변환 173
〈표 85〉 분석: 선형회귀분석 수행 174
〈표 86〉 분석: 분석된 model 변수 요약 정보 표기 175
〈표 87〉 분석: 분석된 model 변수에 대한 시각화 176
〈표 88〉 분석: model 변수에 대한 분산분석 수행 177
〈표 89〉 메뉴 구조별 화면 정의(세부 내용은 별첨2 "화면 정의 및 설계서" 참고) 178
〈표 90〉 메뉴 구조별 화면 정의(세부 내용은 별첨2 "화면 정의 및 설계서" 참고) 178
〈표 91〉 역할에 따른 사용자 그룹 분류 180
〈표 92〉 임상데이터 등록정보 180
〈표 93〉 오믹스 데이터 등록정보 181
〈표 94〉 오믹스 데이터 등록 절차와 상태정보 182
〈표 95〉 오믹스 데이터 기탁내역 목록화면 툴 버튼 설명 186
〈표 96〉 오믹스 데이터 종류별 원천, 가공 데이터 종류 188
〈표 97〉 오믹스 데이터 분양 절차와 상태정보 192
〈표 98〉 환경성 질환 오믹스 DB검색 시스템 구축 프로세스 200
〈표 99〉 가상머신과 Docker 차이 200
〈표 100〉 yum을 활용한 docker 설치(예시) 201
〈표 101〉 리눅스 서비스 등록 예시 201
〈표 102〉 Docker 실행 및 상태 확인(예시) 201
〈표 103〉 사용 명령어 기본 구조 202
〈표 104〉 Docker 명령어 예시 202
〈표 105〉 DB 설치 및 생성 프로세스 204
〈표 106〉 DB 마이그래이션 예시 205
〈표 107〉 cbioportal-container 구동 명령 예 207
〈표 108〉 환경성 질환 오믹스 DB 데이터 로딩 프로세스 207
〈표 109〉 정규화된 멀티 오믹스 데이터 파일 구성 예 208
〈표 110〉 Meta_study.txt 작성 예제 208
〈표 111〉 Meta_clinical_sample.txt 예 209
〈표 112〉 Data_clinical_sample.txt file 작성 예 209
〈표 113〉 Meta_clinical_patient.txt 예 210
〈표 114〉 Data_clinical_patient.txt file 작성 예 210
〈표 115〉 Meta_cna_seg.txt 211
〈표 116〉 brca_tcga_Data_cna_hg19.seg 예 211
〈표 117〉 Meta_expression_file.txt 예 212
〈표 118〉 expression datatype 예시 212
〈표 119〉 프로젝트 경로 이동 예시 213
〈표 120〉 convertExpressionZscores.pl 스트립트 실행 / 결과 예 213
〈표 121〉 Convert ExpressionZcores Transformation Algorithm 213
〈표 122〉 Implementation 스크립트 예시 214
〈표 123〉 Entrez_Gene_Id 만 포함 Data_expression_zscores_file.txt 예 214
〈표 124〉 Hugo_Symbol와 Entrez_Gene_Id를 포함한 Data_expression_zscores_file.txt 예 214
〈표 125〉 Hugo_Symbol만 포함한 Data_expression_zscores_file.txt 예 214
〈표 126〉 Meta_mutations.txt 예 215
〈표 127〉 case_list.txt 예 215
〈표 128〉 Import container 생성 / 접속 예시 216
〈표 129〉 importer-container 접속 명령 예 216
〈표 130〉 Validate script 실행 명령 예 216
〈표 131〉 소스경로 설정 예시 218
〈표 132〉 metaImport.py 스크립트 경로 예시 218
〈표 133〉 metaImport.py 스크립트 실행 예시 218
〈표 134〉 웹 시스템 재가동 명령 예시 218
〈표 135〉 멀티오믹스 데이터 별 초기 데이터 및 최종 정규화 파일 형식 220
〈표 136〉 SNP Array 전처리 파이프라인 단계별 생성 데이터 222
〈표 137〉 ChIP Seq 전처리 파이프라인 단계별 생성 데이터 224
〈표 138〉 RNA Seq 전처리 파이프라인 단계별 생성 데이터 226
〈표 139〉 RNA Seq 전처리 파이프라인 단계별 생성 데이터 228
〈표 140〉 멀티오믹스 데이터 별 생성플랫폼 및 샘플 수 228
〈표 141〉 SNP 데이터 전처리 결과. 샘플 별 542,781 건의 SNPs 정보에 대한 데이터 정규화 수행 229
〈표 142〉 세포주의 RNA Seq 데이터 전처리 결과 229
〈표 143〉 인체 유래 RNA Seq 데이터 전처리 결과 229
〈표 144〉 인체 유래 ChIP Seq 데이터 전처리 결과 230
〈표 145〉 세포주 유래 ChIP Seq 데이터 전처리 결과 231
〈표 146〉 연구대상자 메타 정보 242
〈표 147〉 분석대상물질 메타정보 243
〈표 148〉 환경유해인자 노출정보 분석 대상 물질 목록 243
〈표 149〉 샘플 데이터 메타정보 244
〈표 150〉 샘플 반출 메타정보 245
〈표 151〉 샘플 검수정보 245
〈표 152〉 샘플 분석결과 245
〈표 153〉 환경유해인자 노출 분석대상물질 246
〈표 154〉 환경유해인자 분석대상물질 코드 246
〈표 155〉 샘플 반출 양식 257
〈표 156〉 환경유해인자 노출정보 물질분석 결과 양식 258
〈표 157〉 설문 응답자 메타정보 259
〈표 158〉 설문 유형(단일 응답) 259
〈표 159〉 설문 유형(복수 응답 및 기타 유형) 259
〈표 160〉 설문 유형(복수 응답 및 기타 유형) 259
〈표 161〉 설문 유형(응답 점수 계산 유형) 260
〈표 162〉 설문 유형(그림 삽입 유형) 260
〈표 163〉 설문 유형(추가 정보 텍스트 삽입 유형) 261
〈표 164〉 엔티티 및 테이블 정의(세부 내용은 별첨3 "테이블 정의서" 참고) 264
〈표 165〉 메뉴 구조별 화면 정의(세부 내용은 별첨3 "화면 정의 및 설계서" 참고) 265
〈표 166〉 4차년도 시스템 운영 환경 및 프로그램 버전 266
〈표 167〉 오믹스 원천 데이터 수집 및 등록현황, 2020.10.28. 기준 267
〈표 168〉 환경유해물질 참고DB 상세 275
〈표 169〉 업무별 등록 프로세스 변경 사항 280
〈표 170〉 연구 샘플 내 샘플 구분 정의 282
〈표 171〉 환경유해물질 Value Type 정의 285
〈표 172〉 일괄등록 CLI 옵션 파라미터 정의 286
〈표 173〉 일괄등록 CLI 실행 커맨드(예시) 287
〈표 174〉 일괄등록 CLI 종료 경우(예시) 287
〈표 175〉 일괄등록 업무 프로세스 정의 288
〈표 176〉 표준등록템플릿 유의사항 290
〈표 177〉 표준등록템플릿, 연구 및 실험정보 정의 290
〈표 178〉 표준등록템플릿, 오믹스 정보 정의 292
〈표 179〉 가시화 전용 ShinyDB 데이터 297
〈표 180〉 가시화 전용 ShinyDB 테이블 정보 298
〈표 181〉 Exposome Navigator 연관 검색 결과 상세정보 303
〈표 182〉 PCA explorer 단계별 정의 307
〈표 183〉 사용된 샘플 수 요약 정보 309
〈표 184〉 기계학습 적용 모델 별 정확도 결과 요약 309
〈표 185〉 인체 유래 샘플 멀티오믹스 데이터 수령 현황 312
〈표 186〉 세포주 유래 샘플 멀티오믹스 데이터 수령 현황 313
〈표 187〉 인체 유래 SNP 데이터 전처리 과정 별 SNP 수 314
〈표 188〉 인체 유래 RNA-Seq 데이터 전처리 단계별 요약 정보 314
〈표 189〉 세포주 유래 RNA-Seq 데이터 전처리 단계별 요약 정보 314
〈표 190〉 세포주 ChIP-Seq 데이터 전처리 결과 316
〈표 191〉 인체 유래 ChIP-Seq 데이터 전처리 결과 요약 316
〈표 192〉 인체 유래 MeDIP-Seq 전처리 결과 317
〈표 193〉 세포주 유래 MeDIP-Seq 전처리 결과 317
〈표 194〉 혈중 수은과 아토피피부염에 관계된 32 개의 차등발현 유전자 322
〈표 195〉 32 개의 차등발현 유전자에 대한 유전자 온톨로지 기능분석 결과 323
〈표 196〉 정상 군과 천식 질환군의 차등발현 유전자 목록 327
〈표 197〉 전사체와 후성 유전체 데이터의 상관관계 분석 결과 330
〈표 198〉 환경성질환 영향 분석 정보관리 통합 플랫폼 기능(일반) 332
〈표 199〉 메뉴 구조별 화면 정의(세부 내용은 별첨4 "화면 정의 및 설계서" 참고) 333
〈표 200〉 엔티티 및 테이블 정의(세부 내용은 별첨4 "테이블 정의서" 참고) 337
〈표 201〉 웹 표준 및 웹 접근성 관리 컨벤션/규칙 338
〈표 202〉 연구대상자 정보 API 개요 339
〈표 203〉 연구대상자 정보 API 요청 메시지 339
〈표 204〉 연구대상자 정보 API 응답 메시지 340
〈표 205〉 연구대상자 정보 API 요청 및 응답 메시지 예시 341
〈표 206〉 환경유해인자 노출 분석 정보 API 개요 342
〈표 207〉 환경유해인자 노출 분석 정보 API 요청 메시지 342
〈표 208〉 환경유해인자 노출 분석 정보 API 응답 메시지 343
〈표 209〉 환경유해인자 노출 분석 정보 API 요청 및 응답 메시지(예시) 344
〈표 210〉 환경설문/증례기록 API 개요 344
〈표 211〉 환경설문/증례기록 API 요청 메시지 344
〈표 212〉 환경설문/증례기록 API 응답 메시지 345
〈표 213〉 환경설문/증례기록 API 요청 메시지 및 응답 메시지(예시) 346
〈표 214〉 API 에러 코드 347
〈표 215〉 API 호출 에러(예시) 347
〈표 216〉 5차년도 시스템 운영 환경 및 프로그램 버전 348
〈표 217〉 오믹스 원천 데이터 수집 및 등록현황, 2021.12.31. 기준 349
〈표 218〉 시스템 이전 대상 목록 368
〈표 219〉 오믹스 데이터 전처리 표준 형식 380
〈표 220〉 시료 별 수집된 오믹스 데이터 383
〈표 221〉 세포주 유래 샘플 RNA-Seq 전처리 결과 384
〈표 222〉 인체 유래 샘플 RNA-Seq 전처리 결과 384
〈표 223〉 세포주 유래 샘플 MeDIP-Seq 전처리 결과 385
〈표 224〉 인체 유래 샘플 MeDIP-Seq 전처리 결과 385
〈표 225〉 세포주 유래 샘플 ChIP-Seq 전처리 결과 385
〈표 227〉 H1299 세포주 차등 발현 유전자 Functional annotation 388
〈표 228〉 HepG2 세포주 차등 발현 유전자 Functional annotation 389
〈표 229〉 Up-regulated gene의 유전자 주석 분석 결과 391
〈표 230〉 유전자 발현 데이터와 메틸화 데이터의 상관관계 분석 결과 392
〈표 231〉 Enriched Pathway 목록 394
〈표 232〉 차등발현 유전자들의 GSEA 분석 결과 396
〈표 233〉 공통으로 up-regulated 되는 5개 유전자에 대한 유전자 주석 분석 결과 398
〈표 234〉 유전자 발현 데이터와 메틸화 데이터의 상관관계 분석 결과 399
〈표 235〉 환경설문/증례기록 문항 및 응답 결과 일괄 업로드 동작 수정 405
〈표 236〉 UI/UX 점검 및 개선사항 408
〈표 237〉 웹사이트 호환성 점검 수행 결과 412
〈표 238〉 웹 접근성 점검 수행 결과 413
〈표 239〉 웹 서비스 취약점 검토 및 보안조치사항(요약) 417
〈표 240〉 웹 서비스 취약점 검토 및 보안조치사항(예시) 419
〈그림 1〉 목표 시스템 구성도 29
〈그림 2〉 데이터 등록 및 분양 프로세스 설계 36
〈그림 3〉 환경유해인자 익스포좀 아카이브 시스템 설계 프로세스 36
〈그림 4〉 환경유해인자 익스포좀 아카이브 논리 ERD 40
〈그림 5〉 환경유해인자 익스포좀 아카이브 물리 ERD 41
〈그림 6〉 환경성 질환 오믹스 시스템 ERD 49
〈그림 7〉 환경유해인자에 따른 생물학적 기작 규명을 위한 다중분석 설계 51
〈그림 8〉 DNA 메틸화 분석 파이프라인 52
〈그림 9〉 히스톤 modification 분석 파이프라인 52
〈그림 10〉 유전체 변이 분석 파이프라인 53
〈그림 11〉 Total RNA 분석 파이프라인 54
〈그림 12〉 Small RNA 분석 파이프라인 54
〈그림 13〉 프로테옴, 메타볼롬 분석 파이프라인 55
〈그림 14〉 환경부 정보화 정책 방향성 57
〈그림 15〉 환경성질환 영향 분석 정보관리 통합 플랫폼 58
〈그림 16〉 어린이활동공간 환경안전진단 시스템 59
〈그림 17〉 국립환경과학원 환경보건자료 통합관리 시스템 61
〈그림 18〉 원시자료 활용 순서 61
〈그림 19〉 질병관리본부 질병보건 통합관리 시스템 67
〈그림 20〉 생활안전지도 시스템 67
〈그림 21〉 C-CHAMP 구성 68
〈그림 22〉 의료정보지원센터 68
〈그림 23〉 한국인체자원은행네트워크 70
〈그림 24〉 국립환경과학원 환경보건 정보 제공 70
〈그림 25〉 국립환경과학원 국민환경기초조사 원시자료 이용지침서 71
〈그림 26〉 국민환경보건기초조사 원시자료 이용 절차 72
〈그림 27〉 유럽 ENHIS 73
〈그림 28〉 미국 MDH 73
〈그림 29〉 미국 NIH Health information 74
〈그림 30〉 미국 ASTDR 74
〈그림 31〉 환경유해인자 노출에 따른 건강/생태계 영향 77
〈그림 32〉 요구사항 분석 프로세스 84
〈그림 33〉 환경성질환 영향 분석 정보관리... 90
〈그림 34〉 설문조사 DB 구성 94
〈그림 35〉 건강검진 DB 구성 94
〈그림 36〉 생체시료 DB 구성 95
〈그림 37〉 환경시료 DB 구성 95
〈그림 38〉 아카이브 시스템의 오믹스 데이터 등록 및 분양 프로세스 99
〈그림 39〉 오믹스 데이터 디렉토리 관리 103
〈그림 40〉 생활공감과제 데이터 관리현황 104
〈그림 41〉 PMRA 데이터 관리현황 104
〈그림 42〉 case/control gwas 분석기능 지원 105
〈그림 43〉 PCA 분석 기능 105
〈그림 44〉 Co-expression 시각화 프로토타입 개발 106
〈그림 45〉 mRNA expression 정보 교차분석 시각화 프로토타입 개발 107
〈그림 46〉 유전자 네트워크 분석 및 시각화 기능 프로토타입 개발화면 107
〈그림 47〉 세포 독성 데이터의 시각화 기능 프로토타입 개발 108
〈그림 48〉 3차원 scatter plot 시각화 기능 개발 109
〈그림 49〉 Heatmap 시각화 기능 개발 110
〈그림 50〉 RNA-Seq 데이터의 volcano plot 시각화기능 개발 110
〈그림 51〉 Gene ontology enrichment 분석결과 시각화 111
〈그림 52〉 Enrichment pathway 분석결과의 시각화 112
〈그림 53〉 아토피 및 수은농도에 대한 GWAS 분석을 위한 PMR array 113
〈그림 54〉 QQ-plot(수은농도 ~ 산모나이 + IgE) 114
〈그림 55〉 QQ-plot(수은농도 ~ 산모나이) 115
〈그림 56〉 QQ-plot(아토피 ~ 산모나이 + IgE) 115
〈그림 57〉 QQ-plot(아토피 ~ 산모나이) 116
〈그림 58〉 QQ-plot(아토피 ~ hg_cord_b + 산모나이 + IgE) 116
〈그림 59〉 QQ-plot(아토피 ~ hg_cord_b + 산모나이) 117
〈그림 60〉 QQ-plot(아토피 ~ hg_cord_b) 117
〈그림 61〉 맨하탄플랏(수은농도 ~ 산모나이) 118
〈그림 62〉 맨하탄플랏(수은농도 ~ 산모나이 + IgE) 119
〈그림 63〉 맨하탄플랏(아토피 ~ 산모나이 + IgE) 119
〈그림 64〉 맨하탄플랏(아토피 ~ 산모나이) 120
〈그림 65〉 맨하탄플랏(아토피 ~ hg_cord_b + 산모나이 + IgE) 120
〈그림 66〉 맨하탄플랏(아토피 ~ hg_cord_b + 산모나이) 121
〈그림 67〉 맨하탄플랏(아토피 ~ hg_cord_b) 121
〈그림 68〉 RNA-Seq 데이터 발현 수치 측정 workflow 122
〈그림 69〉 2개 세포주에서의 RNA-Seq 데이터 생산 현황 123
〈그림 70〉 두 세포주의 PCA plot 결과 123
〈그림 71〉 세포주 RNA-Seq데이터의 heatmap 결과 124
〈그림 72〉 환경성질환 영향 분석 정보관리 통합 플랫폼 139
〈그림 73〉 모듈 구조도 144
〈그림 74〉 런타임 구성도 144
〈그림 75〉 컴포넌트 유형 146
〈그림 76〉 컴포넌트 호출 147
〈그림 77〉 컴포넌트간 처리 흐름 148
〈그림 78〉 Conceptual View 149
〈그림 79〉 Software Architecture Layer View 150
〈그림 80〉 프레임워크의 서비스 구성 150
〈그림 81〉 플랫폼 데이터 구성 151
〈그림 82〉 테이블 LOGGING 처리 154
〈그림 83〉 플랫폼 내 데이터 구성요소(예시) 159
〈그림 84〉 연구진에 전달된 모체 코호트의 환경유해인자 분석 데이터 165
〈그림 85〉 환경유해인자 노출정보 데이터베이스 프로토타입 논리 ERD 170
〈그림 86〉 물리 ERD 170
〈그림 87〉 환경유해인자 데이터 처리 프로세스 171
〈그림 88〉 model 변수에 대한 요약 결과 175
〈그림 89〉 model 변수에 대한 coef 정보 요약 결과 176
〈그림 90〉 model 변수에 대한 시각화... 177
〈그림 91〉 분산분석 실행 결과 178
〈그림 92〉 멀티오믹스 및 임상데이터 관리 데이터베이스 스키마 182
〈그림 93〉 멀티오믹스와 환경임상 데이터 등록 프로세스 183
〈그림 94〉 임상데이터 목록조회, 정보입력 팝업, 상세 화면 예시 184
〈그림 95〉 환경유해성연구 등록 1단계 화면(기본정보, 노출정보, 임상연구윤리 정보) 184
〈그림 96〉 연구과제, 임상샘플 검색과 선택 팝업 185
〈그림 97〉 환경유해성연구 등록 2단계 화면(검사항목, 검사결과) 185
〈그림 98〉 환경유해성연구 상세정보 화면 186
〈그림 99〉 마이페이지 오믹스 데이터 기탁내역 목록조회 화면 187
〈그림 100〉 오믹스 데이터 등록 1단계 화면 예시 188
〈그림 101〉 오믹스 데이터 등록 3단계 파일 등록 화면 189
〈그림 102〉 오믹스 데이터 등록 4단계 기탁 동의서 업로드 화면 189
〈그림 103〉 오믹스 등록 심의/승인 목록 조회 화면 190
〈그림 104〉 오믹스 등록신청 심의결과 등록 화면 191
〈그림 105〉 멀티오믹스 데이터 등록 심의/승인 처리 화면 192
〈그림 106〉 멀티오믹스 및 환경임상 데이터 분양 프로세스 193
〈그림 107〉 분양시스템 분양 신청자 분양신청 목록 조회 화면 193
〈그림 108〉 분양신청 정보 입력/수정화면 194
〈그림 109〉 마이페이지 분양신청 심의/승인 목록 화면 195
〈그림 110〉 분양신청 심의결과 등록 화면 195
〈그림 111〉 분양신청 심의결과 조회와 승인결과 등록 화면 196
〈그림 112〉 익스포좀 아카이브 시스템의 메인 화면과 SSO 사용자 로그인 화면 196
〈그림 113〉 익스포좀 아카이브 시스템 디자인 가이드라인 197
〈그림 114〉 익스포좀 아카이브 시스템 통합검색 화면 198
〈그림 115〉 분양신청서 작성과 오믹스 데이터 파일 분양 목록 화면 198
〈그림 116〉 환경임상, 멀티오믹스 데이터 수집 엑셀 템플릿 199
〈그림 117〉 cBioPortal ERD 206
〈그림 118〉 Validating 실패 보고서 예제 217
〈그림 119〉 환경성질환 오믹스 DB 시스템 웹 화면 디자인(Mutil Exposome Expolorer) 219
〈그림 120〉 SNP Array 분석 파이프라인 흐름도 221
〈그림 121〉 SNP Array 전처리 과정에서 생성되는 파일 예제 221
〈그림 122〉 Chip Seq 전처리 흐름도 223
〈그림 123〉 Chip Seq 전처리 과정에서 생성되는 파일 예제 223
〈그림 124〉 RNA Seq 전처리 흐름도 225
〈그림 125〉 RNA Seq 전처리과정에서 생성되는 파일 예제 225
〈그림 126〉 MeDIP Seq 전처리 흐름도 227
〈그림 127〉 MeDIP Seq 전처리 과정에서 생성되는 파일 예제 227
〈그림 128〉 멀티오믹스 DB 시스템 등록 파일 예제 232
〈그림 129〉 멀티오믹스 DB 시스템 초기 화면 예시 233
〈그림 130〉 등록된 샘플 및 오믹스 데이터 정보 요약 예시. 환자의 메타 정보 요약 및 등록된... 233
〈그림 131〉 등록된 환자 및 샘플 정보 예시. 화면의 각 항목은 등록된 데이터에 따라 변경 가능 (1)... 234
〈그림 132〉 전장 유전체에 대한 샘플 별 Histone modification 수준(ChIP Seq 데이터) 시각화 정보... 235
〈그림 133〉 Query By Gene 버튼 클릭 시 초기 화면 예시. Selected Genomic Profiles 항목에서 초기에... 235
〈그림 134〉 유전자에 대한 멀티오믹스 정보 조회화면 예시 (1) 초기 데이터 조회 화면 예시(유전자... 236
〈그림 135〉 조회된 유전자 간 변이 연관석 분석 결과 예시 237
〈그림 136〉 멀티오믹스 데이터간 상관관계 분석. 등록된 유전자나 메타 항목간의 상관 분석 기능 예시 237
〈그림 137〉 유전자와 연관된 변이 정보 시각화 기능 샘플 별 유전자 변이 정보가 조회 되며, 해당... 238
〈그림 138〉 유전자간 Co-expression 분석 결과 화면 예시 조회한 유전자와 등록된 유전자간의 발현... 239
〈그림 139〉 Enrichment 분석 결과 예시 (1) mutation 정보에 대한 enrichment 분석 결과. (2) mRNA... 240
〈그림 140〉 유전자 네트워크 분석 예제 241
〈그림 141〉 샘플 수집/배송/검수/분석 프로세스 261
〈그림 142〉 노출정보 분석 결과 활용 프로세스 262
〈그림 143〉 환경설문/증례기록 DB 관리... 262
〈그림 144〉 환경유해인자 노출분석 데이터베이스 ERD 263
〈그림 145〉 환경설문/증례기록 데이터베이스 ERD 263
〈그림 146〉 시스템에 등록한 익스포좀 데이터 현황 2020.10.28 기준 268
〈그림 147〉 시스템 메인 화면 통계 269
〈그림 148〉 시스템 통계, 환경유해물질 현황 270
〈그림 149〉 시스템 통계, 샘플 및 오믹스 데이터 현황 271
〈그림 150〉 시스템 메뉴 구조 271
〈그림 151〉 관리자 시스템 호출 및 로그인 272
〈그림 152〉 사용자 및 아이디 비밀번호 요청 관리 화면 273
〈그림 153〉 표준질병, 일관 및 그룹 코드 관리 화면 273
〈그림 154〉 환경유해물질 참고정보 관리 화면 274
〈그림 155〉 환경유해물질 참고DB ERD 275
〈그림 156〉 환경유해물질 참고DB ERD 276
〈그림 157〉 사용자 가입 및 전용 로그인 277
〈그림 158〉 사용자 ID 및 비밀번호 찾기 요청 278
〈그림 159〉 파일 검증 프로세스 279
〈그림 160〉 파일 검증 모듈 및 등록 결과 280
〈그림 161〉 등록 동의서 양식 정의 281
〈그림 162〉 연구대상자 등록화면 282
〈그림 163〉 연구샘플 등록화면 283
〈그림 164〉 환경 유해성 연구 등록화면 284
〈그림 165〉 환경 유해물질 등록화면 284
〈그림 166〉 CMD 기반의 일괄등록 CLI 287
〈그림 167〉 일괄등록 업무프로세스 289
〈그림 168〉 연구 및 실험정보 표준템플릿 291
〈그림 169〉 오믹스 정보 표준템플릿 292
〈그림 170〉 엑셀템플릿 검증 및 검증결과 293
〈그림 171〉 검증 결과 리포트 294
〈그림 172〉 일괄 등록 결과 295
〈그림 173〉 다차원 분석 기능 데이터 프로세스 296
〈그림 174〉 OREO-MEE-ShinyDB 관계도 297
〈그림 175〉 가시화 전용 DB ERD 298
〈그림 176〉 오믹스 DB 웹포탈 시스템 메뉴 고도화 302
〈그림 177〉 Exposome Navigator GUI 302
〈그림 178〉 Exposome Navigator 검색 결과 303
〈그림 179〉 Exposome Navigator 연관 데이터 검색 결과 304
〈그림 180〉 주성분 분석(PCA) 조회 화면 305
〈그림 181〉 동적가시화 환경, Rshiny 306
〈그림 182〉 PCA 데이터 구조 307
〈그림 183〉 PCA explorer 화면 308
〈그림 184〉 모델 최적화를 위한 파라미터 튜닝 결과(PLDA) 310
〈그림 185〉 모델 최적화를 위한 파라미터 튜닝 결과(SVM) 311
〈그림 186〉 멀티오믹스 데이터 별 전처리 흐름도 313
〈그림 187〉 멀티오믹스 가시화시스템(MEE) 메인 화면 및 데이터 등록 현황 318
〈그림 188〉 멀티오믹스 데이터 가시화 - EnvPrint(SNP, RNA-Seq, 메타 데이터) 조회... 318
〈그림 189〉 멀티오믹스 데이터 가시화-오믹스 간 상관관계 분석(RNA-Seq-MeDIP-Seq) 예시 319
〈그림 190〉 멀티오믹스 데이터 가시화 - Co-expression 분석 예시 319
〈그림 191〉 멀티오믹스 가시화 - Enrichments 분석 예시(RNA-Seq) 320
〈그림 192〉 멀티오믹스 데이터 가시화 - 변이 정보 조회 예시 320
〈그림 193〉 분석에 활용된 샘플들의 클러스터링 결과... 321
〈그림 194〉 수은에 대한 32 개의 차등발현 유전자의 발현 양상 322
〈그림 195〉 환경성 질환 연구를 위한 멀티오믹스 데이터 타입 325
〈그림 196〉 환경성질환 연구를 위한 멀티오믹스 분석 개념도 326
〈그림 197〉 환경성질환 영향 분석 정보관리 통합 플랫폼 논리 ERD 1 335
〈그림 198〉 환경성질환 영향 분석 정보관리 통합 플랫폼 논리 ERD 2 335
〈그림 199〉 환경성질환 영향 분석 정보관리 통합 플랫폼 물리 ERD 1 336
〈그림 200〉 환경성질환 영향 분석 정보관리 통합 플랫폼 물리 ERD 2 336
〈그림 201〉 시스템에 등록한 익스포좀 데이터 현황 2021.12.31 기준 349
〈그림 202〉 환경유해인자 아카이브 및 오믹스 DB 시스템 ERD 350
〈그림 203〉 일괄등록 메뉴 및 주요 기능 351
〈그림 204〉 일괄등록 내 업로드 및 검증 352
〈그림 205〉 일괄등록 내 DB 등록 353
〈그림 206〉 CMD 기반의 일괄등록 CLI 개선 354
〈그림 207〉 연구대상자 히스토리 355
〈그림 208〉 등록 프로세스 고도화(연구대상자 히스토리 추가) 355
〈그림 209〉 히스토리 화면(등록 및 수정) 356
〈그림 210〉 일괄등록 CLI 내 히스토리 일괄등록 추가 357
〈그림 211〉 히스토리 데이터 연결 구조 357
〈그림 212〉 Navigator 데이터 및 표준질환 코드 등록 프로세스 358
〈그림 213〉 표준질환코드 등록 관리 고도화 359
〈그림 214〉 Navigator 데이터 관리(업로드, 등록, 모니터링) 360
〈그림 215〉 오믹스 DB 시스템 study 그룹, 사용자 권한 및 인증 관리 프로세스 360
〈그림 216〉 오믹스 DB 시스템 Study 그룹 관리 361
〈그림 217〉 오믹스 DB 시스템 사용자 권한 관리 362
〈그림 218〉 오믹스 DB 시스템 사용자 승인 관리 362
〈그림 219〉 시스템별 통합 인증 구축 363
〈그림 220〉 EDAS-OREO 통합 인증 프로세스 364
〈그림 221〉 EDAS-MEE 통합 인증 364
〈그림 222〉 통합 검색 API 설계 및 구축 365
〈그림 223〉 통합 검색 API 호출 프로세스 366
〈그림 224〉 EDAS 시스템 내 통합 검색 예시 366
〈그림 225〉 시스템 이전 업무 논의 및 문의 히스토리 367
〈그림 226〉 시스템 운영을 위한 사용자 및 관리자 매뉴얼 작성 368
〈그림 227〉 026_이관 및 유지보수 지원 369
〈그림 228〉 V&V 인증 프로세스 370
〈그림 229〉 V&V 인증 371
〈그림 230〉 오믹스 DB 웹포털 시스템 고도화 372
〈그림 231〉 신규 회원 접속 시 통합인증 372
〈그림 232〉 환경유해물질 Open API 373
〈그림 233〉 대사체 Open API 374
〈그림 234〉 발현체 Open API 374
〈그림 235〉 후성유전체 Open API 375
〈그림 236〉 변이체 Open API 376
〈그림 237〉 Navigator 가시화 개선 377
〈그림 238〉 Navigator 데이터 모델링 377
〈그림 239〉 JBrowse 2.0 378
〈그림 240〉 교차 분석 가시화 379
〈그림 241〉 비대화형 연계지원 프로그램 활용 프로세스 379
〈그림 242〉 오믹스 데이터 전처리 모듈 커맨드 예시(RNA-Seq 데이터 전처리) 380
〈그림 243〉 omic2mee 실행 커맨드 예시 380
〈그림 244〉 mee2shiny 실행 커맨드 예시 381
〈그림 245〉 WES 데이터 전처리 분석 흐름도 382
〈그림 246〉 WES 데이터 전처리 결과 파일 예시 382
〈그림 247〉 오믹스 별 데이터 전처리 프로세스[원문불량;p.381] 383
〈그림 248〉 멀티오믹스 가시화 시스템 메인화면 및 데이터 등록 현황 386
〈그림 249〉 다차원 오믹스 데이터 Env Print 가시화 예시 387
〈그림 250〉 (A) H1299 CdCl vs DW MDS 결과 (B) HepG2 CdCl vs DW MDS 결과... 387
〈그림 251〉 H1299 세포주와 HepG2 세포주 차등 발현 유전자 중 공동 발현되는 유전자에... 390
〈그림 252〉 유전자 발현 데이터와 메틸화 데이터의 상관관계 분석 결과 393
〈그림 253〉 상위 10 개의 enriched pathway 목록 395
〈그림 254〉 Inflammatory mediator regulation of TRP channels(hsa04750) pathway 대사 경로 395
〈그림 255〉 유전자 발현 데이터와 메틸화 데이터의 상관관계 분석 결과 399
〈그림 256〉 구글로 로그인 401
〈그림 257〉 전달 token(예시) 401
〈그림 258〉 OREO 시스템 연계 대상 데이터 402
〈그림 259〉 시스템 데이터 연계 API(예시) 402
〈그림 260〉 통합검색 화면 설계 403
〈그림 261〉 통합검색 디자인 시안 403
〈그림 262〉 통합검색 결과 시스템 구현 403
〈그림 263〉 엑셀 업로드 시 데이터 오류 점검(예시) 404
〈그림 264〉 환경유해인자 물질분석 분석결과 DB 조회 404
〈그림 265〉 개정 양식 반영 405
〈그림 266〉 문항 업로드 양식 고도화 405
〈그림 267〉 환경설문/증례기록 문항 데이터 정제 405
〈그림 268〉 DB화된 환경설문/증례기록 문항 조회 405
〈그림 269〉 환경설문/증례기록 응답 데이터 정제 406
〈그림 270〉 DB화된 환경설문/증례기록 응답 조회 406
〈그림 271〉 연구대상자별 환경성질환관리 406
〈그림 272〉 관리자 시스템 중 연구별사용질환관리 407
〈그림 273〉 화면 수정을 통한 UI/UX 편의성 보완(예시) 407
〈그림 274〉 차트 색상 표준(예시) 408
〈그림 275〉 사용자 매뉴얼 표지 414
〈그림 276〉 사용자 매뉴얼 목차 414
〈그림 277〉 관리자 매뉴얼 표지 414
〈그림 278〉 관리자 매뉴얼 내용 414
〈그림 279〉 운영자 매뉴얼 표지 415
〈그림 280〉 운영자 매뉴얼 목차 415
〈그림 281〉 시범운영을 통해 도출된 버그 및 개선사항 목록 415
〈그림 282〉 시큐어 코딩 점검 S/W(CODE-RAY XG) 416
〈그림 283〉 시큐어 코딩 점검 결과 416
〈그림 284〉 slf4j 브릿지 구조 420
〈그림 285〉 소스코드 내 logback 및 slf4j 이용 420
〈그림 286〉 환경유해인자 익스포좀 및 환경성 질환 오믹스 DB 시스템 구축 421
〈그림 287〉 환경유해인자 노출, 멀티오믹스 원시 및 분석 정보, 설문 및 증례 기반의 환경성 질... 421
〈그림 288〉 환경유해인자 익스포좀 아카이브(OREO) 주요기능 422
〈그림 289〉 환경성질환 오믹스DB 시스템(MEE) 주요 기능 423
〈그림 290〉 분석파이프라인 흐름도 424
〈그림 291〉 분석 가이드라인 문서화 425
〈그림 292〉 환경유해인자 노출정보 데이터베이스(HEX) 주요 기능 426
〈그림 293〉 환경성질환 영향 분석 정보관리 통합 플랫폼(EDAS) 주요 기능 427