표제지
목차
요약문 9
영문요약문 10
1장. 기획연구의 배경 및 필요성 11
1. 빅 데이터 11
가. 빅 데이터의 정의 11
나. 빅 데이터 시대 11
다. 빅 데이터의 중요성 및 가치 13
라. 기업의 빅 데이터 13
마. 공공 빅 데이터 13
2. 국내 빅 데이터의 현황 14
3. 기획연구의 목표 및 내용 17
가. 목표 17
나. 연구 내용 18
4/3. 국가 빅 데이터 융합연구센터의 필요성 19
2장. 국내외 빅 데이터 동향 분석 20
1. 국내외 대응 현황 20
가. 해외 대응 현황 20
나. 국내 대응 현황 20
2. 외국 정부의 빅 데이터 연구 현황 조사 및 분석 20
가. 미국의 예 21
나. 유럽의 예 24
다. 일본의 예 25
3. 국외 민간 차원의 빅 데이터 활용 26
가. 글로벌 기업의 빅데이터 활용사례(코스닥저널 2012년 5월호 발췌) 26
나. 의료 빅 데이터를 이용한 연구 27
다. 데이터 브로커의 활동 28
4. 국내와 국외의 빅 데이터 추진 전략 간 차이점 30
가. 정치ㆍ사회 30
나. 경제ㆍ경영 32
다. 보건ㆍ의료ㆍ바이오 33
라. 빅 데이터 인력양성 46
3장. 빅 데이터 처리 및 활용 기술 동향 52
1. 하둡과 맵리듀스 52
2. 국내외 빅 데이터 분석 및 처리 기술 53
가. 국내 분석 및 처리 기술 53
나. 국외 분석 및 처리 기술 54
다. 국외 주요 빅 데이터 분석 원천 기술 업체 54
라. 경제ㆍ경영 분야의 빅 데이터 활용 기술 56
마. 정치ㆍ사회 분야의 빅 데이터 활용 기술 57
바. 보건ㆍ의료 분야의 빅 데이터 활용 기술 57
4장. 한국형 빅 데이터 63
1. 국내 빅 데이터 기술 수준 63
2. 빅 데이터에 대한 한국의 한계 64
3. 한국형 빅 데이터가 가진 한계의 극복 66
4. 한국형 데이터 십년지계 67
5장. 융합적 관점의 빅 데이터와 법ㆍ제도적 문제 70
1. 융합적 관점의 빅 데이터 70
가. 배경 70
나. 융합적 관점에서의 빅 데이터 활용 예 71
다. 빅 데이터에 대한 융합적 접근의 세가지 요소 72
라. 빅 데이터에 대한 새로운 융합적 문제해결 방법 73
마. 학제 간 융합 연구 수행을 통한 미래의 빅 데이터의 활용가능성 73
바. 국내 융합연구과 융합교육의 장애 요인 75
사. 국가 빅 데이터 센터를 통한 융합 연구/교육 문제점의 해결 76
아. 융합적 접근에 의한 가치 창출 및 시사점 76
2. 빅 데이터 관련 국내 규제체계 검토 76
가. 빅 데이터 시대의 도래와 관련 법ㆍ제도 76
나. 공공데이터법과 빅 데이터 77
다. 개인정보보호법과 빅 데이터 78
라. 개인정보의 개념 80
마. 익명화의 개념 및 장점 81
바. 익명화의 방법 82
사. 익명화의 한계 및 유용성 84
아. 익명화에 의한 리스크 관리(Risk management) 방법 86
자. 익명화 관련 지침 89
차. 국내 익명화 사례 - 건강보험정보 익명화 연구 91
카. 시사점 93
6장. 국가 빅 데이터 융합 연구센터 94
1. 배경 및 필요성 94
2. 사업 비전 및 목표 94
가. 사업 목표 95
나. 국가 빅 데이터 융합연구센터의 역할 96
다. 국가 빅 데이터 융합연구센터의 운영 96
라. 국가 빅 데이터 클라우드 97
마. 국가 빅 데이터 융합연구센터의 위치 98
3. 인프라 구축 및 기술 연구개발 99
가. 인프라 구축 99
나. 미래형 인프라 기술 연구개발 100
다. 데이터 처리 및 분석 기술 연구개발 101
라. 응용 연구 103
마. 빅 데이터 서비스 개발 연구 105
4. 한국형 빅 데이터 인력양성 방안 107
5. 한국형 빅 데이터 연구센터 설립의 기대효과 110
참고문헌 113
[부록] 통계패키지 SRC-STAT 115
1. 개요 115
2. 주요 특징 116
3. 주요 기능 예제 120
1) 다단계 일반화 선형모형 120
2) 프레일티 모형 127
판권기 131
[표 2-1] 주요국의 빅데이터 추진 전략 및 체계 21
[표 2-2] 데이터 브로커의 정의 28
[표 2-3] 미국의 대표적인 데이터 브로커 업체 29
[표 2-4] 국내외 금융회사 빅 데이터 활용 사례 분석 결과 33
[표 2-5] 북미 빅 데이터 석사과정 개설 주요 대학 47
[표 2-6] 국내 빅 데이터 관련 학과 현황 51
[표 2-7] 빅 데이터 자격증제도 연도별 추진 계획 51
[표 4-1] 빅 데이터 관련 기술 격차 63
[표 4-2] 차세대 초고성능 컴퓨팅 기술 수준 비교 63
[표 6-1] 한국형 빅 데이터 융합연구센터 인프라의 목표 성능 100
[표 6-2] 연도별 빅 데이터 인력양성 계획(안) 108
[그림 1-1] 빅데이터의 3가지 요소 11
[그림 1-2] 빅데이터 시대의 추동 요인 12
[그림 1-3] 전 세계 모든 디지털기기에 저장 가능한 데이터의 양(1인당) 12
[그림 1-4] 미국의 산업별 데이터 저장량 13
[그림 1-5] 한국의 LTE 가입자 수와 1인당 모바일 트래픽 양 14
[그림 1-6] 공공데이터포털시스템 구성도 15
[그림 1-7] 서울 열린데이터광장 15
[그림 1-8] 서울 열린데이터광장 시스템 구성 및 데이터 흐름도 16
[그림 1-9] 국내 빅 데이터 시장 규모 단기 전망 16
[그림 1-10] 국내 빅 데이터 시장 규모 중장기 전망 17
[그림 2-1] 휴먼 커넥톰 프로젝트 홈페이지 23
[그림 2-2] 단백질 데이터 은행 홈페이지 23
[그림 2-3] FuturlCT 의 주요 프로젝트 25
[그림 2-3] 필박스 홈페이지 28
[그림 2-4] 공공데이터포탈 내 OpenAPI를 활용해 개발된 앱 정보 제공 사례 30
[그림 2-5] 미국 행정부의 공공 데이터 개방 홈페이지 31
[그림 2-6] 사이버주치의 정밀 건강관리 시스템 구조(국내외 유헬스 기술 및 시장동향, 생명공학정책연구센터, 2012) 34
[그림 2-7] 개인에 따라 약제의 효과가 다른 이유 및 해결 방안(2013 서울의대 장인진 교수 강의 자료 중) 35
[그림 2-8] 게놈, 트랜스크립톰, 프로테옴, 메타볼롬의 의미 및 상호 관계(2013 서울의대 장인진 교수 강의 자료 중) 35
[그림 2-9] 메타볼로믹스를 이용한 약물 효과 예측의 예(2013 서울의대 장인진 교수 강의 자료 중) 36
[그림 2-10] Digital Korean 홈페이지 37
[그림 2-11] ECG View 홈페이지 38
[그림 2-12] JAMA internal medicine 에 개제된 분당서울대병원의 빅데이터 연구 결과(JAMA intern Med 2013;173(12) : 1145-1146) 38
[그림 2-13] IBM Watson을 활용한 빅데이터 분석을 홍보하는 웰 포인트 홈페이지 39
[그림 2-14] Meta-analysis of genome-wide association 40
[그림 2-15] Dictionary construction and identification of possible adverse drug events in Danish clinical narrative text 41
[그림 2-16] EU의 뇌공학 연구 프로젝트 41
[그림 2-17] 암을 유발하는 구간 연구 42
[그림 2-18] 12 종류의 대표적인 암 간의 유사성 및 차이점(Mutational landscape and significance across 12 major cancer types, 2013, Nature) 43
[그림 2-19] Cell Lines Project 43
[그림 2-20] DNA 손상에 대응한 세포의 반응을 조절하는 피드백 루프 45
[그림 2-21] 빅 데이터 인력 부족 46
[그림 3-1] 하둡 및 맵리듀스 개념도(Image from Presentation of Dr. Ioannis Kontstantinou, CSlab, 2012) 53
[그림 3-2] 오픈 소스 빅 데이터 분석도구 R, Cascading, Scribe 54
[그림 3-3] IBM Watson을 이용한 빅 데이터 활용 도식도 55
[그림 3-4] 오라클 빅 데이터 어플라이언스 개념도(Oracle:Big Data for Enterprise, Oracle, 2013) 55
[그림 3-5] 제스트파이낸스사의 빅 데이터를 활용한 신용평가 모델 적용 사례 56
[그림 3-6] Oracle사와 Agfa HealthCare사의 EHR 솔루션 개념도(Oracle, and Agfa Healthcare, Agfa HealthCare, 2010) 59
[그림 3-7] 삼성 SDS사의 Bioinformatic Service 홈페이지 60
[그림 3-8] KT사의 GenomeCloud 홈페이지 60
[그림 3-9] illumina사의 NGS 어플리케이션 설명 62
[그림 4-1] 빅데이터 선도기업 64
[그림 4-2] 빅 데이터 역량 강화의 선순환 구조와 단절 원인 65
[그림 4-3] 빅데이터 선순환 활성화 방안 66
[그림 4-4] 빅데이터 솔루션과 빅데이터 서비스의 사업 적용 모델 68
[그림 5-1] 리스크 관리 과정 86
[그림 6-1] 국가 빅 데이터 융합연구센터의 비전 및 목표 95
[그림 6-2] 국가 빅 데이터 융합연구 센터의 역할 96
[그림 6-3] 국가 빅 데이터 융합연구센터 조직도 97
[그림 6-4] 국가 빅 데이터 클라우드와 국가 빅 데이터 융합연구센터 97
[그림 6-5] 한국형 빅 데이터를 위해 필요한 요소 및 기대 효과 99
[그림 6-6] 미국 상위 5개 건설 프로젝트 99
[그림 6-7] 미래형 인프라 기술 100
[그림 6-8] 한국형 빅 데이터를 위한 데이터 처리 및 시각화 연구 102
[그림 6-9] 한국형 빅 데이터를 활용한 응용 연구 104
[그림 6-10] 융합에 초점을 둔 교과과정 108
그림 1. SRC-stat의 기본화면 116
그림 2. SRC-stat 에 메뉴로 구성된 통계기법 118
그림 3. SRC-stat을 이용한 통계 분석 118
그림 4. SRC-stat을 이용한 그래프 구현 119
그림 5. SRC-stat 에 구현된 계층적 군집분석 탐색기 119