표제지
요약문
ABSTRACT
목차
제1장 서론 16
1.1. 연구의 배경 및 목적 16
1.2. 연구의 방법과 구성 21
제2장 이론적 배경 24
2.1. 빅데이터 시스템 24
2.1.1. 빅데이터 개요 24
2.1.2. 빅데이터 현황 25
2.1.3. 글로벌 및 국내 기업의 빅데이터 도입 및 추진 현황 26
2.1.4. 빅데이터의 정책과 주요국의 활용 현황 29
2.2. OLAP과 데이터웨어하스(Data Warehouse) 29
2.2.1. OLAP과 데이터웨어하우징의 관계 29
2.2.2. 데이터 웨어하우스 30
2.2.3. OLAP 31
2.3. 개인정보보호와 활용 31
2.3.1. 개인정보보호의 개요 31
2.3.2. 개인정보의 종류 및 유형 32
2.3.3. 개인정보 비식별화 34
2.3.4. 개인정보 비식별화 기술 활용 방법 35
제3장 빅데이터 프로토타입시스템 구성 37
3.1. 빅데이터 프로토타입 시스템 개요 37
3.2. 빅데이터 프로토타입 시스템 설계 37
3.3. 빅데이터의 적재방안 41
3.4. 빅데이터 추출 검증 42
3.5. 데이터웨어하우스용 테이블 구성 43
3.6. 데이터 추출을 위한 소스 45
3.7. 샘(sam)파일 도출 결과 46
3.8. OLAP 구성 47
3.9. 빅데이터 프로토타입시스템 연구결과와 시사점 49
제4장 비식별화된 데이터의 재식별화 처리 52
4.1. 개요 52
4.2. 개인정보의 가명처리(Pseudonymization)의 재식별화 52
4.2.1. 1:1 재식별화 53
4.2.2. 1:N 재식별화 54
4.2.3. 랜덤순번 재식별화 55
4.3. 개인정보의 총계처리(Aggregation)의 재식별화 57
4.3.1. 그룹 총계를 통한 재식별화 58
4.3.2. 다중 그룹 총계를 통한 재식별화 59
4.4. 개인정보의 데이터 값 삭제(Data Reduction)의 재식별화 60
4.5. 개인정보의 범주화(Data Suppression)의 재식별화 61
4.6. 개인정보의 데이터 마스킹(Data Masking)의 재식별화 63
4.7. 재식별화의 검증 63
4.7.1. 기본 테이블 구성 63
4.7.2. 1:1 재식별화 64
4.7.3. 1:N 재식별화 67
4.7.4. 랜덤순번 재식별화 68
4.7.5. 그룹 총계를 통한 재식별화 70
4.7.6. 다중 그룹 총계를 통한 재식별화 72
4.7.7. 개인정보의 데이터 값 삭제(Data Reduction)에서 재식별화 73
4.8. 비식별화된데이터의 재식별 했을때의 상승되는 가치 74
4.9. 비식별화된데이터의 재식별화의 연구결과와 시사점 76
제5장 결론 80
5.1. 연구결과(통합) 80
5.2. 연구의 한계점 및 추가 연구과제 80
참고문헌 83
〈표 1-1〉 빅데이터 주요 기술적 영역과 필요기술 요건 18
〈표 2-1〉 빅데이터의 특징과 효과 25
〈표 2-2〉 빅데이터 시장 전망 26
〈표 2-3〉 IT 글로벌 기업의 빅데이터 추진 현황 28
〈표 2-4〉 국내 기업의 빅데이터 추진 현황 29
〈표 2-5〉 데이터 웨어하우스와 OLAP System 비교 30
〈표 2-6〉 정부혁신 지방분권 위원회 개인정보 분류 32
〈표 2-7〉 Ricky J. Weible의 개인정보의 유형과 종류 34
〈표 2-8〉 개인식별 제거요령 35
〈표 2-9〉 비식별화의 주요 기술 및 예제 36
〈표 3-1〉 적재방안과 설명 42
〈표 3-2〉 빅데이터 시스템과의 결과 비교 51
〈표 4-1〉 개인정보의 가명처리 방법 52
〈표 4-2〉 재식별을 위한 매핑 테이블 53
〈표 4-3〉 가명화되어 제공된 데이터 53
〈표 4-4〉 재식별화 된 데이터 54
〈표 4-5〉 재식별을 위한 1:N 매핑 테이블 54
〈표 4-6〉 1:N 가명화되어 제공된 데이터 55
〈표 4-7〉 재식별을 위한 랜덤 매핑 테이블 56
〈표 4-8〉 1:N 가명화되어 제공된 데이터 57
〈표 4-9〉 사용자의 결재정보 58
〈표 4-10〉 결재월별로 총계저리를 한 결재정보 58
〈표 4-11〉 결재월별 및 세대별로 총계저리를 한 결재정보 59
〈표 4-12〉 결재정보 60
〈표 4-13〉 개인정보를 삭제한 결재정보 61
〈표 4-14〉 동영상서비스를 위한 결재정보 62
〈표 4-15〉 범주화(Data Suppression) 처리를 한 결재정보 62
〈표 4-16〉 재식별과 비식별화의 비교 76
〈표 4-17〉 각 재식별화의 비교 및 장단점 79
〈그림 3-1〉 기본적인 시스템 구성도 38
〈그림 3-2〉 빅데이터를 도입했을때의 스트리밍 서비스 구성도 39
〈그림 3-3〉 프로토타입 서비스 구성도 40
〈그림 3-4〉 주요 비정형데이터의 로그파일 형태(예시) 43
〈그림 3-5〉 테이블 구성 44
〈그림 3-6〉 데이터 추출을 위한 소스 45
〈그림 3-7〉 검색어정보, 페이지정보, 로그인정보의 샘파일 적재형태 46
〈그림 3-8〉 OLAP에서 사용하고자 하는 테이블 등록 47
〈그림 3-9〉 OLAP에서 테이블간의 연관 등록 48
〈그림 3-10〉 OLAP에서 확인한 고객별 관심사항 49
〈그림 4-1〉 사용자와 결재정보 테이블의 관계도 63
〈그림 4-2〉 사용자와 결재정보의 데이터 정보 63
〈그림 4-3〉 사용자와 매핑테이블과 결재정보의 관계 64
〈그림 4-4〉 매핑테이블의 데이터 정보 64
〈그림 4-5〉 매핑테이블을 가명화 비식별화한 데이터 65
〈그림 4-6〉 매핑테이블을 비식별화된 데이터의 재식별화 66
〈그림 4-7〉 사용자와 다중매핑테이블과 결재정보의 관계 67
〈그림 4-8〉 다중매핑테이블의 데이터 정보 67
〈그림 4-9〉 다중매핑테이블을 가명화 비식별화한 데이터 67
〈그림 4-10〉 다중매핑테이블의 비식별화된 데이터의 재식별화 68
〈그림 4-11〉 사용자와 랜덤매핑테이블과 결재정보의 관계 69
〈그림 4-12〉 랜덤매핑 생성쿼리와 생성된 정보 69
〈그림 4-13〉 랜덤매핑 생성쿼리와 생성된 정보 69
〈그림 4-14〉 랜덤매핑테이블을 이용하여 재식별화된 데이터 70
〈그림 4-15〉 결재일로 총계처리한 비식별화된 정보 71
〈그림 4-16〉 특정결재일로 재식별화된 정보 71
〈그림 4-17〉 결재월, 세대, 성씨로 총계처리한 비식별화된 정보 72
〈그림 4-18〉 결재월, 세대, 성씨로 재식별화된 정보 72
〈그림 4-19〉 개인정보를 삭제한 데이터 73
〈그림 4-20〉 비식별 데이터로 재식별화된 정보 73