생몰정보
소속
직위
직업
활동분야
주기
서지
국회도서관 서비스 이용에 대한 안내를 해드립니다.
검색결과 (전체 1건)
원문 있는 자료 (1) 열기
원문 아이콘이 없는 경우 국회도서관 방문 시 책자로 이용 가능
목차보기더보기
표제지
요약
Abstract
목차
제1장 서론 14
1.1. 연구 배경 14
1.2. 연구 목표 16
1.3. 논문의 구성 17
제2장 관련 연구 19
2.1. 데이터 처리 19
2.1.1. 대용량데이터 처리 19
2.1.2. 분산컴퓨팅환경에서 생물정보학 데이터 처리 22
2.1.3. 생물정보학 데이터 처리를 위한 분류기법 23
2.1.4. 최적 임계값 제어기법 25
2.2. 분산컴퓨팅환경에서의 자원관리 28
2.2.1. 분산컴퓨팅환경에서의 자원관리 고려사항 28
2.2.2. 분산컴퓨팅환경에서의 자원관리 방법 32
2.3. 실험 데이터 34
2.3.1. GPCR 데이터 34
2.3.2. GPCR 데이터 전처리 35
2.4. 이상치 감시기법 38
제3장 분산컴퓨팅환경에서 적응형 자원관리 42
3.1. 동적 자원구성을 위한 적응형 자원관리 42
3.1.1. 분산컴퓨팅환경에서 자원관리 고려사항 42
3.2. 동적 자원구성을 위한 적응형 자원관리 방법 44
3.2.1. 참여자원의 적응형 자원관리 구성 48
3.3. 대용량데이터 처리를 위한 자원할당 방법 49
3.4. 자원관리를 위한 시간동기화 관리 53
3.5. 서비스 복구를 위한 시간관리 56
제4장 대용량데이터 처리 58
4.1. 대용량데이터 처리를 위한 분류기법 58
4.2. 혼합형 데이터 분류방법 61
4.3. 데이터 분류 최적화 63
4.3.1. 데이터 분류 임계값 최적화의 필요성 64
4.3.2. 데이터 분류 최적화 알고리즘 66
4.4. 데이터 분류를 위한 이상치 감시기법 71
4.5. 데이터 분류를 위한 패턴검증 75
4.6. 대용량데이터의 분산처리 77
제5장 구현 및 시뮬레이션 78
5.1. 데이터 전처리와 혼합형 데이터 분류 구현 78
데이터 전처리(Data Preprocessing) 79
데이터 분류(Date Classification) 80
임계값 재조정(Threshold Readjustment) 80
5.2. 실험환경 : DEVS W/S 82
STSI(Simulation Time Synchronization Infrastructure) 84
시간서버(Time Server) 84
참여컴포넌트(Joining Component) 84
5.3. 분산컴퓨팅환경에서 3-tier 기반 데이터 처리 설계 84
분류비율 관리자(Classifier Rate Management) 86
에이전트(Agent) 87
데이터 훈련 머신(Data Training Machine) 87
5.4. 대용량데이터 처리환경 모의 설계 87
5.5. 대용량데이터 분류모델 구성 95
제6장 성능 분석 97
6.1. 데이터 분류방법 비교 97
6.2. 분류인식률 및 데이터 처리시간 100
6.3. 데이터 예상 처리시간 비교 102
제7장 실험 및 결과 108
7.1. 실험 1: 데이터 분류인식률 비교 108
7.2. 실험 2: 데이터 분류 시간 111
7.3. 실험 3: 임계값 변화 횟수에 따른 구동 시간 변화 113
7.4. 실험 4: 데이터 분류 서비스클러스터 구성에 따른 생성 메시지 수 115
7.5. 실험 5: 대용량데이터 처리를 위한 자원활용률 117
7.6. 실험 6: 적응형 자원관리기법의 데이터 분류시간 119
7.7. 연구 성과 122
7.7.1. 적응형 자원관리 122
7.7.2. 혼합형 데이터 분류 124
제8장 결론 127
참고문헌 130
[표 4-1] 퍼지집합에 대한 소속도 함수정의 67
[표 6-1] ART1 데이터 분류방법의 장단점 99
[표 6-2] 데이터 분류의 예상 처리시간 비교 107
[표 7-1] 데이터 분류를 위한 자원클러스터 구성에 따른 메시지 수 115
[표 7-2] 서비스자원클러스터 형태에 따른 메시지 수 결과 116
[그림 2-1] 임계값 재조정 방법 27
[그림 2-2] 자원의 생명주기와 상태 값 30
[그림 2-3] GPCR 분류 클래스 35
[그림 2-4] ClustalX 를 이용한 GPCR 데이터 다중정렬 37
[그림 2-5] 전처리에서 데이터 재조정 38
[그림 2-6] 데이터 그룹화를 통한 이상치 감시 40
[그림 3-1] ART1 을 이용한 적응형 자원관리 45
[그림 3-2] 적응형 자원관리기법을 이용한 자원군집 관리 46
[그림 3-3] 서비스 협상모델을 통한 자원의 작업할당 50
[그림 3-4] Bayesian Network 모델에서 자원수요량 예측 전개 51
[그림 3-5] 참여자원 시간 공유를 통한 시간관리의 예 54
[그림 3-6] 시뮬레이션 시간 일관성을 위한 시간동기 스냅샷 56
[그림 3-7] 서비스 복구 방법의 예 57
[그림 4-1] ART1 분류 순서도 60
[그림 4-2] ART1분류 수행방법 61
[그림 4-3] ART1 분류를 위한 분류인식률 및 데이터 처리시간 최적화 63
[그림 4-4] 입력, 출력 매개변수에 대한 멤버십 함수 68
[그림 4-5] 임계값 제어를 위한 퍼지규칙 69
[그림 4-6] 데이터 분류를 위한 이상치 감시방법 73
[그림 4-7] 데이터 분류를 위한 시퀀스 다이어그램 74
[그림 4-8] PNN검증을 이용한 데이터 분류 순서도 76
[그림 5-1] 대용량데이터 처리를 위한 데이터 분류 절차 78
[그림 5-2] ART1 이상치 감시를 위한 슈도코드 80
[그림 5-3] 데이터 패턴의 군집화 81
[그림 5-4] 시뮬레이션 메시지 처리 운영구조 83
[그림 5-5] 분산컴퓨팅 기반 3-tier 데이터 분류 및 구성도 85
[그림 5-6] 분산컴퓨팅 기반 3-tier 데이터 분류 컴포넌트 86
[그림 5-7] 데이터 분류를 위한 데이터 훈련 머신의 시뮬레이션 흐름 89
[그림 5-8] 데이터 처리에서 참여컴포넌트의 상태 전이도 92
[그림 5-9] 데이터 분류 가상화 클러스터 95
[그림 5-10] 데이터 분류 중 참여자원의 상태변화 96
[그림 6-1] ART1 데이터 분류방법 비교 98
[그림 6-2] 데이터 분류에서의 데이터 처리시간 구성 101
[그림 7-1] 데이터 분류인식률 비교 110
[그림 7-2] 데이터 분류기법의 평균 처리시간 112
[그림 7-3] 임계값 변화 횟수에 따른 구동시간 변화 114
[그림 7-4] 데이터 분류를 위한 가용자원활용률 118
[그림 7-5] 자원관리기법의 데이터 처리시간 120
[그림 7-6] 자원관리기법의 데이터 처리시간 비율 121
초록보기 더보기
최근 네트워크와 정보화 기술의 발전으로 인하여 데이터는 점차 대용량화되어 가고 있으며, 이로 인해 대용량데이터를 효율적으로 처리할 수 있는 플랫폼 기술이 요구되고 있다. 기존의 대용량데이터 처리환경은 자원관리를 위한 운영환경과 데이터 처리측면에서 성능, 운영 및 데이터 확장성에 대한 많은 문제가 발생하고 있다. 이를 해결하기 위해 체계적인 자원관리를 지원하는 대규모 클러스터 환경을 기반으로 새로운 시스템들이 서비스 응용에 활용되고 있다. 분산컴퓨팅은 네트워크로 연결된 수많은 이기종의 컴퓨팅자원들로 구성되어 보유자원을 최대한 활용함으로써, 데이터 처리시스템의 수행능력을 향상시키고 대용량데이터를 처리할 수 있다는 장점이 있다. 하지만 복잡한 환경에서 가용자원을 관리하고 작업수행을 위한 최적자원을 선택하는 방법은 난해하므로 이를 해결할 방법이 필요하다.
본 논문에서는 분산컴퓨팅환경에서의 혼합형 데이터 분류 및 적응형 자원관리 시스템을 제안한다. 첫째, 대용량데이터 처리 방법은 대용량데이터 분류문제에 있어, 분류인식률과 데이터 처리시간을 최적화하는 것으로, 데이터 분류기법에서 이상치 감시를 탑재한 혼합형 데이터 분류방법으로 수행된다. 제안하는 방법은 퍼지이론을 통해 처리시간과 분류인식률에 대한 규칙을 적용하여 최적 임계값을 자동적으로 유도한다. 이 방법은 데이터 학습 중 학습데이터로부터 불필요한 데이터를 걸러내고 추출하여 데이터 처리시간을 줄일 수 있다. 둘째, 적응형 자원관리 시스템은 동적인 자원 관리를 통해 참여자원의 역할에 맞는 작업을 할당함으로써, 체계적인 자원관리와 고성능 작업을 수행할 수 있다.
데이터 분류의 성능 평가 방법으로는 데이터 분류기법들의 데이터 처리시간, 자원관리기법들의 자원활용률과 데이터 처리시간을 비교하였다. 데이터 분류실험에서 데이터 처리시간을 측정한 실험은 혼합형 데이터 분류기법이 back-propagation기법보다 43%, SVM(Support Vector Machine)기법보다 53%, ART1(Adaptive Resonance Theory 1)기법보다 12%의 데이터처리 시간을 절약하는 결과를 보였다. 이를 통해 혼합형 데이터 분류기법이 이상치 감시 모듈을 탑재하여 처리시간을 절약하는 효과가 있음을 입증하였다. 그리고 분산컴퓨팅환경에서 자원관리를 통한 자원활용률을 측정한 실험에서 적응형 자원관리기법은 리스트기반 동적 자원관리보다 17%, 응답시간 기반 자원관리보다 12%의 자원활용률을 향상시켰다. 또한 자원관리를 통한 데이터 처리시간을 측정한 실험에서, 적응형 자원관리기법은 리스트기반 동적 자원관리보다 59%, 응답시간 기반자원관리보다 43%의 데이터 처리시간을 절약하였다. 이를 통해 적응형 자원관리기법은 자원의 특성에 맞게 구성된 자원군집에서 자원을 선택하여 역할에 맞는 작업을 수행함으로써, 자원 활용률을 향상시키고 빠른 서비스 처리시간을 제공하는 효과가 있음을 입증하였다.
원문구축 및 2018년 이후 자료는 524호에서 직접 열람하십시요.
도서위치안내: / 서가번호:
우편복사 목록담기를 완료하였습니다.
* 표시는 필수사항 입니다.
* 주의: 국회도서관 이용자 모두에게 공유서재로 서비스 됩니다.
저장 되었습니다.
로그인을 하시려면 아이디와 비밀번호를 입력해주세요. 모바일 간편 열람증으로 입실한 경우 회원가입을 해야합니다.
공용 PC이므로 한번 더 로그인 해 주시기 바랍니다.
아이디 또는 비밀번호를 확인해주세요