본문 바로가기 주메뉴 바로가기
국회도서관 홈으로 정보검색 소장정보 검색

결과 내 검색

동의어 포함

목차보기

목차

맵리듀스 프레임웍 상에서 맵리듀스 함수 호출을 최적화하는 순차 패턴 마이닝 기법 / 김진현 ; 심규석 1

요약 1

ABSTRACT 1

1. 서론 1

2. 기본 개념 2

2.1. 순차 패턴 2

2.2. 프리픽스스팬 2

2.3. 맵리듀스 3

3. 관련 연구 4

4. 맵 리듀스 프레임웍 상에서 맵리듀스 함수호출을 최적화하는 순차 패턴 마이닝 5

4.1. SP_NAIVE 알고리즘 5

4.2. SP_ADVAN 알고리즘 6

5. 실험 결과 7

6. 결론 및 향후 연구 8

참고문헌 8

초록보기

시퀀스(sequence) 데이터가 주어졌을 때 그 중에서 빈번(frequent)한 순차 패턴을 찾는 순차 패턴 마이닝(sequential pattern mining)은 여러

어플리케이션(application)에 사용되는 중요한 데이터마이닝 문제이다. 순차 패턴 마이닝은 웹 접속 패턴, 고객 구매 패턴, 특정 질병의 DNA 시

퀀스를 찾는 등 광범위한 분야에서 사용된다.

본 논문에서는 맵리듀스(MapReduce) 프레임웍 상에서 맵리듀스 함수 호출을 최적화하는 순차 패턴 마이닝 알고리즘을 개발하였다. 이 알고

리즘은 여러 대의 기계에 데이터들을 분산시켜 병렬적으로 빈번한 순차 패턴을 찾는다. 실험적으로 다양한 데이터를 이용하여 파라미터 값을

변화시켜가며 제안된 알고리즘의 성능을 종합적으로 확인하였다. 그리고 실험 결과를 통해 제안된 알고리즘은 기계 수에 대해 선형적인 속도

개선을 보인다는 것을 확인하였다.

Sequential pattern mining that determines frequent patterns appearing in a given set of sequences is an important data mining problem

with broad applications. For example, sequential pattern mining can find the web access patterns, customer's purchase patterns and DNA

sequences related with specific disease.

In this paper, we develop the sequential pattern mining algorithms using MapReduce framework. Our algorithms distribute input data to

several machines and find frequent sequential patterns in parallel. With synthetic data sets, we did a comprehensive performance study

with varying various parameters. Our experimental results show that linear speed up can be achieved through our algorithms with

increasing the number of used machines.

권호기사

권호기사 목록 테이블로 기사명, 저자명, 페이지, 원문, 기사목차 순으로 되어있습니다.
기사명 저자명 페이지 원문 목차
맵리듀스 프레임웍 상에서 맵리듀스 함수 호출을 최적화하는 순차 패턴 마이닝 기법 김진현 ,심규석 pp.81-88

보기
단백질 상호작용 네트워크를 통한 유전체 단위반복변이와 트랜스유전자 발현과의 연관성 분석 박치현 ,안재균 ,윤영미 ,박상현 pp.89-100

보기
스크랩 기능을 지원하는 블로그 공간에서 포스트 랭킹 방안 :알고리즘 및 성능 평가 황원석 ,도영주 ,김상욱 pp.101-110

보기
EPC Network 기반 RFID 응용 시스템의 성능 향상을 위한 EPCIS 주소별 그룹 질의 기법 박성진 ,김대환 ,손민영 ,염근혁 pp.111-122

보기
이기종 모바일 플랫폼에 애플리케이션 이식성 평가 기법 박해윤 ,유해영 pp.123-132

보기
온톨로지 학습에 의한 유사 웹 서비스 오퍼레이션 발견 방법 이용주 pp.133-142

보기
3축 가속도 센서를 이용한 실시간 활동량 모니터링 알고리즘 노형석 ,김윤경 ,조위덕 pp.143-148

보기

참고문헌 (11건) : 자료제공( 네이버학술정보 )

참고문헌 목록에 대한 테이블로 번호, 참고문헌, 국회도서관 소장유무로 구성되어 있습니다.
번호 참고문헌 국회도서관 소장유무
1 J. Dean, S. Ghemawat, “MapReduce: Simplfied Data Processing on Large Clusters,” In Proc. of the 6th OSDI, 2004. 미소장
2 Hadoop, “http://hadoop.apache.org/core/” 미소장
3 J. Pei, J. Han, B. Mortazavi-Asl, H. Pinto. “PrefixSpan: Mining Sequential Patterns Efficiently by Prefix-Projected Pattern Growth,” In Proc. of 17th International Conference on Data Engineering, 2001. 미소장
4 R. Agrawal, R. Srikank, “Mining Sequence Patterns,” In Proc. of International Conference on Data Engineering, 1995. 미소장
5 R. Agrawal, R. Srikant, “Fast Algorithms for Mining Association Rules,” In Proc. of International Conference on Very Large Data Bases, 1994. 미소장
6 R. Agrawal, R. Srikant, “Mining Sequential Patterns: Generalizations and Performance Improvement,” In Proc. of the 5th International Conference on Extending Database Technology, 1996. 미소장
7 J. Wang, J. Han, “BIDE: efficient mining of frequent closed sequences”, In Proc. of the 20th IEEE International Conference on Data Engineering(ICDE), 2004. 미소장
8 X. Yan, J. Han, R. Afshar, “CloSpan: mining closed sequential patterns in large datasets”, In Proc. of the 3rd SIAM International Conference on Data Mining(SDB), 2004. 미소장
9 H. Liu, J. Han, D. Xin, Z. Shao, “Mining interesting patterns from very high dimensional data: a top–down row enumeration approach”, In Proc. of the 6th SIAM International Conference on Data Mining(SDM), 2006. 미소장
10 New approach for the sequential pattern mining of high-dimensional sequence databases 네이버 미소장
11 Illimine, http://illimine.cs.uiuc.edu/ 미소장