본문 바로가기 주메뉴 바로가기
국회도서관 홈으로 정보검색 소장정보 검색

결과 내 검색

동의어 포함

목차보기

목차

빈발 부분그래프 마이닝의 반복 수행에서 중복 연산 제거 기법 / 박기성 ; 한용구 ; 이영구 1

요약 1

Abstract 1

1. 서론 2

2. 관련 연구 2

2.1. gSpan 2

2.2. 반복적인 빈발 부분그래프 마이닝 기법 2

3. 최소 DFS 코드 중복연산 제거 기법 3

3.1. 그래프 정규화 연산 3

3.2. 정규 그래프 탐색 트리 4

3.3. CGS-트리 압축 5

4. 성능평가 6

4.1. 실험 데이터 및 실험의 구성 6

4.2. 실험 결과 6

5. 결론 7

참고문헌 7

[저자소개] 8

초록보기

빈발 부분그래프는 그래프의 고유한 특성을 나타낼 수 있는 유용한 특징으로 그래프의 분류, 군집화, 인덱싱 등에서 사용된다. 최근에 최소 지지도를 변화시켜 가면서 또는 그래프 DB를 분할하며 반복적으로 빈발 부분 그래프를 마이닝 하는 방법이 사용되고 있다. 이와 같은 마이닝 기법들은 수행 시간이 매우 길며, 반복되는 빈발 부분그래프 마이닝이 전체 시간의 대부분을 차지한다. 본 논문에서는 빈발 부분그래프 마이닝의 반복적 실행을 분석하여, 고비용인 그래프 정규화 연산의 중복 실행에 대하여 논한다. 빈발 부분그래프 마이닝이 수행될 때마다 같은 그래프에 대한 불필요한 정규화 연산을 방지하기 위하여, 그래프의 정규 형태를 트리 구조로 인덱싱하는 정규 그래프 탐색 트리를 제안한다. 또한 정규 그래프 탐색 트리를 압축하여 유지비용을 줄이는 방안을 함께 제안하다. 대표적인 반복적 마이닝 기법인 모델 기반 탐색 트리를 통한 실험에서 제안하는 기법이 기존의 방법보다 최대 15%까지 수행시간을 단축함을 보인다.

Frequent subgraphs represent intrinsic property of graphs and they can be used as significant features for various applications such as classification, clustering, and indexing of a graph DB. In order to select useful features, recent graph mining techniques applies repeated mining of frequent subgraphs either by varying minimum supports or by dividing a graph DB recursively. Such mining techniques suffer from long runtime, and most of the runtime is spent for the repeated mining of frequent subgraphs. In this paper, we discuss redundant execution of expensive canonical graph operations through analyzing the repeated mining of frequent subgraphs. We then propose a novel canonical graph search tree for indexing canonical graphs that can reduce redundant canonical graph operations for the same graph. We also propose a compression technique for the canonical graph search tree in order to reduce the maintenance cost of the tree. In experiment, we show that the proposed technique can reduce runtime by up to 15% compared with the existing model based search tree.

권호기사

권호기사 목록 테이블로 기사명, 저자명, 페이지, 원문, 기사목차 순으로 되어있습니다.
기사명 저자명 페이지 원문 목차
SVD와 PARAFAC 분해를 이용한 블로그 공간 분석 김기남, 김상욱, 김진우, Christos Faloutsos, 이준호 pp.159-165

보기
메세지 전달에 기반한 견고한 상품 추천 기법 권순형, 이상철, 김상욱 pp.166-171

보기
빈발 부분그래프 마이닝의 반복 수행에서 중복 연산 제거 기법 박기성, 한용구, 이영구 pp.172-179

보기
초분광영상의 물질탐지를 위한 피라미드 기법 기반 색인 및 K-최근접 질의 알고리즘 유재환, 신정일, 김덕환 pp.180-192

보기
분류 기법을 이용한 방광암 재발 예측 서동혁, 신동문, 손호선, 김원재, 김원태, 류근호 pp.193-201

보기
단백질 상호작용 네트워크 및 유전자 발현값을 이용한 중복 허용 단백질 복합체 탐색 방법 안재균, 여윤구, 윤영미, 박상현 pp.202-209

보기

참고문헌 (7건) : 자료제공( 네이버학술정보 )

참고문헌 목록에 대한 테이블로 번호, 참고문헌, 국회도서관 소장유무로 구성되어 있습니다.
번호 참고문헌 국회도서관 소장유무
1 A. Inokuchi, T. Washio, and H. Motoda, "An apriori-based algorithm for mining frequent substructures from graph data," Proc. of PKDD'OO, pp.13-23, 2000. 미소장
2 M. Kuramochi and G. Karypis, "Frequent subgraph discovery," Proc. of 2002 International Conference on Data Mining, pp.313-320, 2002. 미소장
3 X. Yan and J. Han, "gSpan: Graph-based substructure pattern mining," Proc. of 2002 International Conference on Data Mining, pp.721-724, 2002. 미소장
4 X. Yan, H. Cheng, J. Han, and P. S. Yu, "Mining Significant Graph Patterns by Scalable Leap Search," Proc. of the 14th ACM SIGKDD international conference on Knowledge discovery and data mining, pp.433-444, 2008. 미소장
5 W. Fan, K. Zhang, H. Cheng, J. Gao, X. Yan, J. Han, P. S. Yu, O. Verscheure, "Direct mining of discriminative and essential frequent patterns via model-based search tree," Proc. of the 14th ACM SIGKDD international conference on Knowledge discovery and data mining, pp.230-238, 2008. 미소장
6 PubChem, http://www.ncbi.nlm.nih.gov 미소장
7 Design and analysis of dynamic Huffman codes 네이버 미소장