본문 바로가기 주메뉴 바로가기
국회도서관 홈으로 정보검색 소장정보 검색

결과 내 검색

동의어 포함

목차보기

목차

중복 데이터 관리 기법을 통한 저장 시스템 성능 개선 / 정호민 ; 고영웅 1

요약 1

Abstract 1

1. 서론 1

2. 관련 연구 2

3. 중복 제거 저장 시스템 설계 3

3.1. 해시 함수(Hash Function) 및 해시 충돌(Hash Collision ) 4

3.2. 해시 데이터 관리 4

3.3. 기존의 중복 제거 알고리즘 분석 5

3.4. 개선된 중복 제거 알고리즘 6

4. 중복 제거 시스템 성능 평가 8

5. 결론 및 향후연구 10

참고문헌 11

초록보기

기존의 전통적인 저장 서버는 중복 데이터 블록에 의해서 저장 공간과 네트워크 대역폭의 낭비가 발생되고 있다. 이와 같은 문제를 해결하기 위하여, 다양한 중복 제거 메커니즘이 제시되었으나, 대부분 Contents-Defined Chunking (CDC) 기법을 사용하는 백업 서버에 한정되었다. 왜냐하면 CDC 기법은 앵커를 사용하여 중복 블록을 쉽게 추적할 수 있기 때문에 파일의 업데이트를 관찰하기 유리한 백업 시스템에서 널리 사용되고 있는 것이다.

본 논문에서는 저장 시스템 성능을 개선하기 위하여, 새로운 중복 제거 메커니즘을 제시하고 있다. 범용적인 중복제거 서버를 구축하기 위한 효율적인 알고리즘에 초점을 맞추고 있으며, 이를 통하여 백업 서버, P2P 서버, FTP 서버와 같은 다양한 시스템에 활용이 가능하게 하는 것을 목표로 한다. 실험 결과 제안한 알고리즘이 중복 영역의 블록을 찾아내는 시간을 최소화하고 효율적으로 저장 시스템을 관리하는 것을 보였다.

Traditional storage server suffers from duplicated data blocks which cause an waste of storage space and network bandwidth. To address this problem, various de-duplication mechanisms are proposed. Especially, lots of works are limited to backup server that exploits Contents-Defined Chunking (CDC). In backup server, duplicated blocks can be easily traced by using Anchor, therefore CDC scheme is widely used for backup server.

In this paper, we propose a new de-duplication mechanism for improving a storage system. We focus on efficient algorithm for supporting general purpose de-duplication server including backup server, P2P server, and FTP server. The key idea is to adapt stride scheme on traditional fixed block duplication checking mechanism. Experimental result shows that the proposed mechanism can minimize computation time for detecting duplicated region of blocks and efficiently manage storage systems.

권호기사

권호기사 목록 테이블로 기사명, 저자명, 페이지, 원문, 기사목차 순으로 되어있습니다.
기사명 저자명 페이지 원문 목차
OpenMP 디렉티브 프로그램의 최초경합 탐지를 위한 도구 강문혜 ;하옥균 ;전용기 pp.1-7

보기
중복 데이터 관리 기법을 통한 저장 시스템 성능 개선 정호민 ;고영웅 pp.8-18

보기
스토리지 클래스 메모리를 활용한 시스템의 신뢰성 향상 김효진 ;노삼혁 pp.19-26

보기
Effective web crawling orderings from graph search techniques Jinil Kim ;YooJin Kwon ;Jin Wook Kim ;Sung-Ryul Kim ;Kunsoo Park pp.27-34

보기
VIT :게스트 운영체제의 실시간성 지원을 위한 타이머 하이퍼콜 박미리 ;홍철호 ;유시환 ;유혁 pp.35-42

보기
캐시 파티션을 이용한 공유 2차 캐시 누설 에너지 관리 기법 강희준 ;김현희 ;김지홍 pp.43-54

보기
태양 에너지 기반 센서 네트워크에서 데이터 저장량을 최대화하기 위한 효율적인 데이터 분배 기법 노동건 pp.55-59

보기

참고문헌 (22건) : 자료제공( 네이버학술정보 )

참고문헌 목록에 대한 테이블로 번호, 참고문헌, 국회도서관 소장유무로 구성되어 있습니다.
번호 참고문헌 국회도서관 소장유무
1 J.S. Robin and C.E. Irvine. Analysis of the Intel Pentium's ability to support a secure virtual machine monitor. In Proceedings of the 9th USENIX Security Symposium, Denver, CO, August 2000. 미소장
2 KyoungSoo Park, Sunghwan Ihm, Mic Bowman, and Vivek S. Pai., "Supporting Practical Content- Addressable Caching with CZIP Compression," In Proceedings of the USENIX Annual Technical Conference, Santa Clara, CA, June 2007. 미소장
3 Chord: A Scalable Peer-to-peer Lookup Service for Internet Applications 네이버 미소장
4 L. P. Cox, C. D. Murray, and B. D. Noble. Pastiche: Making backup cheap and easy. In Proc. 5th USENIX OSDI, Boston, MA, Dec. 2002. 미소장
5 R. L. Rivest, "The MD5 Message Digest Algorithm," Request for Comments(RFC) 1321, Internet Activities Board, 1992. 미소장
6 RFC 3174, "US Secure Hash Algorithm 1 (SHA-1)" 미소장
7 A. Tridgell. Efficient algorithms for sorting and synchronization. PhD thesis, The Austrailian National University, 1999. 미소장
8 plan9 home page, http://plan9.bell-labs.com/plan9/ 미소장
9 QUINLAN, S., AND DORWARD, S. "Venti: a new approach to archival storage," In Proceedings of the 1st USENIX Conference on File and Storage Technologies (FAST), 2002. 미소장
10 Athicha Muthitacharoen, Benjie Chen, and David Mazieres, "A Low-Bandwidth Network File System," In Proceedings of the Symposium on Operating Systems Principles (SOSP'01), pp.174-187, 2001. 미소장
11 M. O. Rabin, "Fingerprinting by random polynomials," Technical Report TR-15-81, Center for Research in Computing Technology, Harvard University, 1981. 미소장
12 Constantine P. Sapuntzakis, Ramesh Chandra, BenPfaff, Jim Chow, Monica S. Lam, and Mendel Rosenblum. Optimizing the Migration of Virtual Computers. In Proceedings of the 5th Symposium on Operating Systems Design and Implementation (OSDI), December 2002. 미소장
13 Improving duplicate elimination in storage systems 네이버 미소장
14 K. Eshghi and H.K. Tang, A Framework for Analyzing and Improving Content-Based Chunking Algorithms. Hewlett-Packard Labs Technical Report TR 2005-30. 미소장
15 Fred Douglis and Arun Iyengar. Application-specific Delta-encoding via Resemblance Detection. In Proceedings of 2003 USENIX Technical Conference, pp.113-126, San Antonio, Texas, USA, 2003. 미소장
16 Purushottam Kulkarni, Fred Douglis, Jason La Voie, and John M. Tracey, "Redundancy Elimination Within Large Collections of Files," In Proceedings of 2004 USENIX Technical Conference, Boston, Massachusetts, USA, 2004. 미소장
17 B. Zhu, K. Li, and H. Patterson, "Avoiding the disk bottleneck in the data domain deduplication file system," in Proceedings of the Seventh USENIX Conference on File and Storage Technologies (FAST), pp.269-282, 2008. 미소장
18 Mark Lillibridge, Kave Eshghi, Deepavali Bhagwat, Vinay Deolalikar, Greg Trezise, and Peter Campbell, "Sparse Indexing, Large Scale, Inline Deduplication Using Sampling and Locality," In Proceedings of the Seventh USENIX Conference on File and Storage Technologies (FAST) 2009, San Francisco, CA. 미소장
19 Jim Gray, Catharine van Ingen, "Empirical Measurements of Disk Failure Rates and Error Rates," Microsoft Research Technical Report MSR-TR- 2005-166, 2005. 미소장
20 centos home page, http://www.centos.org/ 미소장
21 vmware home page, http://www.vmware.com/ 미소장
22 fedoraproject home page, http://www.fedoraproject.org/ 미소장