SPARK CPU-GPU 이기종 환경에서 데이터 암호화를 위한 성능평가 / 임우빈

인명/단체명 검색결과
전체 선택	대표형(전거형, Authority)	생물정보	이형(異形, Variant)	소속	직위	직업	활동분야	주기	서지
연구/단체명을 입력해주세요.

소장자료
공공정책정보
외부기관 자료

학위논문 SPARK CPU-GPU 이기종 환경에서 데이터 암호화를 위한 성능평가

저자명
임우빈
발행사항
서울 : 서강대학교 정보통신대학원, 2022.8
청구기호
TM 004 -22-347
형태사항
v, 31 p. ; 26 cm
자료실 전자자료
제어번호
KDMT12022000045656
주기사항
학위논문(석사) -- 서강대학교 정보통신대학원, 데이터사이언스·인공지능전공, 2022.8. 지도교수: 김영재
연계정보
원문
외부기관 원문

목차보기

표제지

ABSTRACT 8

초록 9

제1장 서론 10

제2장 배경지식 및 관련 연구 14

제1절 Secure Hash Algorithm 2 (SHA-2) 14

제2절 Apache Parquet 16

제3절 Apache Spark 18

제4절 관련 연구 21

제3장 SPARK 혼합 기법 24

제1절 연구 동기 24

제2절 순차 혼합 기법 25

제3절 병렬 혼합 기법 26

제4절 구현 28

제4장 성능평가 29

제1절 실험 환경 29

제2절 성능평가 34

제5장 결론 37

참고문헌 38

표목차

표 1. SHA-256의 기본 특성 비교 14

표 2. Time Load Map 26

표 3. System SPEC 29

표 4. spark-env.sh 설정 값 31

표 5. Test Dataset Schema 31

표 6. Main Test Dataset 31

표 7. 순차 및 병렬 혼합 기법 프로세싱 시간 36

그림목차

그림 1. 개인정보, 가명정보의 설명 및 예시 11

그림 2. SHA-256에서의 워드(W) 블록 구조 15

그림 3. 컬럼 기반과 행 기반의 저장 방식 16

그림 4. Parquet 파일 구조 17

그림 5. Parquet의 Block과 Page 구조 18

그림 6. Spark Cluster Architecture 19

그림 7. Job Executing Procedure 20

그림 8. 순차 혼합 기법 Flowchart 25

그림 9. 병렬 혼합 기법 Flowchart 27

그림 10. 순차 혼합 기법 SPARK-SUBMIT Conf 32

그림 11. 병렬 혼합 기법 SPARK-SUBMIT Conf 32

그림 12. 데이터 암호화 Pseudo Code 33

그림 13. SPARK-CPU, SPARK-GPU에서 데이터 건 수에 따른 프로세싱 시간 비교 35

그림 14. 병렬 혼합 기법과 순차 혼합 기법의 프로세싱 시간 비교 36

초록보기

국내 기업의 구조 중에는 지주사를 중심으로 여러 기업이 하나의 그룹을 이루는 그룹사 형태가 존재한다. 4차 산업 혁명 이후, 그룹사 내에 속한 기업들은 빅데이터에 대한 니즈가 증가하여, 그룹 내 데이터를 활용하기 위해 하나의 데이터 플랫폼으로 통합하고 있는 추세이다. 기업이 관리하는 데이터 중에는 개인정보도 포함되며, 데이터 3법이 개정됨에 따라, 데이터를 통합한 플랫폼에서 서로 다른 기업들의 데이터를 활용하기 위해서는 가명처리 과정이 필수적이다. 실무에서는 대용량 데이터를 처리하기 위해 인메모리 기반의 Apache Spark를 활용하고 있으며, 최근에는 GPU를 활용한 RAPIDS Accelerator for Apache Spark가 개발되어 데이터 처리 속도가 더욱 빨라지게 되었다. 하지만 Apache Spark로 여러 데이터 파일에 대한 암호화 처리를 수행할 때에는 CPU 및 GPU 자원을 적절히 분배하여 활용하는 것이 필요한데, 정립된 분배 방식이 없을 뿐 아니라, 그에 대한 연구도 부족한 실정이다. 본 논문에서는 Apache Spark 수행 전 최적으로 자원을 분배할 수 있는 2가지 기법을 설명하고, 실제 데이터 암호화 처리 업무에 활용하기 위해 해당 기법에 대한 검증을 수행하였다. 그 결과, 본 논문에서 제안하는 병렬 혼합 기법은 SPARK-CPU 대비 22.1%, SPARK-GPU 대비 14.5%, 순차 혼합 기법 대비 7% 연산 효율을 높인 것을 확인하였다.

자료명
저자사항
제어번호
*요청자 이름	회신요청
*전화번호	휴대폰 번호를 입력하세요.
*이메일	@
*요청내용
*오류항목

* 서재명
설명
* 공개수준	비공개 완전공개 * 주의: 국회도서관 이용자 모두에게 공유서재로 서비스 됩니다.

알림톡 발송로 자료명, 기사명/저자명, 수록지명, 자료실, 서가번호, 전화번호로 구성되어 있습니다.




전화번호

연속간행물 상세정보 입니다.
청구기호
자료명/저자사항
발행사항
형태사항
ISSN

다국어입력

상세검색

다국어입력

저자 검색

관련 키워드 검색

주제별 검색

학위논문 SPARK CPU-GPU 이기종 환경에서 데이터 암호화를 위한 성능평가

목차보기

초록보기

추천서가 (다양한 추천 자료를 만나보세요)

MARC 보기

오류 데이터 정정요청

알림톡 발송

권호기사보기

연속간행물 권호 선택

연속간행물 권호 선택

우편복사 안내

도서위치안내(서울관)

저자프로필

목차보기

우편복사 안내

우편복사 목록담기

확인

내서재에 담기

새로운 서재

저장

로그인