권호기사보기
| 기사명 | 저자명 | 페이지 | 원문 | 기사목차 |
|---|
결과 내 검색
동의어 포함
오늘날 핵심 비즈니스 데이터는 관계형 데이터베이스에 저장되어 운영된다. 소프트웨어 개발 초기에는 소량의데이터를 기반으로 개발이 이루어지기 때문에 실제 환경의 복잡한 비즈니스 규칙과 패턴을 반영하지 못해 생산성 저하와품질 문제가 발생한다. 이를 해결하기 위해 표 형식의 합성 데이터 생성에 관한 연구가 활발히 진행되고 있으나, 생성된데이터를 관계형 데이터베이스에 적재하는 과정에서는 무결성 검증, 데이터 타입 변환, 참조 무결성 관계 생성 등 많은기술적 노력과 시간이 요구된다. 본 논문에서는 이러한 문제를 해결하기 위해 코딩 없이 데이터 모델을 기반으로 데이터생성 규칙을 정의하고, 이를 통해 실제 데이터와 유사한 특성을 가진 대용량 데이터를 생성하여 관계형 데이터베이스에직접 적재하는 웹 인터페이스 기반의 데이터 생성 도구 ‘DataGen’을 제안한다. TPC-E 벤치마크 기반으로 실험한 결과, 동일한 실행 계획과 9% 이내의 실행 비용 편차를 보였고, 젠슨-섀넌 발산과 바서슈타인 거리로 측정한 결과 데이터분포 유사성 또한 높게 나타나 제안 도구의 유효성을 시사한다.
Today, core business data are predominantly stored and processed in relational databases. In the early stages of software development, only a small amount of limited data was utilized, which often failed to reflect complex business rules and patterns, and resulted in reduced productivity and software quality. Although various studies have explored the generation of tabular synthetic data to address this issue, significant technical effort and time (such as domain integrity validation, converting data types, and establishing referential relationships) are still required to load the generated data into relational databases. To overcome these limitations, this paper proposes DataGen, a web-based data generation tool that allows users to define data generation rules based on data models without coding. The tool generates large volumes of data with characteristics similar to real data and loads them directly into relational databases. Experimental validation using the TPC-E benchmark demonstrated that the same SQL execution plans were produced with a variation in execution cost of less than 9%. Additionally, distribution similarity measured by Jensen-Shannon divergence and Wasserstein distance showed high data distribution similarity to the original data. These results indicate that DataGen can effectively generate high-quality data suitable for realistic development and testing environments.*표시는 필수 입력사항입니다.
| 전화번호 |
|---|
| 기사명 | 저자명 | 페이지 | 원문 | 기사목차 |
|---|
| 번호 | 발행일자 | 권호명 | 제본정보 | 자료실 | 원문 | 신청 페이지 |
|---|
도서위치안내: 정기간행물실(524호) / 서가번호: 국내12
2021년 이전 정기간행물은 온라인 신청(원문 구축 자료는 원문 이용)
우편복사 목록담기를 완료하였습니다.
*표시는 필수 입력사항입니다.
저장 되었습니다.