권호기사보기
| 기사명 | 저자명 | 페이지 | 원문 | 기사목차 |
|---|
결과 내 검색
동의어 포함
본 논문은 현대 데이터 주도 환경에서 인간 중심의 개인정보 보호 요구를 해결하기 위해 고품질 합성 데이터의 통제된 생성을 목표로 하며, 트랜스포머 기반 생성적 적대 신경망을 활용한 새로운 개인정보 보호 합성 텍스트 생성 프레임워크를 제안한다. 제안된 프레임워크에서 생성자는 사용자가 정의한 프라이버시 선호도를 반영하는 구조화된 프롬프트의 안내에 따라 유창하고 도메인 정렬된 텍스트를 생성한다. 다중 작업 판별자는 생성된 각 샘플을 사실성, 도메인 적합성, 민감 정보 포함 여부라는 세 가지 핵심 기준으로 평가한다. 또한 생성 성능을 한층 강화하기 위해, 본 연구는 판별자의 피드백에 기반하여 입력 프롬프트를 반복적으로 개선하는 비모수적 피드백 루프를 도입하였다. 광범위한 실험 결과, 제안된 방법론은 우수한 텍스트 품질과 강력한 개인정보 보호를 동시에 달성함을 입증하며, 이는 개인정보에 민감한 도메인에서 대규모 언어 모델의 미세 조정을 위해 즉시 활용 가능한 온디맨드 합성 데이터셋 생성을 가능하게 한다.
Controlled generation of high-quality synthetic data is essential in the modern data-driven world, particularly when addressing human-centered privacy concerns. In this study, we propose a privacy-preserving synthetic text generation framework based on transformer-based generative adversarial networks (GANs). The generator produces fluent, domain-aligned text guided by structured prompts that incorporate human-defined privacy preferences. A multi-task discriminator evaluates each generated sample in three ways: realism, domain appropriateness, and presence of sensitive information. To further enhance the generation process, we introduce a non-parametric feedback loop that iteratively refines the input prompt based on discriminator feedback. Experimental results demonstrate that our method achieves high text quality and strong privacy preservation, enabling on-demand generation of synthetic datasets suitable for fine-tuning large language models in privacy-sensitive domains*표시는 필수 입력사항입니다.
| 전화번호 |
|---|
| 기사명 | 저자명 | 페이지 | 원문 | 기사목차 |
|---|
| 번호 | 발행일자 | 권호명 | 제본정보 | 자료실 | 원문 | 신청 페이지 |
|---|
도서위치안내: 정기간행물실(524호) / 서가번호: 국내09
2021년 이전 정기간행물은 온라인 신청(원문 구축 자료는 원문 이용)
우편복사 목록담기를 완료하였습니다.
*표시는 필수 입력사항입니다.
저장 되었습니다.