목차

표제지

목차

Ⅰ. 서론 4

1. 연구 필요성 4

1) 연구 목적 4

2) 연구 내용 4

3) 연구 방법 5

4) 활용 방안 6

2. 관련개념 검토 및 학술연구 동향 7

1) 인공지능 기술의 이해 7

2) 인공지능 관련 주요개념 11

3) 학술연구 동향 14

Ⅱ. 데이터 분석 및 생성형 AI 활용의 해외사례 16

1. 해외 국회도서관의 외국 정책자료 데이터 분석 사례 16

1) 미국 16

2) 유럽연합 17

3) 일본 18

4) 영국 19

5) 호주 19

6) 캐나다 22

2. 해외의 생성형 인공지능 모델을 중심으로 한 서비스 사례 22

1) 미국 22

2) 유럽연합 25

3) 일본 31

4) 영국 32

5) 호주 34

6) 캐나다 38

Ⅲ. 외국 정책자료 활용 서비스 방안 제시 40

1. 국회도서관 자료 유형 구분 40

2. 국회도서관 공공 데이터 활용 41

1) 분류체계 개발 41

2) 분석 방법 개발 44

3. 모범사례: 빅카인즈(BigKinds) 65

1) 빅카인즈 분석 용례 65

2)/3) 서비스 제공 UI 및 환류(feedback) 방안 70

Ⅳ. 생성형 인공지능 활용 서비스 도입 방안 72

1. LLM의 특성과 부상 배경 72

2. 데이터 특성별 LLM 유형의 적합성 74

1) 〈1-영역〉 퍼블릭 데이터와 퍼블릭 LLM 78

2) 〈2-영역〉 프라이빗 데이터와 퍼블릭 LLM 81

3) 〈3-영역〉 퍼블릭 데이터와 프라이빗 LLM 84

4) 〈4-영역〉 프라이빗 데이터와 프라이빗 LLM 85

3. 국회도서관이 고려할 LLM의 유형과 운용 87

1) LLM 서비스의 복합적 도입 필요성 87

2) LLM 서비스의 네 가지 모델 93

3) LLM 모델 도입의 세 가지 경로 100

4. LLM 서비스 도입 시 고려할 사항 103

1) 국회도서관 보유 데이터의 유용성에 대한 고려 103

2) 국내 LLM 생태계 구축의 필요성에 대한 고려 106

3) 할루시네이션 문제에 대한 고려 108

Ⅴ. 결론: 정책제언 110

참고문헌 114

[표 1-1] 주요 기업별 거대언어모델 출시 현황 10

[표 1-2] 챗GPT와 기존 검색엔진의 차이점 11

[표 2-1] 프랑스 국립도서관 인공지능 로드맵 2021-2026의 연도별 세부 계획 28

[표 3-1] 국회도서관 자료 구분 및 유형별 분류체계ㆍ분석 방법ㆍ서비스 방법 개발 필요성 40

[표 4-1] Public LLM과 Private LLM의 특징 76

[표 4-2] 데이터 특성별 LLM 유형의 적합성 77

[표 4-3] 퍼블릭 LLM과 프라이빗 LLM의 장단점 비교 90

[표 4-4] 프라이빗 LLM 용어 설명 93

[그림 1-1] 2010년대 이후 인공지능 기술의 역사적 사건 9

[그림 1-2] 매개변수(파라미터)의 작동 원리 12

[그림 2-1] 프로젝트 헬릭스 개요 25

[그림 2-2] 프랑스 국립도서관 인공지능 로드맵 2021-2026 29

[그림 3-1] 국회도서관 국외 현안 리포트 발간 현황 43

[그림 3-2] 미국 의회 조사 서비스(CRS)의 검색창 44

[그림 3-3] 데이터 분석 예시: 뉴스 소스별 기사 수 분석 46

[그림 3-4] 데이터 분석 예시: 총 뉴스 기사 수: 2021.12-2022.11 46

[그림 3-5] 주제별 정보의 단순통계량 47

[그림 3-6] 오늘의 기사에 대한 워드 클라우드 분석과 주제 분류 48

[그림 3-7] 특별기획 리포트 48

[그림 3-8] 국제뉴스에 대한 제로샷 토픽 분석 1 50

[그림 3-9] 국제뉴스에 대한 제로샷 토픽 분석 2 50

[그림 3-10] 2022년 분기별 토픽 분석 51

[그림 3-11] 2022년 분기별 토픽분석: 미중경쟁 관련 내용만 추출 52

[그림 3-12]/[그림 3-11] 월별 명사 단어빈도-역문서빈도 54

[그림 3-13]/[그림 3-12] 워드 클라우드 예시 55

[그림 3-14]/[그림 3-13] 펠로시 방문 전 2022.8 57

[그림 3-15]/[그림 3-14] 펠로시 방문 후 57

[그림 3-16]/[그림 3-15] 국제정치 주요 국가 등장 빈도 타임라인 분석 58

[그림 3-17]/[그림 3-16] 단어 출현 타임라인 분석 응용 예시 1 59

[그림 3-18]/[그림 3-17] 단어 출현 타임라인 분석 응용 예시 2 60

[그림 3-19]/[그림 3-18] 단어 출현 타임라인 분석 응용 예시 3 61

[그림 3-20]/[그림 3-19] 단어 출현 타임라인 분석 응용 예시 4 62

[그림 3-21]/[그림 3-20] 러시아 관련 빈도수가 높은 검색어들의 네트워크 시각화 63

[그림 3-22]/[그림 3-21] 동시 등장 네트워크 분석 예시 64

[그림 3-23]/[그림 3-22] 빅카인즈 분석 서비스의 구조 65

[그림 3-24]/[그림 3-23] 텍스트 입력 기반 분석 결과 리얼타임 제공 66

[그림 3-25]/[그림 3-24] 텍스트 형태소 분석 결과와 다운로드 기능 제공 67

[그림 3-26]/[그림 3-25] 텍스트 분석 결과 시각화 기능 제공 68

[그림 3-27]/[그림 3-26] 검색어를 통한 대용량 텍스트 분석 기능 제공 69

[그림 3-28]/[그림 3-27] 고빈도 사용 명사 추출: 데이터, API, 추천데이터 제공 70

[그림 3-29]/[그림 3-28] 활용 사례에 대한 추적 및 확인 71

[그림 3-30]/[그림 3-29] 활용 사례 71

[그림 4-1] LLM의 태스크 수행 구조 특성 72

[그림 4-2] 두 가지 서비스의 비교: 퍼블릭 데이터 + 퍼블릭 LLM vs. 프라이빗 데이터 + 프라이빗 LLM 91

[그림 4-3] LLM학습과 LLM 애플리케이션의 이해 92

[그림 4-4] 프라이빗 LLM과 LLM 애플리케이션의 상호보완적 성격 92

[그림 4-5] 프라이빗 LLM 모델링 단계 93

[그림 4-6] 프로젝트 플루토의 Tickerbell 서비스 사례 96

[그림 4-7] 보험 관련 서비스의 사례 99

[그림 5-1] 프라이빗 LLM 모델링 단계 112