부록: 1. 용어정리 ; 2. DBMS로부터 데이터 불러오는 방법 ; 3. 여러 개의 파일로 구성되어 있는 데이터를 CSV 파일로 결합하는 방법 외
연계정보
외부기관 원문
목차보기
Chapter 01. 머신러닝 자동화와 WiseProphet 1.1 디지털 시대 1.2 디지털 플랫폼 정부 1.2.1 디지털 플랫폼 정부 개념 1.2.2 데이터 기반 행정 1.3 데이터 분석 진입장벽 1.4 머신러닝 자동화 1.4.1 머신러닝 자동화 개요와 기술 동향 1.4.2 머신러닝 자동화의 효과와 도입 접근 방법 1.5 WiseProphet 1.5.1 ㈜위세아이텍의 머신러닝 프로젝트 솔루션 1.5.2 머신러닝 자동화(Auto ML) 솔루션 WiseProphet 1.6 실습 방법 구성
Chapter 02. WiseProphet 처리 단계와 주요 기능 2.1 WiseProphet 데이터 분석 처리 단계 2.2 Kaggle에서 데이터 준비 2.3 WiseProphet 주요 기능 2.3.1 WiseProphet 데이터 로딩 2.3.2 데이터 탐색 및 데이터 전처리 2.3.3 특징 선택 및 알고리즘 선택 2.3.4 모델 실행 결과 분석 2.3.5 모델 관리 및 활용 Chapter 03. 머신러닝의 이해와 WiseProphet를 이용한 데이터 분석 3.1 WiseProphet 분류 모델 활용 3.1.1 WiseProphet 분류 알고리즘 3.1.2 개인 금용 신용 위험 예측 실습(Credit Risk Prediction) 3.1.3 직원 퇴사 여부 예측 실습(HR Attrition Prediction) 3.1.4 유효수명을 이용한 엔진 고장 유무 예측 실습(NASA Turbofan Engine RUL Prediction Maintenance) 3.1.5 MNIST 숫자 손글씨 인식 실습 3.2 WiseProphet 회귀 모델 활용 3.2.1 WiseProphet 회귀 알고리즘 3.2.2 차량 보험 고객의 생애가치 예측 실습(Cusomer Lifetime Value Anlysis) 3.2.3 부동산 가격 예측 실습(Real-state Price Analysis) 3.2.4 K-야구 데이터를 이용한 선수 성적 예측 3.2.5 Kaggle 아마존 주가 예측 3.2.6 공공 데이터(지역별 환경 데이터)를 이용한 지역별 시간대별 미세먼지농도 예측 3.3 WiseProphet 군집 모델 활용 3.3.1 WiseProphet 군집 알고리즘 3.3.2 온라인쇼핑 고객의 군집화와 특징 분석 실습(Online Commerce Customer Clustering) 3.3.3 온라인쇼핑 고객의 군집화와 특징 분석 실습(Advertise Conversion Data)
부록 부록 1 용어정리 부록 2 DBMS로부터 데이터 불러오는 방법 부록 3 여러 개의 파일로 구성되어 있는 데이터를 CSV 파일로 결합하는 방법 부록 4 WiseProphet를 위한 이미지 파일(JPG)의 CSV 변환방법 부록 5 다양한 데이터 형식을 CSV 파일로 변환하는 방법 부록 6 WiseProphet를 이용한 AI 분석 모델 개발 사례 부록 7 WiseProphet를 이용한 비정형 데이터의 AI 모델 개발 사례
이용현황보기
코딩없이 클릭만으로 머신러닝 AI 모델 개발하기 : 머신러닝 자동화도구(WiseProphet)를 이용한 데이터 분석 이용현황 표 - 등록번호, 청구기호, 권별정보, 자료실, 이용여부로 구성 되어있습니다.
등록번호
청구기호
권별정보
자료실
이용여부
0002950877
006.31 -23-1
서울관 서고(열람신청 후 1층 대출대)
이용가능
0002950878
006.31 -23-1
서울관 서고(열람신청 후 1층 대출대)
이용가능
출판사 책소개
이 책은 코딩을 할 줄은 모르지만 머신러닝과 데이터 분석에 대한 기초개념은 알고 있는 비전문가이더라도 데이터 분석을 스스로 할 수 있는 방법을 제시하고자 집필되었다. 다시 말해 머신러닝 또는 딥러닝의 일부 개념은 알고 있지만 실제로 머신러닝 학습 모델을 개발하는 것은 어렵게 생각하는 사람들을 위하여 ㈜위세아이텍에서 개발한 머신러닝 자동화플랫폼(Auto ML) WiseProphet과 실제 데이터를 사용하여 직접 AI 학습 모델을 개발하는 과정을 상세하게 체험하는 것을 목표로 작성되었다. Auto ML은 AI를 실생활과 다양한 실무업무에 쉽게 활용할 수 있도록 머신러닝 프로젝트에서 코드를 작성하지 않고 마우스 클릭만으로 분석과 데이터 시각화 등이 가능하도록 자동화한 것이다. 그러므로 파이썬 등 코딩을 잘하지 못하고 Radom Forest나 CNN과 같은 알고리즘 원리를 완벽하게 이해하지는 못하더라도 머신러닝 기반 데이터 분석을 할 수 있도록 지원해주는 솔루션이다. 이러한 데이터 분석의 자동화는 데이터 수집 및 처리, 머신러닝 모델 개발, 운영의 3단계에서 번거로운 코딩 작업을 제거할 뿐만 아니라 개발된 모델의 빠른 배포와 공유를 통해 운영의 효율성을 고도화시킬 수가 있다. 또한 머신러닝 기술을 기반으로 모델에서 중요한 특징을 자동적으로 추출하고 모델에서 하이퍼파라미터 최적화 등에 대해 서비스를 지원함으로써 비즈니스 도메인에 대한 전문지식이 있음에도 불구하고 데이터, 머신러닝과 딥러닝에 대한 지식이 부족하여 진입장벽을 느끼던 사용자들이 쉽게 AI를 활용할 수 있게 고안된 방법이라 하겠다. WiseProphet은 Auto ML 플랫폼으로 클라우드 환경에서 별도의 설치 없이 사용이 가능하며 코딩 없이 마우스 사용만으로도 데이터 저장, 데이터 전처리 및 탐색, 자동화 중요 변수 추출, 머신러닝 및 딥러닝 알고리즘(분류, 회귀, 클러스터링)을 사용하여 분석된 결과를 확인하고, 구축된 모델을 저장하여, 배포 및 재사용을 쉽게 할 수 있다. 그러므로 이 책은 Auto ML에 대한 간략한 소개, 이용된 머신러닝 및 딥러닝의 각 알고리즘 특징에 대하여 이론적 설명을 한 후, Kaggle의 실전 데이터를 이용한 데이터 분석 실습을 진행한다. 실습은 WiseProphet에 대하여 전체적인 프로세스인 데이터 탐색 및 전처리, 중요 변수 선택, 알고리즘 선택, 모델 학습, 학습 모델 확인 및 저장의 프로세스를 살펴본 뒤, WiseProphet이 제공하고 있는 알고리즘 유형인 분류, 회귀, 클러스터링 알고리즘에 대하여 살펴본다. 그 후에는 알고리즘 유형별로 10개의 Kaggle 데이터의 분석 목적에 맞추어 WiseProphet를 활용하여 코딩 없이 손쉽게 머신러닝 모델을 도출한다. 이 책은 실제 데이터를 분석한 머신러닝 모델과 모델의 성능을 평가하고 모델의 성능을 개선하는 다양한 시도까지 실습하는 과정을 자세하게 제시하였고, 데이터 분석을 원하는 분들이 데이터 분석에 필요한 CSV 데이터 형식의 파일을 생성하거나 변환시키는 다양한 방법을 제시함으로서 AI 기술 활용에 대한 두려움을 이겨내는 것은 물론 현업 데이터를 가지고 스스로 데이터분석을 할 수 있는 기회를 제공할 것으로 기대된다. 또한 빅데이터를 활용하기를 원하지만 내부적인 기술 부족으로 망설였던 많은 기업도 이번 실습교재를 통해 AI 기반의 머신러닝 분석 모델 코딩도 중요하지만 데이터 기반의 비즈니스 문제해결 능력 배양도 중요하다는 것을 학습하는 좋은 계기가 되기를 희망한다. 끝으로 이 책을 통하여 독자들, 특히 정부 공공관계자분들이 관심을 가지고 있는 현 정부의 디지털 플랫폼 정부, 데이터 기반 행정, 데이터 공유와 데이터를 활용한 정책기획 및 과학적인 의사결정을 위한 데이터 분석 역량 강화에 기여할 수 있기를 소망해본다.
이 책의 사용설명서
1. 누구를 위한 책인가? • 정부 공공기관의 데이터 분석가 및 데이터 기반 행정 전담팀 • 데이터 분석 비전공분야 대학원생 • 머신러닝 기반 캡스톤 프로젝트를 진행하는 고등학생 및 대학생 • 머신러닝을 이용한 데이터 분석을 직접 시도하고자 하는 일반인
2. 실습 및 향후 유용하게 사용할 수 있는 사이트 • http://prophet.wise.co.kr/#/intro : 본 책에서 주로 다루는 WiseProphet를 활용하기 위한 페이지이다. 회원가입하고 로그인하면 10메가 데이터 범위 이내의 데이터 분석을 지원하는 WiseProphet 실습용 버전을 무료로 사용할 수 있다. • https://www.kaggle.com : 캐글(Kaggle)은 2010년 설립된 예측 모델 및 분석 대회 플랫폼으로 기업 및 단체에서 데이터와 해결과제를 제공하고 있다. • https://www.data.go.kr : 공공 데이터 포털은 공공기관이 생성 또는 취득하여 관리하고 있는 공공 데이터를 한 곳에서 제공하는 통합 창구로서 다양한 공공 데이터를 파일 및 API, 시각화 자료 등 다양한 방식으로 제공하고 있다. • https://data.kma.go.kr/cmmn/main.do : 기상 자료 개방 포털로서 대한민국의 기상 자료들이 제공되는 페이지이다. 기상 관련 빅데 이터 분석에 필요한 데이터들을 제공하고 있다. • https://www.nier.go.kr/NIER/kor/openapi/getApiMain.do?menuNo=12006 : 국립환경과학원이 제공하는 기후대기 환경 데이터들이 제공되는 페이지이다. • https://kosis.kr/index/index.do : 국가통계포털로서 국내·국제·북한의 주요 통계를 한 곳에 모아 이용자가 원하는 통계를 한 번에 찾을 수 있도록 통계청이 제공하는 One-Stop 통계 서비스이다. 300여 개 기관이 작성하는 경제·사회·환경에 관한 1,000여 종의 국가승인통계를 수록하고 있으며, 국제금융·경제에 관한 IMF, Worldbank, OECD 등의 최신 통계도 제공하고 있다. • https://dsz.kdata.or.kr/svc/main/main.do : 데이터 안심구역은 일반적으로 공개되지 않는 다양한 분야의 미개방 데이터를 활용할 수있다. 다만 사전 신청 후 오프라인 방문을 통한 이용이 필수적이며, 데이터 반출에는 별도의 절차를 거쳐야 한다. 하지만 민감정보가 포함된 정보와 같이 (의료, 보건 등) 일반적으로 얻을 수 없는 정보들을 찾아볼 수 있다. • https://data.seoul.go.kr : 서울 열린데이터광장은 서울시의 공공 데이터를 민간에 개방하는 사이트이다. 서울시 한정 데이터만 제공하지만 코로나19, 건설공사정보, 골목상권분석정보, 공공서비스예약정보, 공영주차장정보 등 자세하고 다양한 분야의 데이터를 제공하고 있다. • https://bigdata.seoul.go.kr/cnts.do?r_id=P130# : 서울특별시 빅데이터 캠퍼스는 민⋅관⋅산⋅학에서 수집된 원천 데이터를 활용할 수 있는 오프라인 전용 서비스이다. 이용 신청 후 직접 방문을 통해 활용할 수 있다.
3. 효과적인 사용방법 ① 머신러닝 알고리즘에 대한 기초지식이 부족한 분들은 2장과 3장의 알고리즘 설명부분을 먼저 정독한 이후에 원하는 예제를 선택하고 WiseProphet를 이용하여 실습을 통해 직접 모델개발을 진행하면서 모델개발 방법을 체험한다. ② 이미 머신러닝에 대한 기초지식이 있는 분은 바로 WiseProphet를 이용하여 원하는 분류 기법의 첫 번째 예제(3.1.2)를 진행하면서 실습한다. 분류기법의 첫 번째 예제에는 분석 모델의 성능을 개선시키는 다양한 방법들을 예시로 제시하였기 때문에 모든 독자들이 반드시 정독하면서 실습을 해야 되는 부분이다. 마찬가지로 3.2.1과 3.2.6에서는 회귀모델에 대한 성능개선 방법을 제시하였기 때문에 이부분을 필수로 진행하는 것이 효과적이다. ③ 캐글 데이터가 아닌 실무 데이터를 이용하는 것에 관심이 있는 분들과 시계열 데이터 분석에 관심이 있는 분은 data.go.kr에 미세먼지 관련 공공 데이터를 이용하는 실습(3.2.6)을 진행해보는 것을 권한다. ④ 다양한 데이터 확보와 분석 가능한 데이터 변환 작업을 원하는 경우에는 부록을 참고하여 데이터 변환 방법을 체험을 통하여 습득한다.