1부. 하둡 애플리케이션의 아키텍처 고려사항1장. 하둡 데이터 모델링- 데이터 스토리지 옵션- HDFS 스키마 디자인- HBase 스키마 디자인- 메타데이터 관리- 결론2장. 데이터 이동- 데이터 수집 고려사항- 데이터 수집 옵션- 데이터 추출- 결론3장. 하둡 데이터 프로세싱- 맵리듀스- 스파크- 추상화- 크런치- 캐스케이딩- 하이브- 임팔라- 결론4장. 하둡의 일반적인 프로세싱 패턴들- 패턴: 기본 키를 활용한 중복 레코드의 삭제- 패턴: 윈도잉 분석- 패턴: 시계열 갱신- 결론5장. 하둡 그래프 프로세싱- 그래프란 무엇인가?- 그래프 프로세싱이란 무엇인가?- 분산 시스템에서 그래프를 어떻게 처리 하는가?- 지라프- 그래프X- 어떤 툴을 사용해야 하는가?- 결론6장. 오케스트레이션- 왜 워크플로 오케스트레이션이 필요한가- 스크립팅의 한계- 엔터프라이즈 작업 스케줄러와 하둡- 하둡 에코시스템의 오케스트레이션 프레임워크- 우지 용어- 우지 개요- 우지 워크플로- 워크플로 패턴- 워크플로 파라미터 처리- 클래스 경로 정의- 패턴 스케줄링- 워크플로의 실행- 결론7장. 하둡을 활용한 근접 실시간 프로세싱- 스트림 프로세싱- 아파치 스톰- 트라이던트- 스파크 스트리밍- 플룸 인터셉터- 어떤 툴을 사용할 것인가?- 결론2부. 사례 연구8장. 클릭스트림 분석- 적용 사례 정의- 클립스트림 분석에 하둡 사용하기- 설계 개요- 스토리지- 수집- 처리- 분석- 오케스트레이션- 결론9장. 부정거래 탐지- 끊임없는 개선- 대응 하기- 부정거래 탐지 시스템의 아키텍처 요구사항- 적용 사례 소개- 상위 수준 설계- 클라이언트 아키텍처- 프로파일 저장과 추출- 수집- 근접 실시간과 탐색적 분석- 근접 실시간 프로세싱- 탐색적 분석- 다른 아키텍처는 어떠한가?- 결론10장. 데이터 웨어하우스- 데이터 웨어하우스 구축에 하둡 사용- 적용 사례 정의- OLTP 스키마- 데이터 웨어하우스: 소개와 용어- 하둡으로 데이터 웨어하우스 구축- 상위 수준 설계- 결론