1장. 빅데이터 생태계의 기술들- 하둡- 데이터 직렬화- 칼럼 기반 스토리지- 메시징 시스템- No SQL- 분산 SQL 쿼리 엔진- 요약 및 정리2장. 스칼라 프로그래밍- 함수형 프로그래밍- 스칼라 기본- 스탠드얼론 스칼라 애플리케이션- 요약 및 정리3장. 스파크 코어- 개요- 고차원 아키텍처- 애플리케이션 실행- 데이터 소스- API- SparkContext- 레이지 오퍼레이션- 캐시- 스파크 잡들- 공유 변수- 요약 및 정리4장. 스파크 쉘을 이용한 대화형 데이터 분석- 시작하기- REPL 명령어- 스칼라 쉘로 스파크 쉘 사용하기- 숫자값 분석- 로그 분석- 요약 및 정리5장. 스파크 애플리케이션 개발- Hello World- 애플리케이션 컴파일 및 실행- 애플리케이션 모니터링- 애플리케이션 디버깅- 요약 및 정리6장. 스파크 스트리밍- 스파크 스트리밍 소개- API- 스파크 스트리밍 애플리케이션- 요약 및 정리7장. 스파크 SQL- 스파크 SQL 소개- 성능- 애플리케이션- API- 내장 함수- UDF와 UDAF- 대화형 분석 예제- 스파크 SQL JDBC 서버를 이용한 대화형 분석- 요약 및 정리8장. 스파크 머신 러닝- 머신 러닝 소개- 스파크 머신 러닝 라이브러리- MLlib 개요- MLlib API- MLlib 애플리케이션 예제- 스파크 ML- 스파크 ML 애플리케이션 예제- 요약 및 정리9장. 스파크 그래프 프로세싱- 그래프 소개- GraphX 소개- GraphX API- 요약 및 정리10장. 클러스터 매니저- 스탠드얼론 클러스터 매니저- 아파치 메소스- 얀- 요약 및 정리11장. 모니터링- 스탠드얼론 클러스터 모니터링- 스파크 애플리케이션 모니터링- 요약 및 정리