1장. 스파크 작업 마무리하기- 필요한 컴포넌트 설치- 스파크로 이어지는 분산 컴퓨팅의 역사- 스토리지로 다양한 포멧 활용하기- 모니터링과 계측 이해하기2장. 클러스터 관리- 배경- 스파크 컴포넌트- 스파크 스탠드얼론- 얀- 메소스- 비교3장. 성능 튜닝- 스파크 실행 모델- 파티셔닝- 데이터 셔플- 시리얼라이제이션- 스파크 캐시- 메모리 관리- 공유 변수- 데이터 로컬리티4장. 보안- 아키텍처- ACL- 네트워크 보안- 암호화- 이벤트 로깅- 커베로스- 아파치 센트리5장. 폴트 톨러런스 또는 작업 실행- 스파크 작업의 라이프사이클- 작업 스케줄링- 폴트 톨러런스6장. 스파크의 확장- 데이터 웨어하우징- 머신 러닝- 외부 프레임워크- 향후 과제- 기업 적용 사례