1장 하둡과의 만남
1.1 데이터!
1.2 데이터 저장소와 분석
1.3 다른 시스템과의 비교
1.4 하둡의 역사
1.5 아파치 하둡과 하둡 생태계
1.6 하둡 릴리즈
2장 맵리듀스
2.1 기상 데이터셋
2.2 유닉스 도구로 데이터 분석하기
2.3 하둡으로 데이터 분석하기
2.4 분산형으로 확장하기
2.5 하둡 스트리밍
2.6 하둡 파이프
3장 하둡 분산 파일시스템
3.1 HDFS 설계
3.2 HDFS 개념
3.3 명령행 인터페이스
3.4 하둡 파일시스템
3.5 자바 인터페이스
3.6 데이터 흐름
3.7 데이터 이관을 위한 플룸과 스쿱
3.9 하둡 아카이브
4장 하둡 I/O
4.1 데이터 무결성
4.2 압축
4.3 직렬화
4.4 에이브로
4.5 파일 기반 데이터 구조
5장 맵리듀스 프로그래밍
5.1 환경 설정 API
5.2 개발 환경 설정하기
5.3 MRUnit으로 유닛 테스트 작성하기
5.4 로컬에서 실행하기
5.5 클러스터에서 실행하기
5.6 잡 튜닝하기
5.7 맵리듀스 작업 흐름
6장 맵리듀스 작동 방법
6.1 맵리듀스 잡 실행 상세분석
6.2 실패
6.3 잡 스케줄링
6.4 셔플과 정렬
6.5 태스크 실행
7장 맵리듀스 타입과 포맷
7.1 맵리듀스 타입
7.2 입력 포맷
7.3 출력 포맷
8장 맵리듀스 기능
8.1 카운터
8.2 정렬
8.3 조인
8.4 사이드 데이터 분배
8.5 맵리듀스 라이브러리 클래스
9장 하둡 클러스터 설정
9.1 클러스터 명세
9.2 클러스터 설정 및 설치
9.3 SSH 설정
9.4 하둡 환경 설정
9.5 얀 환경 설정
9.6 보안
9.7 하둡 클러스터 벤치마킹
9.8 하둡 클라우드
10장 하둡 관리
10.1 HDFS
10.2 모니터링
10.3 관리
11장 피그
11.1 피그의 설치 및 실행
11.2 예제
11.4 피그 라틴
11.5 사용자 정의 함수
11.6 데이터 처리 연산자
11.7 실전 피그 사용
12장 하이브
12.1 하이브 설치하기
12.2 예제
12.3 하이브 실행하기
12.4 전통적인 데이터베이스와의 비교
12.5 HiveQL
12.6 테이블
12.7 데이터 쿼리하기
12.8 사용자 정의 함수
13장 HBase
13.1 HBasics
13.2 개념
13.3 설치
13.4 클라이언트
13.5 예제
13.6 HBase와 RBMS
13.7 연습
14장 주키퍼
14.1 주키퍼의 설치와 실행
14.2 예제
14.3 주키퍼 서비스
14.4 주키퍼로 응용프로그램 구현하기
14.5 주키퍼 실 서비스
15장 스쿱
15.1 스쿱 얻기
15.2 스쿱 커넥터
15.3 임포트 예제
15.4 생성된 코드
15.5 데이터베이스 임포트: 자세히 살펴보기
15.6 불러온 데이터로 작업하기
15.7 대용량 객체 임포트하기
15.8 익스포트 수행하기
15.9 익스포트: 자세히 살펴보기
16장 사례 연구
16.1 Last.fm의 하둡 사용 사례
16.2 페이스북의 하둡과 하이브
16.3 너치 검색 엔진
16.4 랙스페이스에서의 로그 처리
16.5 캐스케이딩
16.6 아파치 하둡의 테라바이트 정렬
16.7 피그와 우공으로 10억 개 간선 네트워크 그래프 탐색하기
부록A_ 아파치 하둡 설치하기
부록B_ 클라우데라의 하둡 배포판
부록C_ NCDC 기상 데이터의 준비