메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

한빛랩스 - 지식에 가능성을 머지하다 / 강의 콘텐츠 무료로 수강하시고 피드백을 남겨주세요. ▶︎

R 병렬 프로그래밍 : 빅데이터 분석을 위한 R 멀티코어 병렬 처리

리얼타임 eBook

번역서

판매중

  • 저자 : Q. 에덴 맥컬럼 , 스테판 웨스턴
  • 번역 : 이영수
  • 출간 : 2013-06-28
  • 페이지 : 166 쪽
  • ISBN : 9788968486364
  • 초급 초중급 중급 중고급 고급
3.5점 (2명)
좋아요 : 37

R을 제대로 활용하는 방법! R 병렬 프로그래밍


SNS 데이터, 연구자료 등 빅데이터를 분석하고 싶은가? 그럼 분석 도구 중 R을 사용하기를 권한다. R을 써야 하는 이유는 자명하다. 고성능이며 다양한 플랫폼에서 사용할 수 있는데다 오픈 소스로 개발된 통계 소프트웨어다. R은 데이터를 잘 살펴보기 위한 대화형 인터페이스를 갖추고 있으며, 원하는 분석과정을 반복하기 위하여 스크립트 언어처럼 사용할 수도 있다. 게다가 대부분의 통계적인 분석 알고리즘이 내장되어있어 직접 코드를 짜지 않아도 된다. 무엇보다도 R은 공짜다. 만약 기본적으로 제공된 함수들로 충분하지 않다면, 다른 사용자가 만든 수많은 애드온 패키지와 GUI 환경 등을 추가로 다운로드받아 사용할 수 있다. 이런 특징이 R을 빅데이터 시대의 화두로 만들어주었다.

 

하지만 R을 이용한 병렬 프로그래밍 방법을 모른다면, 빅데이터를 분석하기 어려울 것이다. 빅데이터를 분석을 위해서 수십 분 혹은 수 시간을 기다리다 지쳐 쓰러질 수도 있을 것이다. 빅데이터 분석과 같은 분석시간이 많이 걸리는 작업을 하려면, R 병렬 프로그래밍은 선택이 아니라 필수다. 이 책은 R이 무엇인지, 어떻게 사용하는지 알고 있는 독자를 대상으로 R 병렬 프로그래밍 방법을 소개한다. 이 책은 빅데이터 분석과 R 사용 스킬을 업데이트하기 위한 가이드가 되어줄 것이다. 이 책에서 다루는 내용은 다음과 같다. 

  • 1장에서는 R 병렬 프로그래밍을 학습하기 위한 워밍업을 한다.
  • 2장에서는 snow 패키지를 알아본다.
  • 3장에서는 multicore 패키지를 알아본다.
  • 4장에서는 parallel 패키지를 알아본다.
  • 5장~8장에서는 맵리듀스와 하둡에 관해 간략하게 알아본 후, R에서 이를 어떻게 활용하는지를 나머지 장들에서 알아본다.
  • 9장에서는 최근에 개발된 몇 가지 방법들에 대하여 살펴본다.

 


대상 독자

  • 대용량 데이터를 다루는 중급 개발자
  • R을 사용하는 개발자

 

빅데이터 분석을 위한 최고의 분석도구인 R을 병렬로 사용하는 방법!
요즘 빅데이터에 대한 관심은 "어떻게 대용량 데이터를 처리하는가"에서 "무수히 많은 데이터에서 의미 있는 데이터를 어떻게 끌어내는가"로 이동하고 있다. 그래서 데이터 분석이나 통계 관련 기술이 요즘 부각되고 있는데, 그 중 하나가 R이다. R은 오픈 소스 통계분석 엔진으로 다양한 통계 기법과 수치 해석 기법을 지원하며, 패키지를 통해 기능을 확장할 수 있다.
R을 가지고 어떻게 빅데이터를 분석할까? 그 해답은 이 책에 담겨 있다. R을 병렬로 사용하기 위한 패키지를 소개하고 활용 방법을 알려준다. 이를 통하여 데이터 처리 및 분석 작업을 여러 CPU에 분산하거나 여러 기계에 분산함으로써, R의 메모리 한계 문제나 single-thread만을 사용하여 연산속도가 느려지던 문제의 해결할 수 있다. 그리고 R과 하둡을 연계할 수 있는 패키지를 어떻게 사용하고, 어떤 상황에 적합한지 알려준다. 이 도서는 빅데이터 분석을 위한 가이드가 되어 줄 것이다.

Q. 에덴 맥컬럼 저자

Q. 에덴 맥컬럼

Q. 에덴 맥컬럼은 컨설턴트이자 작가이며, 기술 마니아로 오라일리 네트워크와 Java.net의 여러 작업에 참여하였으며, C/C++ Users Journal, Dobb's Journal, Linux Magazine 등에 글을 기고하기도 했습니다. 그는 회사들이 데이터와 기술을 통해 좀 더 나은 선택을 할 수 있도록 돕고 있습니다.

스테판 웨스턴 저자

스테판 웨스턴

스테판 웨스턴은 25년 이상 고성능 병렬 컴퓨팅 분야에서 일해왔습니다. 90년대에 Scientific Computing Associates에 입사하여 데이비드 겔렌더가 개발한 린다 프로그래밍 시스템과 관련한 일을 맡아왔습니다. Revolution Computing, Inc.의 창립자이기도 하며, 이 회사에서는 nws, foreach, doSNOW, doMC 등 R을 이용한 병렬 컴퓨팅 패키지를 개발하고 있습니다. 현재는 예일 대학교에서 고성능 컴퓨팅 전문가로 활동하고 있습니다.

이영수 역자

이영수

초등학교 시절부터 부수고 만드는 게 취미였던 것이 대학으로까지 이어져, 대학에서 전자공학을 전공했다. IBM 국제구매사무소장, 삼성전자 디스플레이 개발팀장, STMicroelectronics 한국지사장 등 갑과 을을 넘나들며 직장 생활을 해왔다. 초등학교 5학년 때 처음으로 '트랜지스터' 라디오를 만들었으며, 대학 실습시간엔 구시대의 '진공관' 라디오를 만드는 아이러니를 겪기도 했다. 지금도 취미가 땜질인, 철이 덜 든 '애어른'이다.

1장. R 병렬 프로그램 시작하기 
1.1 R을 사용하는 이유? 
1.2 R의 한계점? 
1.3 해결 방법: 병렬로 실행하기 
1.4 전반적인 책 내용 
1.5 R 병렬 패키지 훑어보기 
1.6 정리 

 

2장. snow 
2.1 snow 살펴보기 
2.2 snow는 어떻게 동작하는가? 
2.3 snow 설치
2.4 snow 사용하기 
2.5 snow의 장점 
2.6 snow의 단점 
2.7 정리 

 

3장. multicore 
3.1 multicore 훑어보기 
3.2 multicore는 어떻게 동작하는가? 
3.3 multicore 설치 
3.4 multicore 사용하기 
3.5 multicore의 장점 
3.6 multicore의 단점 
3.7 정리 

 

4장. parallel 
4.1 parallel 훑어보기 
4.2 parallel은 어떻게 동작하는가? 
4.3 parallel 설치 
4.4 parallel 사용하기 
4.5 차이점 정리 
4.6 Parallel의 장점 
4.7 parallel의 단점 
4.8 정리 

 

5장. 하둡과 맵리듀스 소개
5.1 하둡 살펴보기 
5.2 맵리듀스 살펴보기 
5.3 맵리듀스처럼 생각하기: 수도 코드 예제 
5.4 하둡으로 이진 파일 또는 파일 전체 다루기 
5.5 클러스터 대신 클라우드를 사용하기 
5.6 정리 

 

6장. R+Hadoop 
6.1 R+Hadoop 훑어보기 
6.2 R+Hadoop은 어떻게 작동하는가? 
6.3 R+Hadoop 설치 
6.4 R+Hadoop 사용하기
6.5 R+Hadoop의 장점 
6.6 R+Hadoop의 단점 
6.7 정리 

 

7장. RHPIE 
7.1 RHPIE 훑어보기 
7.2 RHPIE는 어떻게 동작하는가 
7.3 RHPIE 설치 
7.4 RHPIE 사용하기 
7.5 RHPIE의 장점 
7.6 RHPIE의 단점 
7.7 정리 

 

8장 Segue 
8.1 Seque 훑어보기 
8.2 Seque는 어떻게 동작하는가 
8.3 Seque 설치 
8.4 Seque 사용하기 
8.5 Seque의 장점 
8.6 Seque의 단점 
8.7 정리 

 

9장. 현재 개발 중인 것들 
9.1 doRedis 
9.2 RevoScale R과 RevoConnectR(RHadoop) 
9.3 cloudnumbers.com

우선 이책은 R의 병렬 패키지를 주로 소개 및 사용하는 방법이나 장단점을 알려주는 책입니다.

이 책은 꽤 난이도가 높습니다. 기본적인 R을 다른 루트를 통해서 접하신 후에 읽는 걸 추천합니다.

책에서 다루는 패키지는 총 6개입니다

snow
multicore
parallel
맵리듀스 모델을 이용한 hadoob 그리고 R+Hadoop
PHPIE
Seque

를 다루고 있습니다. 각각의 패키지에 대해서
"훑어보기", "동작 원리", "설치", "사용기", "장단점" 을 잘 설명해주고 있는 책입니다.

이 책의 장점은 R의 병렬 프로그래밍 패키지에 대해 잘 알 수 있다는 점입니다. 각 패키지에 대해서 잘 설명해주고 있고, 차이점 또한 명확하게 알려주고 있습니다. 최근에 개발되고 있는 다른 패키지에 대해서도 설명해주고 있구요. 비슷한 함수들에 대한 성능 비교 또한 포함되어 있습니다.개인적으로 병렬 프로그래밍을 할 때 각 패키지의 차이점을 설명해주는 게 좋았습니다.

이 책의 단점은 조금은 패키지를 설명하는 것에서 머물지 않았나 하는 생각이 들었습니다.패키지를 설명하고, 다음 패키지를 설명하고, 그다음 패키지를 설명하고, 너무 개조식으로 책이 진행되지 않았나 하는 생각이 듭니다.

물론 이 점이 장점도 되지면, 저는 오히려 조금 혼란이 됐습니다. 어떤 패키지를 써야하는거지? 와 같이 말이죠.

제 생각엔 위에 해당하는 패키지 중에서 사용하고 싶은 패키지가 있으면 그 패키지 챕터를 중점으로 참조용으로 보기에 매우 좋은 책 인것 같습니다.

2, 3, 4장에서 각 패키지의 설치 방법과 패키지 내의 함수 효율성에 대해 설명이 되고 있습니다. 이런 것들을 통해 어떤 상황에서 각 패키지를 선택해야 하는 지 알 수 있습니다.

5장은 6~8의 기초가 되는 하둡에 대한 설명과 클라우드, 클러스터 선택의 문제에 대해 다루고 있습니다.

6, 7, 8장에서도 각 방식의 설치 방법부터 예시 코드까지 있어 상황별 쓰임을 설명해주고 있습니다.

상당히 짜임새가 잘 되어있는 책이라고 생각합니다.
다만 이미 R을 알고 있다는 가정하에 쓰인 책입니다.
다른 책을 통해 R을 알고 읽으시면 도움이 될 것입니다.

결제하기
• 문화비 소득공제 가능
• 배송료 : 0원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

리얼타임 eBook 안내

PDF 형식으로 제공되며, 다운로드한 eBook은 PDF 포맷을 지원하는 디바이스 또는 프로그램에서 제한없이 열람할 수 있습니다. 또한 eBook 내의 텍스트 검색 및 인쇄도 가능합니다.

리뷰쓰기

닫기
* 상품명 :
R 병렬 프로그래밍 : 빅데이터 분석을 위한 R 멀티코어 병렬 처리
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
R 병렬 프로그래밍 : 빅데이터 분석을 위한 R 멀티코어 병렬 처리
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
R 병렬 프로그래밍 : 빅데이터 분석을 위한 R 멀티코어 병렬 처리
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실

최근 본 상품1