메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

한빛랩스 - 지식에 가능성을 머지하다 / 강의 콘텐츠 무료로 수강하시고 피드백을 남겨주세요. ▶︎

개발자를 위한 필수 수학

기초 수학으로 시작하는 데이터 과학 첫걸음

한빛미디어

번역서

판매중

  • 저자 : 토머스 닐드
  • 번역 : 박해선
  • 출간 : 2024-06-03
  • 페이지 : 352 쪽
  • ISBN : 9791169212502
  • 물류코드 :11250
  • 초급 초중급 중급 중고급 고급
4.9점 (27명)
좋아요 : 28

개발자를 구원하는 실용 수학 안내서

기초 수학부터 회귀 모델, 신경망 그리고 진로 조언까지

 

데이터 과학, 머신러닝, 통계학에서 탁월한 능력을 발휘하는 데 필요한 수학을 이해하고 여러분의 것으로 만들어보세요. 이 책에서는 미적분, 확률, 통계, 선형대수학을 설명하고 선형 회귀, 로지스틱 회귀, 신경망과 같은 기술에 수학이 어떻게 적용되는지 안내합니다. 그 과정에서 데이터 과학의 현황과 통찰력을 깨우쳐 여러분의 가치를 극대화하는 방법과 실용적인 인사이트도 얻을 수 있습니다.

 

토머스 닐드 저자

토머스 닐드

닐드 컨설팅 그룹(Nield Consulting Group)의 설립자이자 오라일리 미디어와 서던 캘리포니아 대학교의 강사입니다. 기술 콘텐츠에 익숙하지 않거나 두려움을 느끼는 사람들이 공감할 수 있는 콘텐츠를 만드는 것을 즐깁니다. 정기적으로 데이터 분석, 머신러닝, 수학적 최적화, AI 시스템 안전, 실용적인 인공지능에 관해 강의합니다. 두 권의 책, 『Getting Started with SQL』(오라일리, 2016)과 『Learning RxJava』(팩트, 2020)를 저술했습니다. 또한 비행 시뮬레이션 및 무인 항공기를 위한 범용 핸드헬드 컨트롤을 개발하는 회사인 Yawman Flight의 설립자이자 발명가이기도 합니다.

박해선 역자

박해선

기계공학을 전공했지만 졸업 후엔 줄곧 코드를 읽고 쓰는 일을 했습니다. 블로그(tensorflow.blog)에 글을 쓰고 머신러닝과 딥러닝에 관한 책을 집필, 번역하면서 소프트웨어와 과학의 경계를 흥미롭게 탐험하고 있습니다.

『챗GPT로 대화하는 기술』(한빛미디어, 2023), 『혼자 공부하는 데이터 분석 with 파이썬』(한빛미디어, 2023), 『혼자 공부하는 머신러닝+딥러닝』(한빛미디어, 2020), 『Do it! 딥러닝 입문』(이지스퍼블리싱, 2019)을 집필했습니다.

『실무로 통하는 ML 문제 해결 with 파이썬』(한빛미디어, 2024), 『머신러닝 교과서: 파이토치 편』(길벗, 2023), 『스티븐 울프럼의 챗GPT 강의』(한빛미디어, 2023), 『핸즈온 머신러닝(3판)』(한빛미디어, 2023), 『만들면서 배우는 생성 AI』(한빛미디어, 2023), 『코딩 뇌를 깨우는 파이썬』(한빛미디어, 2023), 『트랜스포머를 활용한 자연어 처리』(한빛미디어, 2022), 『케라스 창시자에게 배우는 딥러닝 2판』(길벗, 2022), 『개발자를 위한 머신러닝&딥러닝』(한빛미디어, 2022), 『XGBoost와 사이킷런을 활용한 그레이디언트 부스팅』(한빛미디어, 2022), 『구글 브레인 팀에게 배우는 딥러닝 with TensorFlow.js』(길벗, 2022), 『파이썬 라이브러리를 활용한 머신러닝(번역개정2판)』(한빛미디어, 2022), 『머신러닝 파워드 애플리케이션』(한빛미디어, 2021), 『머신 러닝 교과서 with 파이썬, 사이킷런, 텐서플로(개정3판)』(길벗,2021)를 포함하여 여러 권의 책을 우리말로 옮겼습니다.

 

1장 기초 수학과 미적분
_1.1 정수론
_1.2 연산 순서
_1.3 변수
_1.4 함수
_1.5 합계
_1.6 거듭제곱
_1.7 로그
_1.8 오일러 수와 자연로그
_1.9 극한
_1.10 미분
_1.11 적분
_1.12 마치며

 

2장 확률
_2.1 확률 이해하기
_2.2 확률 계산
_2.3 이항 분포
_2.4 베타 분포
_2.5 마치며

 

3장 기술 통계와 추론 통계
_3.1 데이터란 무엇인가요?
_3.2 기술 통계와 추론 통계
_3.3 모집단, 표본, 편향
_3.4 기술 통계
_3.5 추론 통계
_3.6 t 분포: 소규모 표본 처리
_3.7 빅 데이터 고려 사항과 텍사스 명사수 오류
_3.8 마치며

 

4장 선형대수학
_4.1 벡터란 무엇인가요?
_4.2 선형 변환
_4.3 행렬 곱셈
_4.4 행렬식
_4.5 특수 행렬
_4.6 연립 방정식과 역행렬
_4.7 고유 벡터와 고윳값
_4.8 마치며

 

5장 선형 회귀
_5.1 기본 선형 회귀
_5.2 잔차와 제곱 오차
_5.3 최적의 직선 찾기
_5.4 과대적합 및 분산
_5.5 확률적 경사 하강법
_5.6 상관 계수
_5.7 통계적 유의성
_5.8 결정 계수
_5.9 추정 표준 오차
_5.10 예측 구간
_5.11 훈련/테스트 분할
_5.12 다중 선형 회귀
_5.13 마치며

 

6장 로지스틱 회귀와 분류
_6.1 로지스틱 회귀 이해하기
_6.2 로지스틱 회귀 수행하기
_6.3 다변수 로지스틱 회귀
_6.4 로그 오즈 이해하기
_6.5 R2
_6.6 p 값
_6.7 훈련/테스트 분할
_6.8 오차 행렬
_6.9 베이즈 정리와 분류
_6.10 ROC 곡선과 AUC
_6.11 클래스 불균형
_6.12 마치며

 

7장 신경망
_7.1 언제 신경망과 딥러닝을 사용할까요?
_7.2 간단한 신경망
_7.3 역전파
_7.4 사이킷런 사용하기
_7.5 신경망과 딥러닝의 한계
_7.6 마치며

 

8장 경력 조언과 앞으로의 진로
_8.1 데이터 과학의 재정의
_8.2 데이터 과학의 간략한 역사
_8.3 나만의 강점 찾기
_8.4 데이터 과학 직무에서 주의해야 할 사항
_8.5 꿈의 직업이 존재하지 않나요?
_8.6 이제 어디로 가야 하나요?
_8.7 마치며

 

부록 A 보충 학습
A.1 심파이로 수학식 표현하기
A.2 밑바닥부터 이항 분포 구현하기
A.3 밑바닥부터 베타 분포 구현하기
A.4 베이즈 정리 유도하기
A.5 밑바닥부터 CDF와 역CDF 구현하기
A.6 e를 사용해 시간 경과에 따른 사건 확률 예측하기
A.7 언덕 오르기와 선형 회귀
A.8 언덕 오르기와 로지스틱 회귀
A.9 선형 계획법에 대한 간략한 소개
A.10 사이킷런을 사용한 MNIST 분류기

 

<별책 부록> 워크북

아마존 선형대수학, 미적분 분야 베스트셀러 
개발자라면 꼭! 짚고 넘어가야 할 수학 개념 101

 

데이터 과학과 머신러닝 세계를 정복하고 싶으신가요? 그 여정의 첫걸음은 바로 수학입니다. 머신러닝의 핵심 원리와 알고리즘은 사실 수학적 개념에 뿌리를 두고 있습니다. 이 책은 미적분, 확률, 통계, 선형대수학의 기초부터 데이터 과학에 적용하는 방법까지 체계적으로 안내합니다. 파이썬을 활용한 실습을 통해 선형 회귀부터 신경망에 이르기까지, 실무에서 수학이 어떻게 녹아드는지를 생생하게 배울 수 있습니다. 데이터 과학자로서의 여정을 시작하는 데 이보다 더 완벽한 안내서는 없습니다. 이 책과 함께 데이터 과학의 무한한 가능성을 탐험해보세요. 탄탄한 수학 개념 이해로 시작하는 데이터 과학 첫걸음, 지금 바로 시작하세요!

 

대상 독자

  • 데이터 과학과 머신러닝에 사용되는 수학 개념과 도구, 알고리즘을 이해하고 싶은 개발자
  • 데이터 분석 실무를 맡고 있는 데이터 엔지니어, 데이터 과학자, 머신러닝 엔지니어, 통계 전문가

 

주요 내용

  • 파이썬 코드와 라이브러리로 살펴보는 기초 수학 개념
  • 기술 통계와 가설 검정으로 p 값과 통계적 유의성 해석하기
  • 선형 회귀, 로지스틱 회귀, 신경망에 수학 개념 적용하기
  • 탄탄한 데이터 과학 경력을 쌓는 방법과 진로 조언
  • 각 장에서 배운 개념을 복습하는 워크북 제공
     

[지은이의 말]
지난 10여 년 동안 일상생활과 업무에 수학과 통계를 적용하는 데 관심이 높아졌습니다. 데이터의 가용성이 증가함에 따라 수학과 통계학이 주류의 관심을 끌고 있으며, 이런 데이터를 이해하기 위해서는 수학, 통계학, 머신러닝이 필요합니다.

 

컴퓨터가 우리보다 더 똑똑하다고 생각하기 쉽지만(그리고 이러한 생각은 종종 마케팅에 활용되기도 합니다), 현실은 그 반대일지 모릅니다. 이러한 오해는 상당히 위험할 수 있습니다. 알고리즘이나 AI가 범죄 판결을 내리거나 자동차 운전을 하는 데 개발자를 포함한 그 누구도 특정 결정에 도달한 이유를 설명할 수 없다면 어떻게 될까요? 설명 가능성은 통계 컴퓨팅과 AI의 차세대 영역입니다. 이는 블랙박스를 열어 그 아래 숨겨진 수학을 끄집어낼 때에만 가능합니다.

 

일상생활에 인터넷에 연결된 기기가 깊숙이 들어와 있기 때문에 우리의 데이터는 수시로, 그리고 대규모로 수집됩니다. 우리는 더 이상 데스크톱이나 노트북 컴퓨터에서만 인터넷을 사용하는 게 아니라, 스마트폰, 자동차, 가정용 기기에서까지 인터넷을 사용합니다. 이런 현상은 지난 20년 동안 미묘한 변화를 가져왔습니다. 데이터가 운영 도구에서 보다 명확한 목적을 위해 수집하고 분석되는 대상으로 진화되었습니다.

 

데이터의 가용성이 증가함에 따라 데이터 과학과 머신러닝은 수요가 많은 직업이 되었습니다. 데이터를 다루는 데 필요한 필수 수학은 확률, 선형대수학, 통계학, 머신러닝과 맞닿아 있습니다. 데이터 과학, 머신러닝 또는 엔지니어링 분야에서 경력을 쌓고 싶다면 이 주제에 대한 이해는 필수입니다. 이 책에서는 여러분이 만나게 될 블랙박스 라이브러리의 내용을 더 잘 이해하는 데 필요한 수학, 미적분, 통계학을 소개합니다.

 

이 책의 목표는 실제 문제에 적용할 수 있는 다양한 수학, 통계, 머신러닝 영역을 여러분에게 소개하는 것입니다. 처음 네 개 장에서는 실용적인 미적분, 확률, 선형대수학, 통계 등 기초 수학 개념을 다룹니다. 마지막 세 개 장에서는 머신러닝을 소개합니다. 머신러닝을 가르치는 궁극적인 목적은 책에서 배운 내용을 모두 통합하고, 블랙박스에 대한 이해를 넘어 머신러닝과 통계 라이브러리를 사용하는 데 있어 실용적인 인사이트를 보여주기 위함입니다.

 

지금 펼친 이 책을 통해 여러분은 전문가가 되거나 박사 학위 수준의 지식을 얻을 수 있는 것은 아닙니다. 필자는 그리스 기호로 가득 찬 수식을 피하고, 그 자리에 일반적인 언어를 사용하려고 최선을 다했습니다. 하지만 이 책을 통해 여러분이 수학과 통계에 대해 조금 더 편안하게 이야기하고, 이 분야를 성공적으로 탐험하는 데 필요한 지식을 얻기를 바랍니다. 저는 성공으로 가는 가장 넓은 길은 한 가지 주제에 대한 깊고 전문적인 지식이 아니라, 여러 주제를 탐구하고 실용적인 지식을 갖추는 것이라고 믿습니다. 이게 바로 이 책의 목표입니다. 여러분은 위험할 수 있을 정도로, 그리고 한때 알기조차 어려웠던 중요한 질문을 던질 수 있을 만큼 배울 것입니다. 그럼 시작해보겠습니다!
- 토머스 닐드

 

[옮긴이의 말]
“인공지능을 공부하려면 수학을 잘 알아야 할까요?”, “머신러닝을 배울 때 수학을 먼저 공부해야 하나요?”와 같은 질문을 참 많이 받습니다. 아이러니하게도 그에 대한 대답은 “네” 또는 “아니요” 모두 가능합니다.

 

머신러닝을 처음 배울 때 수학이 반드시 필요한 것은 아닙니다. 하지만 공부를 계속하다 보면 자연스럽게 수학의 필요성을 느낄 수 있습니다. 반대로 수학을 조금 이해하고 나서 시작하면 머신러닝 모델의 작동 방식을 이해하는 데 훨씬 더 자유롭습니다. 정답이 있는 것이 아니며 자신에게 맞는 공부 방법을 선택하면 됩니다.

 

그간 수학을 실용적으로 잘 설명하는 책을 번역하려고 마음먹었지만 좋은 책이 쉽게 눈에 띄지 않았습니다. 다행히 오라일리에서 나온 이 책은 이런 요구 사항을 딱 채워주었습니다. 벡터에서 머신러닝까지 수학이 어떻게 데이터 분석과 머신러닝에 활용되는지 탐험해볼 수 있어 즐거웠습니다. 모쪼록 독자들도 이 책이 마음에 들기를 바랍니다.
- 박해선
 

인공지능, 데이터 부분을 공부하다보면 빼 놓을 수 없는 부분이 바로 수학이다. 고등학교 시절 문과였고, 어쩌다보니 머신러닝 모델을 개발하고 있는 나에게는 항상 수학이 곤란한 부분이었다. 특히나 대학원에 들어갔는데 1학기 인공지능개론 수업에서 교수님께서 수학 폭탄을 투하하신 이후로, 또 다시 미적분 등 인공지능 분야에서 많이 활용되는 수학 공부에 대한 필요성을 느끼게 되었다. 물론 느끼기만 하고 너무나 방대한 양에 어디서부터 시작해야 할 지 몰라 미뤄두고 있었던 것도 사실이다.

그러던 중 "개발자를 위한 필수 수학"을 읽어 보게 되었다. 제목만 보아도 딱 내게 필요한 내용일 것 같다는 생각이 들었다. 책의 구성을 보니 가장 기초가 되는 정수론부터 시작하여 여러 공식들로 풀어서 설명할 때 나에게 가장 걸림돌이 되던 로그와 미적분도 다룬다. 또한 그 이후를 위한 선형대수학까지 알아보고 이 개념들이 어떻게 데이터 과학에서 응용이 되는지까지 알아볼 수 있다.

물론 이 책에서 필요한 내용 전부를 깊이있게 다루지는 않는다. 하지만 전반적으로 활용가능한 수준을 기반으로 할 수 있는 한 상세하게 설명하고 있어 매우 마음에 들었다.

또한 제일 마음에 들었던 부분은 전제들에 대한 설명이 자세하다는 점이다. 대부분의 이론을 다루는 책들을 보면 알 것이라는 가정하에 생략하는 부분들이 굉장히 많고, 대부분의 사람들은 그런 부분에서 부담감을 느껴 수학 공부를 하차하게 된다. 하지만 "개발자를 위한 필수 수학"은 설명이 정말 친절하고 자세하게 되어 있어 부담없이 시작할 수 있다.

게다가 워크북이 따로 있어서 고등학교 때 수학 공부를 하던 그 느낌대로 앞에서 배운 것들을 적용해볼 수 있다.

전체적으로 정말 친절하게 작성되어 있었던 "개발자를 위한 필수 수학"
당 책을 완독하는 스터디를 열어보고 싶다는 마음이 들 정도로 수학이 걱정되는 나 같은 사람들에게 정말 추천하고 싶은 책이었다.

한빛미디어 < 나는리뷰어다 > 활동을 위해서 책을 제공받아 작성된 서평입니다.

데이터 과학을 공부하는 분들 중 수학의 기본을 많이 잊어버려서 업무/학습 도중에 디테일이 떨어지시는 분들께 좋은 책이라고 생각이 든다. 기본이 탄탄하면 같은 내용을 들어도 이해도가 높고 응용이 쉬워지기 때문에, 평소 부족함 또는 어려움을 느꼈다면 꼭 한번 읽어보기를 권해본다.

개발자를 위한 필수 수학 책을 읽었다. 연습문제와 풀이를 제공하고, 워크북을 별책 부록으로 제공해 줘 읽는데 편리함이 있었다.

 

첫 장에선, 기초 수학을 배우는데 고등학교, 대학교의 기초 수학 내용을 다루고 있다. 다음으론 확률에 대해 다루는데 확률의 여러가지 기본 주제들과 베이즈 정리, 이항 분포, 베타 분포를 다루고 있었다.

 

다음으로 기술 통계와 추론, 선형대수학, 선형 회귀에 대해 다루고 있는데 모두 최근 이슈가 되고 있는 데이터 사이언스와 관련된 수학으로 볼 수 있었다. 통계학은 많은 데이터 기반에 둔 학문이라고 소개하고 있다. 그러나 통계학에는 전문 통계학자일지라도 더불어 맹점이 많다고 소개하고 있다. 이런 부분은 데이터를 다각적으로 분석해 얼마나 신뢰할 수 있을지 결정하는데 여러가지 요소들을 합리적으로 결정해야 하는 점을 시사하고 있지 않나 생각이 들었다. 통계와 가설 검정이다.

 

로지스틱 회귀는 회귀라기 보단 분류에 가까운 방법으로 알고 있는데, 책에서도 분류 알고리즘이라고 소개하고 있었다. 딥러닝의 기초가 되는 알고리즘으로 알고있고 이산형 변수 (이진수 1또는 0) 또는 범주형 (정수)인 출력 변수를 위해 훈련된다. 이 모델은 확률 형태의 연속형 값을 출력하지만 임곗값을 사용해 이산형 값으로 변환할 수 있다.

 

로지스틱 회귀는 아직도 현실에서 상당히 많이 사용되는 것으로 알고 있는데 구현하기 쉽고 딥러닝에 비해 결과에 대한 원인 분석이 쉬우며 이것을 사용하면 많은 머신러닝 문제를 잘 해결할 수 있으며, 다른 유형의 지도 학습보다 실용성과 성능이 뛰어나다고 한다.

 

신경망에 대해서도 다루고 있는데 피드포워드 신경망과 역전파를 통해 MNIST 를 구현하는 것을 다루고 있다.

 

마지막으로 이 책을 통해 앞으로 진로를 생각할 수 있게 구성이 되어있다. 데이터 과학 경력에서 성공하려면 SQL및 프로그래밍 같은 몇 가지 하드 스킬과 전문적 감각을 개발하기 위한 소프트 스킬을 배워야 한다고 쓰여있다. 특히 후자는 데이터 과학이라는 변화무쌍한 직업 분야에서 길을 잃지 않고 보이지 않는 시장의 힘에 휘둘리지 않기 위해 매우 중요하다고 한다.

 

이 글은 한빛미디어로 부터 책을 증정받아 작성되었습니다.

개발자를 위한 필수 수학"은 데이터 과학과 머신러닝에 필요한 수학 개념을 쉽게 설명하며, 실제 애플리케이션에 적용하는 방법을 다룹니다. 선형회귀, 로지스틱 회귀, 신경망 등 다양한 주제를 포괄하며, 데이터 사이언스 커리어에 대한 조언도 제공합니다. 소프트웨어 엔지니어, 데이터 분석가, AI에 관심 있는 분들에게 특히 유용합니다. 수학을 실용적인 차원에서 배우고 싶은 모든 개발자에게 추천합니다.

 

https://dev.sonim1.com/ko/blog/review-essential-math-for-data-science

 

"한빛미디어 <나는 리뷰어다>활동을 위해서 책을 제공받아 작성된 서평입니다."

과거에는 행렬을 포함한 선형대수학을 꼭 공부하지 않아도 될 거란 착각을 했었는데
요즘 선형대수에 대해 드는 생각은 딱 두 가지입니다.

첫째,
선형대수학 강의를 들으시면서 다 같이 입을 모아 말하셨던 건
"여태까지 코드로 꽤 많이 작성해오면서 한 번도 원리를 모르고 사용하고 있었다"
라는 의견이 많았고, 억지로 외우거나 기계식으로 습득한 분들이 꽤 많았습니다.
물론 저 포함..
이번 1학기를 통해 행렬을 배우고 나니 원리를 외울 필요가 없을 정도로
이해가 잘 되고 자연스럽게 응용하고 발전시킬 수 있었습니다.


둘째,
수학적 원리와 코드가 연결되지 않아
오히려 대수학을 배워도 코드상에서 어떻게 연결해야 되는지 모르겠다는 것입니다
(이건 나만 그랬나..)

어짜피 컴퓨터가 계산할껀데 내가 수학을 굳이 알아야되나??????????
라는 생각이 컸는데,
어떻게 수학도 모른 채 데이터 분석가가 되고 싶다고 말하고 다녔는지 민망한 요즘입니다. ㅎㅎ

이제 딴소리는 넣어두고, 책을 훑어보겠습니닷


기초수학과 미적분을 다루는 1장에서는 고등학교 수준의 기초 수학을 복습해주고 있습니다.
정수론부터 연산 순서, 거듭제곱, 오일러 수, 극한, 미분과 적분의 기초 개념을 복습함으로써
이후에 배울 분야에 대한 기초 지식을 깨우고 있습니다.
범위와 수준은 모두 미적분 2의 교과서 정도로 생각하시면 될 것 같아요!


2장은 기초 확률을 다루고 있습니다.
이 역시 고등학교의 확률과 통계 과목에서 배울 수 있는 내용입니다. 
확률의 이해, 확률 계산 방법, 그리고
가장 기초적인 이항분포와 베타분포를 설명하되
간단한 수를 통한 예시로
이항분포와 베타분포를 코드로 표현하는 방법도 자연스럽게 습득하게 됩니다.


3장은 기술 통계와 추론 통계입니다.
개발과 데이터분석에 기초 지식이 있으신 분들이라면 한 번쯤 배웠을 두 가지의 통계 방식이죠
3장에서는 각 통계의 특징과 파이썬에서 그 통계량을 구하는 방법을 배울 수 있습니다
특히 데이터분석에서는 필수적인 t-분포의 개념과,
t분포값이 어떤 것을 의미하는 지 알아야 실제 분석에서 사용할 수 있기에
정말정말~~ 필수적인 내용입니다.

드디어! 4장에서 수학의 꽃 선형대수학이 나왔습니다.
저는 교육과정 상 행렬을 배우지 않았고
학부때도 무슨생각으로 그랬는지 모르겠지만(?)
행렬 계산부터 선형변환, 특수행렬 자체를 한 번에 학습하려니 정말 버거웠습니다...
본 책에서는 계산 자체에 대해 자세하게 다루기 보다는
행렬의 계산 원리와, 실무에서 자주 사용되는
SVM(서포트 벡터 머신), PCA(주성분분석) 등의 분석 방법을
행렬의 개념과 연결지어 이해하고
코드로 풀어나가는 법을 가르쳐주고 있습니다.

개인적으로 강의를 들으며 코드랑 연결짓는 분이 정말 난감하고 어려웠는데
그 부분을 이 "개발자를 위한 필수 수학" 도서 한 권으로 이해하고 보니
생각보다 너무 어렵지 않은 개념이더군요. ㅎ
역시 한 번도 안 해본 것과 한 번 해본 건 학습에서도 차이가 큰 것 같습니다..

5장은 선형 회귀 분석입니다.
회귀 분석에는 선형 회귀 분석과, 로지스틱 회귀 분석이 있는데
기본적으로 가장 큰 차이는
수치형 데이터의 경우 의미 있는 데이터에 대해
선형 회귀 분석을 수행하고,
object형 데이터의 경우 로지스틱 회귀 분석을 진행합니다.
문자열을 가지고 회귀분석을 진행하려면 분석 자체가 불가능하기 때문에
문자열을 수치로 라벨링한 후 분석하는 개념이라고 보시면 될 것 같습니다!
선형회귀의 기본형과 최적의 직선을 찾는 방법,
과적합을 막는 방법, 통계적으로 유의한 계수들에 대한 개념을 알아보고
제일 마지막에는 다중회귀분석까지 훑어보게 됩니다!

선형 회귀 분석을 다뤘다면 로지스틱 회귀 분석도 다뤄야겠죠.
6장에서도 마찬가지로 다변수로 진행하는 로지스틱 회귀,
그리고 로지스틱 회귀 분석 결과값으로 도출되는
R-2(R-sqaured)값, P-값의 의미에 대해 이해하고
관련한 정리인 베이즈 정리에 대해 알아봅니다.
또 로지스틱 회귀 분석에서 빠질 수 없는 ROC, AUC 곡선과
클래스가 불균형한 데이터를 갖고 있을 때 해결 방법에 대해 의논하고 있습니다.


약간의 감동을 받은 8장이었습니다.
저자분께서 개발자와 데이터사이언티스트를 
꿈꾸는 독자들을 위한 가이드를 남겨주셨는데, 
나만의 강점을 찾는 법,
앞으로 데이터사이언스 직무에서 주의해야 할 사항,
앞으로의 비전에 대한 도움말을 담고 있습니다.
저도 학부때 막연하게 앞으로 데이터 사이언티스트로써 
어떻게 나아가야 할 지에 대해 고민이 정말 많았는데
지금은 현업자분들을 많이 만나뵙게 되어 크고 작은 정보들을 많이 얻게 되었어요

비전공자에서 데이터 사이언스, 개발 쪽으로 이직을 생각하시는 분들도 많으실거고
아직 상황이 안되어 주변에서 정보를 얻기 쉽지 않으신 분들이 정말 많으실거라 생각합니다.
그런 분들을 위해 저자분께서 이렇게나마 팁을 남겨주심으로써 도움이 되고자 하셨으니
8장도 꼭 넘어가지 마시고 읽어보셨으면 좋겠습니다!!

데이터 과학과 AI, 머신 러닝 분야에 입문하려는 개발자들뿐만 아니라,

이미 현업에서 활동 중인 전문가들에게도 매우 유용한 참고서가 될 것입니다.

이 책을 통해 데이터 분석과 알고리즘 설계에 필요한 수학적 기초를 탄탄히 다지고,

더욱 높은 수준의 문제 해결 능력을 갖추길 위하는 모든 개발자에게 추천합니다.

수학.

누군가에게는 너무나 어려운 과목이고 누군가에게는 너무나 재미있는 과목이다.

그리고 누군가에게는 꼭 필요한 과목이기도 하다.

그 중에 한 분야가 프로그래밍이며 프로그래밍을 하는 개발자에게는 극복해야될 과목이기에 개발자가 되려는 분들이거나 이미 개발자가 되신 분들이라도 수학적 지식이 더 필요한 분들이라면 수학에 대한 기본적 소양과 응용분야를 익히는데 많은 도움이 될 책이라 생각된다.

제목부터 이 책이 수학 책이란걸 느낄 수 있다.

그리고 수학 책이라 어려울 것이라는 우려감에 미리 걱정하지 마시라는 조언을 전한다. 이 책에서는 학교에서 배웠던 방식과는 다른 방식으로 수학의 기본 개념에 대해 설명한다. 그리고 무엇보다 빈 연습장에 연필을 들고 문제를 풀지 않아도 된다는 것이다. 우리에게는 이 모든 걸 담당할 파이썬이 있으니 말이다.

그저 평소처럼 명령어만 입력하면 되는 것이다.

수학에 등장하는 자연수나 정수, 실수 등 기본적인 단어에 대한 정의를 시작으로 간단한 연산 프로그램밍을 시작으로 미적분처럼 어려웠던 함수에 대한 프로그래밍 기초 수학 과정에 대한 내용이 1장에 담겨있으며 2장부터는 조금씩 어려워지기 시작하는데 밀 겁부터 내지말고 저자가 전하는 단계를 조금씩 따라가보자. 일단 확률에 대한 기본 이해가 마무리 되었다면 이를 바탕으로 통계에 대한 조금은 복잡한 학습 과정이 이어집니다.

그리고 저자는 통계의 기본이 되는 데이터에 대한 시각의 변화를 요청합니다. 즉 데이터에 담긴 의미에 대한 통찰력이 필요하다고 합니다. 그리고 통착력을 얻으려면 데이터의 출처에 대한 맥락, 호기심, 분석이 필요하다고 합니다. 그리고 무엇보다 머신러닝 개발자라면 이번 장에서 설명한 가설 검증에 대해 시간을 충분히 할애할 것을 당부하고 있다.

이렇게 조금은 어려웠던 확률과 통계 과정을 넘어서면 이제 본격적으로 미래의 상황에 대한 추론과 예측을 위한 선형대수학과 선형 회귀 과정을 거쳐 로지스트 회귀와 분류에 대한 과정을 거치게 됩니다. 그리고 마침내 딥러닝의 기본 개념인 신경망 과정을 학습하게 됩니다.

그리고 마지막으로 이 책이 개발자들에게 꼭 필요한 책이라고 여겨졌던 건 수학을 바탕으로 한 데이터 과학 분야에 대한 경력을 쌓고 앞으로의 진로에 대한 조언을 아낌없이 담고 있다는 것이다.

마지막으로 지금까지 학습한 전 과정에 대한 보충학습과 워크북을 끝으로 개발자를 위한 필수 수학을 마무리하고 있다.

"한빛미디어 < 나는리뷰어다 > 활동을 위해서 책을 제공받아 작성된 서평입니다."

개발자를 위한 필수 수학

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."
해서, 최대한 책을 펼쳐놓는 형태로 리뷰를 작성해 보려고 합니다.
그 중에 자신에게 맞는 부분이 있다면 책을 선택해 보시면 될 것 같습니다. ^^


✅ 이 책의 내용
이 책의 목표는 다양한 수학, 통계, 머신러닝 영역을 소개하는 것
- 처음 네 개의 장에서는 미적분, 확률, 선형대수학, 통계등 기초 수학 개념을 다룸
- 마지막 세 개 장에서는 머신러닝을 소개
- 머신러닝을 가르치는 궁극적인 목적은 책에서 배운 내용을 통합하고, 블랙박스에 대한 이해를 넘어 머신러닝과 통계 라이브러리를 사용하는데 있어 실용적인 인사이트를 보여주기 위함임

 

✅ 이 책의 목표
- 실제 문제에 적용할 수 있는 다양한 수학, 통계, 머신러닝 영역을 소개하는 것

 

✅ 대상 독자
. 실제 문제에 적용할 수 있는 수학, 통계, 머신러닝에 대해 알고 싶은 사람
. 아래에 대한 답을 찾고 싶은 사람
 - "머신러닝을 배울 때 수학을 먼저 공부해야 하나요?"
 - "인공지능을 공부하려면 수학을 잘 알아야 하나요?"

 

✅ 이 책의 구성 
1장 기초 수학과 미적분
2장 확률 
3장 기술 통계와 추론 통계
4장 선형대수학 
5장 선형회귀
6장 로지스틱 회귀와 분류 
7장 신경망
8장 경력 조언과 앞으로의 진로 
부록 A 보충학습

 

✅ 이 책을 읽기전에 들었던 이 책에 대한 생각 
- 수학 공부를 제대로 해볼 수 있겠다. 
- 프로그래밍을 활용해 수학을 해볼 수 있겠군.


✅ 이 책에 대한 한 줄 평
현 시대에 필요한 수학 내용들을 통해 실제로 논리력을 키우고, 실습을 하면서 나름 재미있게 수학공부를 할 수 있는 학습서!

 

✅ 이 책을 읽고나서 이 책에 대한 소감
솔직히 이런 책이 있었으면 한다고 생각을 했다. 
이유는 학교에서 배웠던 수학 공부에 대한 내용은 외우고, 그냥 시험을 위한 공부였다. 
그렇기 때문에 사람들이 수학 공부에 흥미를 못 느끼는 게 아닌가 하는 생각을 한다.

 

그래서 수학, 하면 어렵고 힘들고, 그런 생각들을 많이 하는 것 같다.

 

바야흐로 인공지능 시대가 되면서 데이터도 분석해야 하고, 문제를 해결하는데 인공지능이 많이 쓰이고,
인공지능을 자유 자재로 사용하려면 기본적인 동작원리를 이해해야 한다고 생각한다.

 

그러기 위해서는 수학이 필요한데, 수학을 파이썬 같은 눈에 보이는 프로그래밍 언어로 구현을 하고 
수학 공식을 그래프로 직접 구현하는 이 학습은 수학을 하는데도 많은 도움이 된다고 본다.

 

어찌보면 앞으로는 중학교, 고등학교 수학은 파이썬 프로그래밍을 활용한 학습이 더 효과적이지 않을까 싶다.

 

학습은 지속적이고, 반복적이어야 한다.
그런데 공부는 항상 재미있지 않다.

 

학습을 하는 방법은 항상 재미있을 수는 없지만, 자신만의 재미있는 방법을 찾아야 한다. 
그래야 집중하고, 그래서 지속하고, 오래하고, 그러다가 자신만의 깨달음을 얻게 된다.

 

무엇이든 남이 해놓은 방식이 아닌, 내가 내 스스로 부딪혀 깨우치는 학습법이 최고라고 나는 생각한다. 
그렇기에 과학적인 원리, 예를 들자면 상대성 이론 같은 경우나, 3차원 형태로 뭔가를 그려보고 이해를 할때도
이런 파이썬 프로그래밍을 활용하면 도움이 된다고 본다.

 

공부는 학생때만 하는 게 아니라고 나는 생각한다. 
나도 수학을 잘 못해서, 이렇게 뭔가 시대에 필요한 것들만 잘 정리를 해놓은 것은 
공부하는데 조금 더 흥미가 생기지 않을까 싶다.

 

시대의 필요에 맞는 내용들을 잘 정리해 줘서 고마운 책이고,
요즘 많이 생각하는 것은 국어, 영어, 수학의 중요성이다.

 

국어의 문맥을 이해하지 못하면, 영어 회화 능력도 향상될 수 없으며
문제를 해결하려면 자신만의 논리적인 생각이 중요하다.

 

자신만의 문제해결력을 높이는데도, 현재 인공지능의 동작원리를 이해하는데도 
우주와 자연의 이치를 이해하는데 도움이되는 책이 아닐까 싶다.

 

대부분의 수학을 싫어하거나 그랬던 사람들은 공식을 외우고 그것으로 시험을 보는 것 때문이 아니었을까?
내가 살아가는 삶의 문제를 해결하는데 필요한 것이 논리적 생각이고, 그것을 해결하려면 답을 보지 않고
혼자서 끙끙대며 해결해 가는 능력이 필요하다고 '몰입'의 황농문 교수님도 이야기하고 있다.

 

어떤 문제가 생길지 모르는 시대에, 자신에게 닥친 문제를 정의하고, 해결방법을 찾는데 도움이 되는게 
수학이라고 생각한다.

 

나도 수학을 못하기 때문에 이번에 이 책을 보면서 정리를 해보고 있어서 매우 고마운 책이다.

 

나는 인생이 "문제를 해결해 가는 과정"이라고 생각한다. 
그러기 위해서는 문제를 해결해 가는 방법을 경험해야 하는데 
그런 과정에 이 책에서 작은 한 문제를 하나 잡아서 답을 보지 않고 혼자 고민해서 해결해 보는 건 어떨까 생각한다.

 

답이 틀려도 상관없다.
과정이 옳으면 답은 언젠가 맞게 되어있기 때문이다. 
이 말은 '이상한 나라의 수학자'라는 영화에 나온 대사이다.

 

이 복잡한 세상에 다양한 문제들을 해결하기 위한 도구로서 이 책을 활용해보면 좋을것 같다는 생각이 들었다.
 

이 리뷰를 보신 분에게 도움이 되길 바래봅니다. ^^

앓는 소리를 먼저 하자면, 기초를 다지기 위해 이 책을 골랐고 꽤 힘들게 읽었습니다. 한두 번 더 실습해야겠다고 마음 먹었습니다. 책 내내 보이는 리본 달린 보충 설명과 주의사항이 상당히 도움이 되고 안심이 되었습니다. P값 해킹, e, 실전 요령, 편향 등 한 장(chatpter)를 할애하기는 애매하지만 두고두고 유익한 가르침이 줄곧 나왔습니다.

 

데이터 과학자를 꿈꾸는 이에게는 필독서라고 봅니다. SPSS, SAS로 통계 업무를 보다가 Python으로 확장하는 데에도 도움이 되겠고, 탄탄한 수학 기초에 비해 약한 통계 노하우를 단기간에 습득하는 데에도 유용하겠습니다. 말미에는 경력 경로 등 데이터 과학/분석 업계에서 성장하려는 후배에게 조언하는 내용이 실렸습니다. 352쪽이라는 분량을 채우며 허투루 넘어가는 주제가 없습니다. 한두 달에 이 책을 소화하기는 어렵지 않을까 합니다. 게다가 저자가 소개하는 강의 영상까지 전부 본다면 석 달도 모자랄 듯합니다. 그만큼 내용이 알찹니다. 데이터 분석가, 데이터 과학자로 대성하고자 한다면 끈질기게 완독하고 연습문제까지 전부 풀어보시길 바랍니다. 자신감이 단단히 쌓일 겁니다.

 

"한빛미디어 < 나는리뷰어다 > 활동을 위해서 책을 제공받아 작성된 서평입니다."

"제일 먼저 읽어야 할 책"을 표현하는 단어가 마땅히 떠오르지 않는다. 그렇다고 입문서는 아니다.

예전부터 머신러닝을 다루는 책에서 아쉬웠던 점은 바로 수학 공식이 나오는 부분이다. 수학을 잊은 지가 오래여서 다시 고등 수학, 대수학, 유튜브로 공부하면 바로 이해가 되었지만, 머신러닝의 개념과 잘 이어지지 않았다. 다시 말해, 수학, 프로그래밍, 머신러닝이 따로따로 분리되어서 개념적으로 쉽게 결합되지 않았다.

 

머신러닝은 수학적인 개념을 활용하여 주어진 문제를 해결하는 것인데, 읽기도 쉽지 않은 수학 공식으로 접근하려고 하니 머신러닝 수포자가 되는 것은 아닐까?

 

이 책은 머신러닝 책이다. 이전 책들과 다른 점은 수학적인 개념이 중심이 되어서 머신러닝을 예로 설명하는 것이다. 머신러닝 공부를 시작할 때 처음에 이 책부터 읽었다면, 다른 책들도 접근하기 쉬웠을 텐데 하는 진한 아쉬움이 있다.

 

입문서가 아닌 이유는 머신러닝의 선형 회귀와 로지스틱 회귀, 신경망에 관한 기본적인 이해가 있어야 하기 때문이다. 딥러닝에 관해서도 활성화 함수, 정방향, 역전파, 사이킷런을 알고 있어야 한다. 또한, 파이썬에서는 넘파이, 판다스, 맷플롯립을 다룰 줄 안다고 생각하고 진행하기 때문이다.

 

이 책은 전체 8개의 장으로 구성되어 있다.

1장 '기초 수학과 미적분'에서는 정수론부터 함수, 거듭제곱, 로그, 오일러 수, 자연로그, 극한, 미분, 적분까지 기초 수학의 개념을 설명하고,

2장 '확률'에서는 확률의 개념과 계산법, 베이즈 정리를 알려준다.

3장 '기술 통계와 추론 통계'에서는 모집단, 표본, 편향, 평균, 분산, 표준 편차, 정규 분포 등의 통계 개념과 추론 통계에 관해 설명하고,

4장 '선형대수학'에서는 벡터와 행렬, 행렬 곱셈, 특수 행렬, 역행렬의 개념을 알려준다.

5장 '선형 회귀'에서는 기본 선형 회귀의 개념과 잔차, 제곱 오차, 확률적 경사 하강법의 개념을 살펴보고,

6장 '로지스틱 회귀와 분류'에서는 로지스틱 회귀의 개념과 베이즈 정리, 분류의 수학적 개념을 알려준다.

 

7장 '신경망'에서는 활성화 함수와 정방향 계산, 역전파의 개념과 계산법을 살펴보고,

 

8장 '경력 조언과 앞으로의 진로'에서는 데이터 과학자를 직업으로 정했을 때 고려해야 할 점과 주의할 점을 가감 없이 알려준다.

 

마지막 부록으로 '개발자를 위한 필수 수학 워크북'은 7장까지 설명한 개념에 관한 복습 문제로, 수학적인 개념이 적용된 실생활 예시를 통해 문제와 해답을 알려준다.

각 장은 주제와 관련된 수학적 개념을 먼저 설명하고, 파이썬 코드로 실습한다. 실생활에서 접할 수 있는 예제로 설명하기 때문에 어렵지 않으며, 그림을 많이 포함하고 있어서 이해가 더욱 쉬웠다.

책 중간중간 'Note'와 'Tip', 'CAUTION'은 개념 설명을 위해 필요한 보충 설명을 하고, 저자의 경험도 빼곡히 알려주니, 관심 있게 읽어보도록 하자.

 

이 책을 읽고 나면 수학 공식이 있어도 더 이상 부담스럽지 않고 쉽게 읽을 수 있는 마법 같은 일이 벌어진다. 개인적으로 7장 '신경망'을 가장 재미있게 읽었으며, 3장의 '추론 통계'는 아직도 잘 이해가 되지 않지만, 꾸준히 반복해서 읽으면 이해가 되겠죠?

 

끝으로, 이 책을 통해 전달하고자 하는 저자의 인용문으로 마무리한다. 감사합니다.



필자는 그리스 기호로 가득 찬 수식을 피하고, 그 자리에 일반적인 언어를 사용하려고 최선을 다했습니다. 하지만 이 책을 통해 여러분이 수학과 통계에 대해 조금 더 편안하게 이야기하고, 이 분야를 성공적으로 탐험하는 데 필요한 지식을 얻기를 바랍니다.
이 책에 대하여, p11

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."


 

데이터 사이언스, 컴퓨터 비전 등의 기본을 다지기 좋은 책
 

 

개발자를 위한 필수 수학 도서 표지

 

최근 아는 분의 페이스북에서 이 도서의 출판 소식을 접하게 되었다.

 

데이터와 관련된 기술을 공부하고 있다 보니 이 도서는 무조건 읽고 싶었고, 운 좋게 기회가 생겼다.

 

도서를 읽기 전 생각한 도서의 구성은 기술에 접합된 내용보다는 미적분, 선형대수학 등 수학에 대한 내용이었다.

도서를 받은 이후, 도서의 목차는 생각과 비슷하였으나, 내용은 실제 기술에 대한 예시가 녹아 있었다.

 

이 도서를 보면서 특징이라고 할 수 있는점은.

 

1. 수학에 관련된 도서이지만, 기술과 접목하여 풀어낸 내용이므로 예시 코드가 함께 제공된다.

 

2. 예시 코드 뿐만 아니라, 실행 결과까지 포함되어 있어 코드를 실행하지 않고도 도서를 읽을 수 있다.

 

3. ML, DL에 대한 내용을 포함하고 있어서 도서를 읽으면서 어느정도 실습이 가능하다.

 

4. 정수론, 변수부터 로지스틱 회귀 등 기본적인 내용부터 깊이 있는 내용으로 구성되어 있어서 초급자에게도 좋은 도서이다.

 

강의나 도서를 보고 공부하다보면 수학적인 내용은 대략적으로 설명 후 넘어가는 것이 대부분인데, 그런 부족한 부분을 이 도서를 통해 채울 수 있었다.

 

계속 공부하다보면 잊게 되는 중요하고 기본적인 내용이라서 이 도서는 책상 옆에 항상 두고 읽게 될 것 같다.

(고등학교 때 수학 공식 모음집 같은,,,)

 

데이터 분야의 공부를 시작하는 사람과 현직에서 일하는 모든 사람들에게 추천할 수 있는 도서이며, 책상 옆에 필수로 두고 봐야하는 책이라고 생각한다.

 

날이 갈수록 자꾸 까먹게 되는게 늘다 보니 나는 책상 옆에 꽂아 둘 예정이다.


 "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

리뷰는 실제 도서를 읽어본 후 작성되었으며, 도서의 제공 여부와 상관 없이 독자의 시점으로 작성하였습니다.

 

빅데이터, 인공지능을 공부하다 보면, 항상 걸리는 부분이 수학이다. 전에는 프로그램 개발하는 데, 수학 몰라도 크게 힘든 부분이 거의 없었다. 개발에 걸림돌은 업무나 기술에 대한 이해였지, 수학적인 능력은 아니었다. 내 경우 여러 개발을 해왔지만, 총합이나 평균 정도가 가장 많이 사용된 수학이었고, 좀 복잡한 경우 벡터와 미적분 정도였다.

 

그런데 인공지능을 공부하면서 이 정도의 수학 지식으로는 터무니 없이 부족하다는 생각을 하게 되었다. 물론 인공지능이나 빅데이터를 하는데 있어, 수학 때문에 프로그램 개발을 못하는 것은 아니다. 하지만 수학을 모르면, 왜 이렇게 해야 하는지 제대로 알지 못한다. 남이 하는 거 따라 할 수는 있어도 구체적인 방향을 제시하기 어렵고, 문제가 생겼을 때, 해결하기도 어렵다.

 

그런 만큼 인공지능 관련 서적을 볼 때마다, 잘 모르는 수학들이 나오면, 어떻게든 알기 위해 신경을 쓰고 있다. 그렇지만, 좀처럼 수학 실력이 늘지 않는다. 매번 단편적으로 수학을 공부하다 보니, 연결성이 떨어져, 볼 때마다 항상 새롭다는 기분이다. 자주 봐왔던 베이즈 확률도 그렇고 통계 공식, 회귀 분석 등이 다 그렇다.

 

 

그래서 느낀 게 인공지능이나 데이터 과학에 관련된 수학을 집중적으로 공부할 필요가 있다는 것이다. 그래서 보기 시작한 책이 토머스 닐드의 '개발자를 위한 필수 수학'이다. 제목만 보면, 대학에서 배우는 전산 수학을 말하는 건가 할 수 있는데, 이 책을 좀 자세히 이해하기 위해 원제를 보면, 'Essential Math for Data Science'으로 데이터 과학에 관련된 수학을 보다 중점적으로 다룬다는 것을 알 수 있다. 당연히 머신러닝과 같은 인공지능 쪽에도 필요한 수학을 익힌다.

 

기초수학과 미적분, 확률, 기술 통계와 추론 통계, 선형대수학, 선형 회귀, 로지스틱 회귀와 분류, 신경망 이렇게 7개의 장으로 필수 수학을 배우고, 마지막 8장에 데이터 과학 실무 관련 조언을 담고 있다.

 

 

'개발자를 위한 필수 수학'에 나온 수학을 살펴보면, 중고등학교 시절, 대학 때 배웠던 것들도 나오고, 전혀 배우지 못한 수학들도 나온다. 복잡한 공식과 각종 수식이 나오다 보니, 부담이 되는 사람들도 많겠지만, 어디까지나 필수 수학을 다루고 있는 만큼 난이도가 높지는 않다. 쉬운 것들부터 다루고, 설명 또한 자세하다. 아울러 그래도 이해가 안 되는 사람 또는 보다 깊은 이해를 원하는 이를 위해, 저자가 참고 서적과 사이트 링크 같은 것들을 참 다양하게 알려 주고 있다. 부록의 보충 학습도 그냥 지나치면 안 되는 도움 되는 내용들을 많이 담고 있다.

 

 

더군다나 이 책을 옮긴 박해선 역자 또한 읽는 이를 위해 큰 도움을 주고 있다. 곳곳에 옮긴이의 주석을 달아서, 최근의 정보도 담고, 우리나라에 맞는 용어 설명, 추가 추천 서적, 추가 설명 등을 하고 있다. 이러한 역자의 노력은 책의 가치를 더욱 높여준다고 생각한다. 이러다 보니, 개인적으로 박해선 역자가 옮긴 책을 더 선호하고 있다.

 

'개발자를 위한 필수 수학'을 통해 데이터과학이나 AI에 필요한 수학을 배운다는 점도 중요하지만, 이 책에서는 단순히 수학만 알려주고 있는 것은 아니다. 수학 이론을 어떻게 파이썬으로 코딩하는지 수학 문제마다 익히게 된다. 파이썬과 함께 넘파이, 사이파이, 심파이, 사이킷런을 사용해서 코딩하고 있다. 이를 활용한 코딩 관련된 노하우도 이야기하고 있고, 사용 이유나 차이점 같은 것도 알려 주고 있어, 바로 코딩 능력을 향상하는 데도 도움 된다.

 

중요한 또 한 가지는 저자의 실무 경험을 통한 각종 조언들이 곳곳에 담겨 있다는 점이다. 3장부터 이러한 조언들이나 견해가 내용 중간중간에 나오기 시작해서, 끝 파트인 8장에는 구체적인 사례와 함께 이야기되고 있다. 책 중간에 나오는 내용들은 텍사스 명사수 오류와 같이 데이터 분석의 오류나 편향을 예방하기 위한 것들이다. 일반 수학 책에서는 수학 설명만 다루다 보니, 이런 실무적인 것은 알기 어렵다. 통계나 분석을 적용하기 위해서는 이런 지식은 꼭 필요하다.

 

 

8장에서는 데이터 과학자, 빅데이터 관련 일을 하고자 하는 사람들에 대한 조언들이 나온다. 내용들이 매우 구체적이다. 경영진 설득이 필요한 상황, 어떤 때 일을 맡지 않고 도망쳐야 하는지, 데이터 사이언스 업계의 상황과 전망, 구인 상황, 필요한 능력 등이 자세히 나온다.

 

 

공부를 했으면, 문제를 풀어 보는 것은 당연한 과정일 것이다. 특히 수학이라면 더욱 필요하다. 그래서 그런지, '개발자를 위한 필수 수학' 뒷부분에 워크북이 별책 형태로 붙어 있다. 연습문제를 풀어보며, 배운 것을 체크해 볼 수 있게 되어 있다.

 

데이터 과학 또는 인공지능을 공부하는 사람에 있어, '개발자를 위한 필수 수학'은 어떤 수학을 공부해야 하는지 명확히 알려주고, 자신의 실력 수준이 어떤지 종합적으로 점검할 수 있게 해준다. 나 역시도 술술 익히는 파트도 있었지만, 한 페이지를 제대로 나가지 못하는 곳도 많이 있었다.

수학 능력치를 올려주는 것 뿐만 아니라, 코딩과 데이터 사이언스에 대한 시야도 넓혀주는 책이다. 수학 때문에 고민인 프로그래머가 있다면, '개발자를 위한 필수 수학'을 적극 추천해 본다.

한빛미디어에서 개발자를 위한 필수 수학이라는 책을 발간했습니다. 오라일리 시리즈이며 번역서입니다. 요즘은 번역서라고 해서 번역에 문제가 있는 경우는 보기 드물죠. 이 책의 번역도 깔끔합니다.

 

저자는 토머스 닐드입니다. 유명한 분이라기 보다는 테크 분야의 전문 강사입니다. 특히 인공지능 분야를 전문으로 하는 거 같네요.

 

책의 독자 대상은 데이터 과학을 하는 사람입니다. 인공지능쪽, 특히 머신러닝에 관심있는 사람이 보면 좋습니다. 책의 제목이 "개발자를 위한..."이라고 되어 있는데요. 모든 개발자가 해당되는 건 아닙니다. 웹 프론트나 서버 개발자는 수학을 몰라도 일하는데 지장이 없죠. ^^;; (그래도 시간을 내서 보면 좋습니다!!)

 

저는 이 책을 선택한 이유가 몰입 연습을 해보기 위해서입니다. 요즘 갈수로 집중력 하락을 느끼고 있거든요. 최근엔 1~2분도 집중 못하는 금붕어 같은 머리가 되어 가는 중입니다.

 

어떤 몰입 전문가가 그러더군요. 성인이 되어서 무언가에 집중하는 훈련을 하려면 수학을 풀어보라고요. 수식을 공부하고 문제풀이를 하는 과정에서 집중력을 회복할 수 있을 거라고 했습니다.

 

이왕하는 수학이라면 개발과 관련된 걸 하는 게 좋겠다는 생각에 읽어봤습니다. 책 분량은 전체 350페이지 정도. 많은 건 아니지만 수학이라는 특수성(?)으로 인해 읽는데 상당히 빡빡함을 느꼈습니다. ^^;;

 

개발자를 위한 필수 수학은 데이터를 다루고 머신러닝에 필요한 수학 내용이 포함되어 있습니다. 총 7챕터 중에 앞의 4개 챕터(미적분, 확률, 통계, 선형대수학)는 기초 수학이고 뒤 3개 챕터(선형 회귀, 로지스틱 회귀와 분류, 신경망)는 머신러닝과 관련된 수학입니다.

 

위 내용을 파이썬 수학 라이브러리를 이용해 다뤄보기 때문에 기본적인 파이썬 언어는 알고 있어야 합니다. 너무 딥하게 들어갈 필요는 없어서 가장 기본적인 랭귀지 책을 사서 한 번 훑어보면 될 거 같고 아니면 유튜브에서 무료 강의를 봐도 괜찮을 거 같네요.

 

대학교 이후로 수학을 가까이 할 일이 별로 없었던 사람으로서  개발자를 위한 필수 수학의 난도는 높은 편입니다.(주관적 기준입니다) 그나마 저자가 남을 가르치는 거에 특화된 분이라 비교적 쉽게 쓰긴 했습니다. 시간을 들여 따라가면 따라가볼만 합니다. 머리로 어려운 수식을 이해한 후 복잡한 계산은 파이썬에게 맡기면 되니 공업용 계산기 쓰던 시절보다는 훨씬 편하게 느껴졌습니다.^^;;

 

"한빛미디어 < 나는리뷰어다 > 활동을 위해서 책을 제공받아 작성된 서평입니다."

처음에는 어려운 수학책이 아닐까 생각하면서 이 책을 열어보았는데, 정수 소수 등의 개념을 포함한

아주 기본적인 수개념부터 설명이 되어있었습니다.

 

초등학생 이상이라면 알만한 연산순서도(개발자는 필수로 알아야 함),

더 나아가 항상 개념이 어렵게만 느껴졌던 오일러 함수와 자연로그, 미적분과 확률 통계 개념, 벡터와 행렬

등 다양한 수학 개념들이 담겨있었습니다.

 

특히나 제가 유독 잘 몰랐던 개념은 분포 그래프와 통계학 개념인데요.

통계를 따로 배워야하나 고민했는데 좋은 책을 접하게 되어 한번 개념을 전체적으로 이해해볼 수 있었습니다.

물론 더 깊이있는 설명이 필요한 경우에는 별도로 검색을 하면 될 것 같았습니다.

 

더 좋았던 점은 파이썬 코드를 통해 각종 수학이론들을 프로그래밍할 수 있도록 각종 코드 예제들이 많이 포함되어 있었습니다. 

 

7장에서는 신경망을 다루면서 신경망에 필수로 접목되는 활성화함수도 다루고 있습니다. 그리고 마지막 장에서는 데이터과학에 대한 현황과 진로 조언까지 정말 실용적인 내용들을 듬뿍 담았습니다. (사실 수학책이라고 생각하고 이렇게 친절하게 진로까지 조언해주는 책인지는 몰랐습니다.)

 * 가방에 넣고 다녔는데, 가방 안에 넣어놓았던 음료수가 새서 책 하단이 옴팡 젖어버렸습니다...

    가방을 살려준 셈이니 책한테 감사해해야겠지요...?!

    (먹다가 남긴 음료수를 가방에 넣을 때는 꼭 뚜껑이 잘 닫혔는지 확인하고 넣읍시다...!) 

 

 

수학책이라고 하면 굉장히 딱딱하고 지루한 책이라는 생각이 제일 먼저 드는데요.

이 책은 이해하기 쉽게 기초 개념부터 응용 개념까지, 정말 개발자가 딱 알아야 하는 내용들만 엄선해서 재밌게 버무려놓은 책 같았습니다. 데이터 과학자 혹은 머신러닝/딥러닝을 하고자 한다면 기초 교양 정도로 이 책을 접하면 좋을 것 같습니다.

 

저도 막연히 논문에서 수식과 그래프, 혹은 통계 개념이 나오면 끙끙 앓다가 스킵하곤 했는데, 이 책을 읽고 난 뒤로 두려움이 좀 덜 해진 것 같고 자신감이 생긴 것 같습니다b

 

“ 이 리뷰는 한빛 미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.”

이 책은 수학의 이론을 설명하고 직접 풀어보기 보다, 수학의 용어와 개념을 설명한 후 파이썬 심파이를 사용하여 바로 수식을 푸는 방식을 알려줍니다. 따라서 아예 수학을 처음 다루는 사람보다, 고등학교 수학/대학교 수학/미분적분 등 수학을 배웠지만 기억 저너머로 잊어버린 분들과 바로 프로그램 실행이 필요한 분들께 최고의 레퍼런스라고 할 수 있습니다. 

추가 장점은 워크북과 부록이 있다는 것입니다. 수학 개념을 잘 이해했는지 확인해볼 수 있습니다. 저도 몇개의 개념은 조금 더 찾아봐서 문제를 풀기도 하였습니다. 그리고 마지막 8장은 데이터 과학자로서 경력 조언이 담겨 있는데요. 수학 실습만 담긴게 아니라, 데이터 관련 직업으로 경력을 쌓으려고 할 때 필요한 실질적이고 현실적인 조언이 담겨 있습니다.

 

 

"한빛미디어 <나는 리뷰어다>활동을 위해서 책을 제공받아 작성된 서평입니다."

※ 본 리뷰는 IT 현업개발자가, 한빛미디어 책을 제공받아 작성한 서평입니다.

 

밑바닥 부터 시작하는 딥러닝, 머신러닝 시리즈를 좋아하는 분이라면, 그 책에서 부족했던 기본기를 이 책을 통해서 모두 채울 수 있을겁니다.

이 책은 파이썬을 공부하신 분들이라면 모두 사용해 보셨을 pandas, numpy, sklearn 그리고 sympy 모듈을 사용하여 간결한 코드로 구성되어 있고, 책의 상당 부분을 개념을 설명하는데 할당을 하고 있습니다.

그리고 내용을 설명할 때에도, 기본적인 개념부터 모든 내용을 다루면서 내용을 진행하고 있고, 연관된 실제 예시까지도 함께 언급을 함으로써 수학적 기본기가 부족한 분들에게도 큰 도움이 되어 줄 것입니다.

 

기초적인 수학과 선형대수학, 확률, 머신러닝과 딥러닝 기초까지

책의 첫 부분에서는 정수, 제곱, 로그와 같은 기본 개념들이 소개됩니다. 챕터가 넘어가면서 확률과 통계, 적분과 회귀 분석, 그리고 마지막으로 신경망과 머신러닝까지 다루게 됩니다. 각 챕터는 내용이 급격히 심화되지만, 진도를 못 따라가거나 이해하지 못할 정도로 어렵지는 않습니다.

본 도서는 데이터 과학과 머신러닝을 배우고자 하는 수학 기반이 부족한 개발자와 예비 개발자 들을 대상으로 필수적인 수학 지식을 제공합니다. 데이터 과학에 필요한 기초 수학 개념들을 이해하기 쉽게 설명하며, 이를 실제로 적용하는 방법까지 상세히 다루고 있습니다.

이 책의 가장 큰 장점 중 하나는 수학적 개념을 매우 이해하기 쉽게 설명한다는 점입니다. 많은 개발자들이 수학에 대해 두려움을 느끼지만, 이 책은 복잡한 수학적 이론을 간단하고 명확하게 설명하여 독자들이 쉽게 이해할 수 있도록 도와줍니다. 예를 들어, 1장에서는 정수론, 함수, 미적분 등의 기본 개념을 다루고, 2장에서는 확률 계산과 베이즈 정리, 이항 분포와 베타 분포에 대해 설명합니다. 기초 개념을 탄탄하게 다지는 것은 데이터 과학의 심화 내용을 이해하는 데 매우 중요합니다.

또한, 이 책은 다양한 파이썬 라이브러리를 사용하여 수학적 개념을 실제로 구현하는 방법을 보여줍니다. 심파이, 넘파이, 사이킥런과 같은 라이브러리를 활용하여 직접 코드를 작성하고 실행해 볼 수 있도록 구성되어 있습니다. 이를 통해 개발자들은 이론적으로 배운 내용을 실제로 타이핑해보면서 이해를 깊이 할 수 있습니다. 특히, 예제 코드와 함께 제공되는 설명은 실무에서 바로 활용할 수 있을 만큼 실용적입니다.

5장과 6장에서는 선형 회귀와 로지스틱 회귀와 같은 머신러닝 모델을 다룹니다. 이 장들은 회귀 분석의 기초 개념부터 시작하여 실제 데이터에 적용하는 방법까지 자세히 설명하고 있습니다. 이를 통해 독자들은 데이터 과학 프로젝트에서 필수적인 모델링 기술을 습득할 수 있습니다. 특히, 과대적합 문제, 훈련/테스트 데이터 분할, 오차 행렬, ROC 곡선 등 중요한 개념들이 잘 설명되어 있어, 모델의 성능을 평가하고 개선하는 방법을 배울 수 있습니다.

7장에서는 신경망과 딥러닝의 기초를 다룹니다. 신경망의 기본 구조와 역전파 알고리즘을 설명하고, 이를 파이썬 코드로 구현하는 방법을 보여줍니다. 이 장은 신경망을 처음 접하는 독자들에게 매우 유익하며, 딥러닝의 기본 개념을 이해하는 데 큰 도움이 됩니다. 또한, 신경망의 한계와 실제 적용 사례를 통해 현실적인 기대치를 설정할 수 있도록 도와줍니다.

마지막으로, 8장에서는 데이터 과학 분야에서의 경력 개발에 대한 조언을 제공합니다. 데이터 과학의 역사와 현재 트렌드를 설명하고, 개발자들이 데이터 과학 분야에서 성공하기 위해 필요한 기술과 전략을 제시합니다. 이는 단순히 수학적 지식을 넘어서, 실제로 경력을 쌓고 성장하는 데 유익한 정보를 제공합니다.

이 책에도 단점이 있습니다. 예를 들어, 일부 독자들은 책에서 다루지 않는 머신러닝 알고리즘 예를 들어 랜덤 포레스트, 그라디언트 부스팅과 같은 내용의 부재에 대해 아쉬움을 느낄 수 있습니다. 하지만 이러한 알고리즘들은 다른 전문 서적이나 온라인 자료를 통해 보완할 수 있습니다. 또한, 책의 내용이 방대하여 처음 접하는 독자들은 다소 부담스럽게 느낄 수 있지만, 체계적으로 계획을 세워 학습한다면 충분히 극복할 수 있는 부분입니다.

결론적으로, "개발자를 위한 필수 수학"은 데이터 과학과 머신러닝을 배우고자 하는 개발자들에게 매우 유익한 책입니다. 수학적 개념을 이해하기 쉽게 설명하고, 이를 실제로 적용하는 방법까지 상세히 다루고 있어 실무에서 바로 활용할 수 있습니다. 이 책을 통해 데이터 과학의 수학적 기초를 탄탄히 다지게 되고, 더욱 발전된 기술을 습득하는 데 좋은 자양분이 될 것입니다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

한빛미디어 < 나는리뷰어다 > 활동을 위해서 책을 제공받아 작성된 서평입니다.”

 

데이터 분석에 필요한 통계에 대한 이해도가 부족했다. 가설 검정, 귀무가설과 대립가설, P-value, t-분포와 카이제곱 분포 등. ADsP를 공부할 때도 이해가 잘 안 가고 그냥 문제에 필요한 수준으로 외우기만 했던 부분이 특히 답답했다. 그래서 이 책을 선택했다.

 

책의 구성을 보면​

  1. 기초 수학과 미적분
  2. 확률
  3. 기술 통계와 추론 통계
  4. 선형대수학
  5. 선형 회귀
  6. 로지스틱 회귀와 분류
  7. 신경망
  8. 경력 조언과 앞으로의 진로


이제야 비로소 해방감

1장은 쭉쭉 넘겼다. 나도 나름 공대생이다. 그런데 2장에서 유용한 지식을 꽤 얻었다. 가능도, 오즈(odds)가 무엇인지, 이항분포와 베타분포가 어떤 관계인지.

그리고 3장 통계. 여기서 참 많은 감정들이 피었다. 그 전에 일단 원래 알고 싶었던 궁금증은 아주 잘 해소되었다. 그리고 그 감정들. 이건 데이터 과학에 대한 접근 방식에 관한 것이다. 머신러닝/인공지능을 공부하며 프로젝트들을 진행했던 작년. 내가 느꼈던 억울함. 그럼에도 여전히 나는 틀리지 않았다고 생각했는데, 이제서야 제대로 된 심판을 받아 정의가 구현된 승리감과 안도감이었다.

 

머신러닝에 복잡한 IT기술이 주요한 영역으로 떠올랐지만, 그럼에도 본질은 변하지 않는다. 기술의 적용은 결국 문제를 해결하기 위한 것이다. 무지성으로 최신 기술을 적용하며, 그러한 답이 왜 나오는지 혹은 과연 맞기는 한 건지에 대한 통찰은 전무한. 나는 그게 대체 뭐 하는 건지 이해가 안 갔다. 딥러닝을 신으로 숭배하며 정답을 하사받는 것과 다를 바 없다고 생각했다. 물론 지금도. 하지만 이런 내 생각은 존중받지 못 했다. 바보들의 세상에서 도리어 내가 바보 취급을 당했던 억울한 지난 날이었다.

그걸 다 얘기하면 진짜 밤 샐 것 같다. 도메인에서는 전문가라는 사람들. 데이터에 대한 지식이 없어서 그런지, 뭔지도 모르는 복잡한 최신 기술에 환호했다. 나는 기본적인 탐색을 바탕으로 문제 상황을 고려하여 적절한 기술을 적용하려했다. 그래서 많은 시간을 탐색과 전처리, 접근법에 대한 논의에 할애했다. 그러다가 중간 점검 때, 단지 멋있고 복잡한 최신 기술이 아니라는 이유로 무시받았다. 확인해보니 우리가 제공받은 건 기본적인 확인과 전처리도 안 되어있는 소위 쓰레기(Garbage) 데이터였다. 데이터 정제부터 해야 뭐든 가능한 상황이었기에, 그게 왜 필요한지 눈으로 확인시켜줬다. 그렇게 좋아하는 최신 모델까지 사용해서.

담당자가 제대로 된 식견이 있거나 해당 주제에 관심이 있었다면 아르바이트생을 고용해서라도 데이터 라벨링을 다시 했을 것이다. 그런데 나중에 알고보니 완전 반대로 움직인 것 같다. 아마 별로 관심도 없고, 멀쩡한 판단을 할 지식도 없었다는 얘기다. 다행히 다른 기관의 다른 프로젝트에서는 이렇게 어처구니 없고 억울한 일은 없었다. 대신 가끔 답답할 때는 있었다.

 

데이터 과학에서 머신러닝과 인공지능 기술의 입지가 치솟으면서 이런 일이 생기는 것 같다. 통계적인 사고와 접근이 부재한데다 머신러닝에 대한 이해가 부족한 상황에서, 머신러닝을 마치 신처럼 추종하게 되면 이렇게 된다. 정말 감사하게도 이런 바보같은 상황을 정확히 지적해줬다. 이 말을 듣자니, 그때 그 말도 안 되는 답답했던 경험이 떠오르면서 이제라도 큰 안도와 위안이 되었다. 역시 내가 틀린 게 아니었구나. 어떤 해방감이 들기도.


머신러닝과 딥러닝

4장 선형대수학도 다 아는 내용이라서 쭉쭉 넘어갔다. 5장 선형회귀와 6장 로지스틱도 이미 접한 내용이지만, 앞서 말했듯이, 통계적인 관점에서 생각해 보는 기회가 되었다. 단순히 결과로 높은 수치로 나오면 좋은 게 아니라, 어떤 의미가 있고 어떻게 해석해야하는 지를 말이다. 7장 신경망에서는 딥러닝을 수학적으로 들여다본다. 작년에 공부할 때부터 밑바닥부터 구현해보려고 했는데 이게 은근 미루게 된다. 하고 싶은 게 너무 많아서 여기에 할애할 시간과 여유가 없어서 그렇다. 여기서도 역시 빼먹지 않고 딥러닝을 맹목적으로 추앙하지 말라고 또 말해준다.


경력과 진로에 대한 조언

열심히 살면 이렇게 보상을 받는건가 싶었다. 내가 요즘 하는 개인적인 고민이 있다. 흔한 고민이 아닌데, 여기에서 많이 언급하고 다룬다. 그 고민을 하고있는 지금, 이 책을 읽어서 이렇게 이렇게 안도감과 위안을 받게 되는 게. 운명적이라는 생각이 들었다. 많은 문장이나 구절을 인용하면서 계속 기술하고 싶지만, 돈으로 거래되는 책이기에 그럴 수는 없겠다. 대신 내 고민에 대한 대답 위주로 구성해본다.

세분화된 직무와 주제

데이터 관련 직무가 많은데, 난 딱히 하고싶은 역할이 없었다. 아니, 특정 역할 하나만 정해서 해야한다는 상황 자체가 싫었다. 대신 어떤 분야의 주제를 다루는 지는 중요했다. 그게 내가 좋아하고 재밌는 분야이고, 특정 역할에 억매이지 않고, 프로젝트 전체를 커버하고 싶었다. 나는 전형적인 어드바이저 유형이었다. 하지만 데이터 분야에서 대부분의 채용은 나의 바람과 반대였다. 특히 신입 채용은 대부분 실무자를 채용했다. 어드바이저 유형의 PO나 PM을 하면 되려나? 생각했지만, 신입으로 시작하기에는 장벽이 있었다.

당분간 취업을 하지 않겠다고 결정한 이유는 바로 여기에 있다. 내가 좋아하는 주제로 프로젝트 전체를 이끌어나가고 싶은데, 그 방법은 현재 우리나라의 채용과 완전히 반대였다. 여기에 대한 2가지 대응 방법이 있다. 하나는 채용 시장에 나를 맞추는 것. 다른 하나는 채용시장을 떠나는 것. 나는 후자를 택했다. 나 혼자서라도 금융과 투자라는 도메인에서 가치를 창출해보기로 했다.

다양한 분야에 대한, 너무 많은 관심

다양한 분야에 대한 호기심과 흥미가 너무 강하다. 하나를 진득하게 공부하지 않고 이것저것 하다보니 숙련도의 깊이가 다소 떨어졌다. 그런데도 계속 다른 분야를 접해보고 싶다. 실제로 올해 프론트 엔드 공부를 시작했고, 보안과 자율주행도 리스트에 담았다. 이토록 너무 강한 제너럴리스트 성향이 고민이었다. 그런데 이게 오히려 데이터 과학에서 필요한 자질이라고. 전문가가 근거를 들어 설명해주니까 다행이기도 하고 되려 자신감이 생긴다. 지금까지 하던대로 내가 하고싶은 대로 하자. 그 대신 전문성을 확보하려는 노력을 추가해야 겠다.

내가 이상한 게 아니다

내가 유별나게 이상한 게 아니다. 오히려 아주 바람직한 태도로 잘 나아가고 있다고. 다수에서 벗어나 소수의 행보를 걷는 지금 상황에서, 큰 힘이 된 책이다.

프로젝트나 목표를 염두에 두어야 하며,

흥미가 없는 주제라면 굳이 배울 이유가 없겠죠.

확실한 목표가 있어야 합니다.

흥미롭고 관련된다고 생각되는 것을 추구하면서 FOMO를 떨쳐내세요.

가장 효과적인 학습 방법은 흥미를 느끼는 문제(도구가 아니라!)를 선택하는 것입니다.

 

예상하시겠지만 수학 분야 모두를 다루지 않습니다. 그럴 수도 없을뿐더러 그러려고 하지도 않습니다.
제목에서 상당 부분 유추할 수 있습니다.
'개발자'에서 수의 본질이나 증명보다는 이해와 활용에 관심이 있다는 것을 알 수 있습니다.
'필수'에서 주요 수학 분야에서도 특정 분야로 제한한다고 짐작할 수 있습니다.
특정 분야는 소제목으로 알 수 있습니다. '데이터 과학'
좁게는 머신러닝, 넓게는 데이터 과학을 위해 필요한 수학에 보다 쉽게 다가갈 수 있도록 안내합니다.


골라 읽어도 됩니다
저는 책을 세 부분으로 나누어 보았습니다 - 수학, 적용, 진로.
수학은 1장에서 4장까지이며 기초 수학, 확률, 통계, 선형대수학을 다룹니다.
적용은 5장에서 7장까지로 앞에서 다룬 수학이 데이터 모델에서 어떤 역할을 하는지 보여줍니다.
진로는 8장으로 수학과 별개로 데이터와 관련된 진로와 현실을 알려줍니다.

 

순서대로 읽긴 했지만 읽고 나니, 셋 가운데 눈이 가는 부분 어디든 골라 읽어도 되겠다는 생각이 들었습니다.
적용 부분이 앞에 있는 수학 부분 이해를 바탕으로 하긴 하지만, 보다가 막히면 잠깐 멈추고 수학 부분을 보고 나서 멈춘 곳으로 다시 오면 될 것 같습니다.
필요나 관심에 따라 수학 부분만 봐도 되고, 진로 부분만 봐도 괜찮겠다는 생각입니다.


이해하고 가까워지고자 합니다
단순 적용보다 어떻게 이해하고 접근해야 하는지 얘기합니다.
수식에서 뜬금없이 등장하는 수치나 값이 어디서 나왔는지도 알려줍니다.
데이터 모델도 많이 다루지 않고 단순한 형태를 다루면서 수학이 하는 역할에 보다 집중합니다.
책에 있는 내용보다 좀 더 자세히 알 수 있는 자료를 안내하고 있지만 찾아보는 건 독자몫으로 남겨둡니다.

 

당연히 알고 있을 것이라 생각하는 일종의 배경 지식조차도 짚고 넘어갑니다.
'지식의 저주'에 당하는 입장을 살뜰히 챙깁니다.

 

챗GPT 얘기도 기대하셨다면, 아주 살짝만 언급될 뿐입니다. 챗GPT가 공개되기 전에 나온 원서가 나오기도 했고, 얘기하고자 하는 바와 거리가 있어 보입니다.

 


아는 것을 확인하고, 아는 것 위에 하나씩 쌓아가며 지경을 넓히는 데 큰 도움이 되리라 생각합니다.

 


"한빛미디어 <나는리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

이 책은 개발자가 알아야 하는 데이타 과학에 필수적인 수학 지식을 자세히 설명하고 있다. 이농지능 관련한 기술때문에 다양한 수학적인 배경이 필요하게 되었고, 이를 수학적으로 설명하는 책이 많이 나와 있다. 하지만 머신러닝 관련한 수학 개념은 시작부터 너무 어려워 제대로 이해하기가 너무 어렵다는 느낌을 많이 받았다. 기초적인 수학 개념이 배제된, 통계 및 분석에 관련된 깊이 있는 개념 위주로 설명이 되다보니 한번에 그 개념을 이해하고 파악하는데는 무리가 있다는 느낌을 많이 받은 것 같다.

 

이 책은 기초수학 개념부터 시작을 한다. 간략하게 설명하고 넘어가기는 하지만 정수론과 연산, 함수 등에서 부터 출발해서 극한, 미분, 적분을 1장에서 간략하게 다룬다. 이 개념만 이해하더라도 수에 대한 기본적인 개념을 다시 파악할 수 있는 지식을 얻을 수 있다고 본다. 이 후에는 확률과 통계에 대해 구체적으로 다루며, 벡터와 행렬을 포함한 선형대수학 개념을 설명함으로써 이후 이어지는 데이타 분석을 위한 핵심 개념을 미리 파악할 수 있도록 해 놓았다.

 

5장부터는 데이타 분석에서 사용하는 다양한 기법을 본격적으로 설명한다. 관측된 데이터 포인트를 통과하는 직선을 그려서 두 개 이상의 변수 간의 관계를 보여주는 것이 가장 실용적인 기법 중의 하나이다. 회귀는 관측 데이터에서 어떤 함수를 훈련한 다음 새로운 데이터에 대한 예측을 만드는 방법이며, 선형 회귀는 관측 데이터에 맞는 직선을 훈련하는 것이다.  이를 통해 변수 간의 선형 관계를 보여주고 새로운 데이터에 대한 예측을 만들 수 있다. 6장에서는 하나 이상의 독립 변수가 주어졌을 때 결과의 확률을 예측하는 로지스틱 회귀에 대해 소개한다. 로지스틱 회귀는 선형 회귀처럼 실수를 예측하는 것이 아니라 범주를 예측하는 분류 알고리즘으로 이해하면 된다. 로지스틱 회귀는 구현하기 쉽고 이상치와 기타 데이터 문제에 상당히 탄력적이기 때문에 많은 머신러닝 문제를 해결할 수 있고 다른 유형의 지도 학습보다 실용성과 성능이 뛰어나다고 볼 수 있다.

마지막 7장에서는 신경망에 대해 설명한다. 신경망은 지난 10년간 르네상스를 누려온 회귀 및 분류 기법이다. 신경망은 입력 변수와 출력 변수 사이에 가중치, 편향, 비선형 함수로 이루어진 층을 쌓아 구성하며, 특히 딥러닝은 신경망의 한 종류로써 가중치의 편향을 가진 노드로 구성된 여러 개의 은닉 층을 사용하는 기법이다. 신경망을 통해 이전에 컴퓨터로 해결하기 어려웠던 문제에 대해 흥미있는 해결책을 다양하게 제시할 수 있게 되었다.

 

이 책을 통해 인공지능에 필요한 다양한 수학적 지식을 습득할 수 있을 뿐만 아니라 파이썬 코드와 라이브러리를 사용하여 수학 개념을 파악해 볼 수 있다. 또한 데이타 과학 경력을 쌓기 위한 방법과 진로 제언까지 포함하고 있어서 막연히 생각만 하고 있던 경력 목표를 다시 파악하고 구체화시킬 수 있는 정보를 제공하고 있다. 이런 면에서 이 책은 보다 현실적으로 도움이 되는 수학적 지식과 경력 목표를 바라볼 수 있는 유용한 정보를 제공한다고 생각한다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

  코딩 + 수학을 제목으로 달고 나오는 책들은 사실 펴보기가 살짝 무서운 면이 있다. 살짝 난도가 있는 수학들이 쏟아져 나오기 때문이다. 그래서 늘 '아~ 이런 것도 있지'라며 눈으로 훑고 만다. 잡고 늘어지면 아마 올해 안에 읽을 수 없을지도. 그런 면에서 이 책은 정말 필수 수학을 담고 있다. 페이지를 넘길수록 점점 어려워지는 것은 맞지만 분명 첫 장부터 포기하진 않을 수 있다.

  데이터 확의 기본이 되는 수학 개념과 도구를 설명하는 이 책은 한빛미디어의 지원으로 읽어볼 수 있었다.

  머신러닝과 딥러닝 같은 단어가 일반화되면서 수학(특히 통계)은 그 관심이 높아졌다. 데이터는 기하급수적으로 증가했고 그 데이터를 사용하기 위한 노력은 계속되었다. 데이터를 처리하는 기술은 갈수록 그 중요도가 높아질 것이다. 그럴수록 관련 수학도 점점 더 필요하게 될 것이다.

  이 책은 파이썬의 툴을 이용하여 다양한 수학과 통계를 보여주는 게 목적이라 설명도 심플하고 예제 코드 또한 그렇다. 뭔가 그럴듯한 것을 만들기 위함이 아니라 그야말로 경험의 범주에 더 닿아 있다고 할 수 있다. 마치 데이터 과학의 관광을 다녀간다는 느낌이랄까.

  기초 수학부터 시작한 내용은 결국 회귀분석까지 가긴 하지만 많은 페이지를 할당하며 설명하기 때문에 다른 책들보다 이해하기는 조금 더 쉬운 것이 장점이다. 물론 수학이라는 것이 눈으로 보고 이해할 수 있는 학문은 아니지만 적어도 어떤 것들이 있다는 건 알 수 있다.

  이 책이 좋았던 점은 마지막 부근에 경력에 대한 얘기, 진로와 학습 방법에 대한 얘기를 해줘서 좋았다. 게다가 마지막에는 문제와 풀이도 들어 있어서 재밌게 풀어볼 수 있도록 되어 있었다. 개발자로서 데이터 과학을 하는 사람으로서 조금 방황스러운 상태에 있다면 이 책을 천천히 읽어보는 게 많은 도움이 될 듯하다.

  "한빛미디어 < 나는리뷰어다 > 활동을 위해서 책을 제공받아 작성된 서평입니다."

수학을 좋아하는가? 수학을 포기한 적이 있는가?

IT 분야에 일하면서 수학을 다시 처음부터 미분적분까지 다시 공부하고 싶다 라는 생각이 뿜뿜 올라왔었다.

딱 맞는 타이밍에 신기하게도 이 책을 읽게 되었다.

이 책은 데이터 과학, 머신러닝, 인공지능 분야에서 활용되는 수학 개념들을 기초부터 심층적으로 다루고 있으며, 파이썬을 활용한 실습 코드까지 제공하여 독자들이 실제로 수학을 코드로 구현하고 활용하는 방법을 익힐 수 있도록 구성되어 있다.

코드들이 파이썬으로 되어 있기에 파이썬은 무조건 선행 학습이 이루어져야 한다. 책을 사고 그냥 책장에 꽂아두는 불상사를 저지르지 말자!!!

 

1부: 기초 수학: 미적분, 선형대수학, 확률 및 통계의 기본 개념들을 다룬다.

2부: 머신러닝을 위한 수학: 선형 회귀, 로지스틱 회귀, 신경망 등 머신러닝 알고리즘의 수학적 기반을 다룬다.

3부: 데이터 과학을 위한 수학: 데이터 분석, 특징 추출, 차원 축소 등 데이터 과학에서 활용되는 수학적 방법들을 다룬다.

4부: 진로 조언: 데이터 과학, 머신러닝, 인공지능 분야에서 성공적인 경력을 쌓기 위한 조언과 팁을 제공한다.

이 책은 크게 4개의 파트로 나뉘어져 있다.

 

초보자를 위한 친절한 설명: 수학에 대한 기초 지식이 없는 독자도 쉽게 이해할 수 있도록 자세하고 명확하게 설명되어 있다.

실용적인 코드 예시: 각 개념마다 실제로 사용할 수 있는 파이썬 코드 예시를 제공하여 독자들이 직접 코드를 작성하고 실행해볼 수 있도록 한다.

다양한 주제 다루기: 데이터 과학, 머신러닝, 인공지능 분야에서 핵심적으로 사용되는 수학 개념들을 다양하게 다루고 있어 관련 분야에 대한 이해를 높이는 데 도움이 된다.

진로 조언 제공: 데이터 과학, 머신러닝, 인공지능 분야에서 성공적인 경력을 쌓기 위한 조언과 팁을 제공하여 독자들의 진로 계획에 도움이 된다.

 

이 책을 읽으면서 데이터 과학, 머신러닝, 인공지능 분야에서 활용되는 수학 개념들에 대한 이해를 크게 높일 수 있었다. 특히, 실습 코드 예시를 통해 직접 코드를 작성하고 실행해보면서 수학 개념들을 실제로 어떻게 활용하는지 직접 경험할 수 있었던 것이 매우 유익했다.

또한, 책의 마지막 부분에서 제공되는 진로 조언은 앞으로 내가 데이터 과학 분야-확실히 경로를 틀지 안 틀지 모르겠지만-에서 어떻게 성장하고 발전할 수 있을지에 대한 방향을 제시해주었다.

데이터 과학, 머신러닝, 인공지능 분야에 관심이 있는 모든 사람들에게 추천한다. 특히, 수학에 대한 기초 지식이 부족하거나 코딩 경험이 없는 사람들에게도 매우 도움이 될 것이라고 생각한다.

파이썬으로 모든 것을 할 수 있는 시대에 살고 있음에 감사함을 느낀다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서

책을 제공받아 작성된 서평입니다."

제목 그대로 알아야 하는 필수 수학에 대해 다루고 있습니다. 알고리즘 문제에서도 볼 수 있듯이, 다양한 수학 문제가 나오는데 그럴 때 필요한 지식을 이 책에서 얻어갈 수 있습니다. 별책 부록으로 연습 문제와 풀이도 제공하고 있어 공부하면서 헷갈릴 때는 부록을 참고해도 좋을 것 같은 책입니다.

아직 수학으로는 그냥 문제만 풀고 넘어갔는데 코드로 작성해보고 싶은 분들과, 수학 + 신경망 내용까지 알고 싶은 분들, 기초 수학 개념을 다지고 싶은 분들께도 추천드립니다.

미적분 파트와 선형대수학에서 어려운 고유벡터와 벡터 변환은 더 꼼꼼하게 다루고 있습니다. 통계 파트도 비슷합니다!

추가로 마지막 장에서는 조언과 진로에 대한 내용도 담고 있어 꼭 읽어보시면 좋을 것 같습니다.

 

"한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 제공 받아 작성된 서평입니다."

 

개발자를 위한 필수 수학이라는 책을 받앗다. 읽어보니 개발자보다 좀 더 구체적으로는, 인공지능 분야 개발자가 맞을 것 같다. 요새 워낙 인공지능이 대세다 보니 그럴 수 있을 것 같다. 나름 넓은 난이도를 포괄하고 있는 것 같은데, 초반부는 꽤 쉬워서 고등학교 수학 수준이다. 중반부부터 조금 대학교 전공 느낌이고, 중후반부부터는 인공지능 기초 수업에서 다루는 수학 지식이라고 보면 될 것 같다. 전반적으로 나에게는 조금 쉬운 느낌이었다.

이 책은 신기한 게, 별책 부록이 있었다. 연습 문제랑 풀이를 제공한다는데, 뭔가 학생이 된 느낌이었다.

 

 

이런 식으로 맨 뒤에 별책이 있는데, 쉽게 떼어낼 수도 있어서 이것만 들고 다닐 수도 있을 것 같다. 나름 새로운 시도인 것 같은데, 좋은 것 같다. 오른쪽 사진이 예시인데, 수학 문제집을 보는 느낌이다.

 

 

옮긴이가 한빛미디어에서 정말 많은 책을 출판하(옮기)셨다. 옮긴 책중에 내가 받은 책도 꽤 있는 것 같다.

 

 

이런 기초 수학에서부터 다음 사진과 같이

 

 

인공지능 기초도 다루고 있다. 또한, 예제 코드도 있고 (쉬운 코드로) 초급자가 따라해보기 좋을 것 같다. 특히, 한글로 주석이 줄마다 되어 있어서 정말 초급자도 코드를 이해하고 따라하기 쉬울 것 같다.

 

 

위에서 기초 선형 회귀 등을 다뤘다면, 지금처럼 인공지능에서 사용되는 확률적 경사 하강법, SGD도 나오고 코드 또한 제공된다.


이 책은 기초 수학 지식부터 인공지능 초반부에 사용되는 수학 지식을 설명해주고 코드를 통해 실습을 할 수 있는 책이다. 이 곳에 나오는 수학 지식은 내가 생각하기에는 그래도 꽤 기본 지식으로 가지고 있어야 할 것 같아서, 수학 지식이 조금 부족하고 배워보고 싶다하는 사람이 있다면 추천한다. 굳이 개발자가 아니더라도 이 책을 통해 공부할 수 있을 것 같다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."


[북리뷰-IT] 개발자를 위한 필수 수학 (한빛미디어, 2024)

 

국내 은행들은 몇년전부터 디지털화에 큰 투자를 하고 있습니다.

카뱅이나 토스뱅크와 같은 디지털 은행의 등장은 기존 은행들에게 큰 경쟁 압력을 주고 있습니다.

이에 따라, 기존 은행들은 온라인 및 모바일 뱅킹 서비스를 확대하고,

고객 친화적인 앱을 출시하는 등의 노력을 기울이고 있습니다.

 

인터넷 은행이 등장할 때쯤 빅데이터라는 용어도 자주 등장하게 되었고,

빅데이터 분석을 통해 과거 데이터를 기반으로 미래의 트렌드를 예측하고,

위험을 관리하며 기회를 찾고자 많은 투자를 하고 있습니다.

 

저 역시도 트렌드에 뒤쳐지지 않기 위해, 몇년전부터 데이터분석에 대한 관심을 갖고 공부하고 있습니다.

20년전 은행에 입사당시 UNISYS 메인프레임에서의 코볼부터 시작해서

JAVA, C언어 등 다양한 언어를 다뤄왔기에, 파이썬은 어렵지 않게 다가왔지만, 

데이터 분석에 대한 공부를 할수록 수학이라는 벽에 부딪치게 되더라구요. 

 

그래.. 수학 다시 공부해보자!! 하는 의욕이 앞서

"수리통계학 개론"이라는 두꺼운 책을 주문했는데.. 의욕만 앞섰던 걸까요 ㅜㅜ 

몇 페이지 보다가, 잘 읽히지도 않고..지금은 새책 그대로 제 책장에.. ㅎ

비싼책인데 당근에 올려야 하나 고민중입니다. ㅋ

이런 전통적인 수학 서적들은 종종 이론 중심적이고 수학적 표현이 복잡하게 느껴져

저처럼 많은 개발자들을 포기하게 합니다.

 

데이터분석에 관심은 많지만, 저처럼 수학적 어려움으로 인해 한 발짝 내딛기 힘드십니까?

이젠 걱정하지 마세요! 우리를 위한 책이 나왔습니다 ㅋㅋㅋ

바로 한빛미디어에서 출간한 "개발자를 위한 필수 수학" 입니다.

 

 

 

다루어야 할 핵심 수학 개념, 하나도 빠짐없이!

 

"개발자를 위한 필수 수학"은 개발자의 입장에서 실용적인 수학 개념만을 핵심적으로 다루어 부담 없이 학습할 수 있도록 구성되어 있습니다. 또한, 파이썬 코드와 실습을 통해 배우는 방식으로 수학을 직접 코드로 구현해보면서 이해도를 높일 수 있도록 도와줍니다.

 

총 8장과 부록으로 구성되어 있고,

처음 네 개 장에서는 미적분, 확률, 통계, 선형대수학 등 데이터 과학과 머신러닝에 필수적인 수학 개념을,

마지막 세 개장에서는 선형 회귀, 로지스틱 회귀, 신경망과 같은 머신러닝 알고리즘을 이해하는 데 필요한 수학적 기반을 탄탄하게 다져줍니다.

 

  • 기초 수학과 미적분 : 변수, 함수, 합계, 거듭제곱, 로그, 극한, 미분, 적분 등 기초 수학 개념과 미적분의 기본 원리를 다룹니다.
  • 확률 : 확률의 개념, 확률 계산, 이항 분포, 베타 분포 등을 이해하고 다양한 확률 문제를 해결할 수 있도록 돕습니다.
  • 통계 : 기술 통계와 추론 통계의 개념, 모집단, 표본, 편향, 기술 통계, 추론 통계, t 분포, 빅데이터 고려 사항 등을 다룹니다.
  • 선형대수학 : 벡터, 선형 변환, 행렬 곱셈, 행렬식, 특수 행렬, 연립 방정식과 역행렬, 고유 벡터와 고윳값 등 선형대수학의 핵심 개념들을 깊이 있게 다룹니다.
  • 선형 회귀 : 선형 회귀의 기본 개념, 잔차와 제곱 오차, 최적의 직선 찾기, 과대적합 및 분산, 확률적 경사 하강법, 상관 계수, 통계적 유의성, 결정 계수, 추정 표준 오차, 예측 구간, 훈련/테스트 분할, 다중 선형 회귀 등을 다룹니다.
  • 로지스틱 회귀 : 로지스틱 회귀의 이해, 로지스틱 회귀 수행, 다변수 로지스틱 회귀, 로그 오즈 이해, R2, p 값, 훈련/테스트 분할, 오차 행렬, 베이즈 정리와 분류, ROC 곡선과 AUC, 클래스 불균형 등을 다룹니다.
  • 신경망 : 신경망과 딥러닝의 개념, 간단한 신경망, 역전파, 사이킷런 사용, 신경망과 딥러닝의 한계 등을 다룹니다.

 

 

핵심을 쏙쏙 파악하고 실무에 바로 적용하는 완벽한 구성

 

 실용적인 학습 : 모든 수학 개념들은 실제 데이터 과학 문제와 연관지어 설명되고, 실습을 통해 직접 적용해 볼 수 있도록 구성되어 있습니다. 이는 수학적 지식을 실무에 활용하는 능력을 키우는 데 큰 도움이 됩니다.

 

 명확한 정보 전달 : 복잡한 수학적 개념들을 쉽고 이해하기 쉬운 언어로 명확하게 설명하며, 다양한 도표, 그림, 예시를 활용하여 독자들의 이해를 돕습니다.

 

 코드 활용 능력 향상 : 파이썬 코드를 활용한 실습을 통해 데이터 과학에 필요한 코딩 능력을 단계별로 키울 수 있습니다.

 

워크북 제공 : 별책으로 제공되는 워크북을 통해 배운 내용을 복습하고 실력을 점검할 수 있습니다.

 

 

"개발자를 위한 필수 수학"은 데이터 과학 분야에 진출하기 위한 필수 도서입니다. 

수학적 배경이 부족하여 또는 수학적 어려움으로 인해 데이터 과학을 꿈꾸는 것을 포기하지 마세요. 

이 책을 통한다면, 누구나 수학과 통계에 대해 조금 더 편안하게 이야기하고, 필요한 지식을 얻을 수 있을 것 같습니다. ^^

 

  "한빛미디어에서 제공하여 작성한 서평입니다." 

 

파이썬으로 수학 관련 코드를 짜보며 구현도 연습할 수 있어서 좋습니다. 

 

 

현대 개발자에게 있어 수학은 필수적인 도구이다.

데이터 과학과 머신러닝의 핵심 원리와 알고리즘은 수학적 개념에 뿌리를 두고 있다.

 

미적분, 확률, 통계, 선형대수학 등의 기초 수학 개념을 이해하면

머신러닝 모델과 알고리즘의 작동 원리를 깊이 있게 이해할 수 있으며, 수학적 도구를 활용해 데이터 분석 및 모델링 문제를 효과적으로 해결할 수 있다. 또한, 모델의 결과를 해석하고 설명할 수 있는 능력을 갖출 수 있다.

 

이 책은 미적분, 확률, 통계, 선형대수학을 포함한 기초 수학을 설명하고, 이러한 수학적 원리가 선형 회귀, 로지스틱 회귀, 신경망과 같은 데이터 과학 기술에 어떻게 적용되는지 보여준다.

개발자를 위한 필수 수학은 기초 수학 개념을 쉽게 이해할 수 있도록 설명하고, 파이썬 코드와 라이브러리를 활용하여 실제 데이터 과학 문제를 해결할 수 있도록 실용적인 방법을 제공한다. 또한, 기술 통계와 가설 검정을 통해 통계적 유의성을 해석하고, 데이터 과학자로서의 경력을 쌓는 방법과 실무에서의 주의사항 등의 진로에 도움되는 조언을 제시한다.

 

저자인 Thomas Nield는 데이터 분석, 머신러닝, 수학적 최적화, AI 시스템 안전 등의 분야에서 강의하며, 복잡한 기술 개념을 쉽게 풀어내는 것으로 정평이 나 있다. 이 책은 그가 다년간의 경험을 바탕으로 집필한 실용적 수학 안내서로, 개발자들이 데이터 과학의 세계에서 성공적인 첫걸음을 내딛을 수 있도록 돕는다.

 

'개발자를 위한 필수 수학'은 발간 이후 아마존 선형대수학, 미적분 분야에서 베스트셀러로 선정되었다. 개발자들이 데이터 과학과 머신러닝에 필요한 수학 개념을 체계적으로 배우고자 하는 강한 수요가 반영된 것이다.

토마스 닐드의 명확한 설명과 실용적인 접근 방식이 많은 독자들에게 높은 평가를 받으며, 필수적인 참고서로 자리매김하게 되었다.

 

​'개발자를 위한 필수 수학'은 데이터 과학과 머신러닝에서 탁월한 성과를 내기 위해 필수적인 수학 개념을 이해하고 이를 실제 문제에 적용하는 방법을 안내하는 책이다.

이 책은 기초 수학부터 시작해 회귀 모델, 신경망 등 고급 주제까지 포괄적으로 다루며, 수학적 개념이 데이터 과학 기술에 어떻게 적용되는지 설명한다. 이 책을 통해 수학의 기초를 탄탄히 다지고, 데이터 과학의 현황과 실용적 인사이트를 얻게 될 것이다.

 

이 책은 이론적인 설명에 그치지 않고, 파이썬을 활용한 실습을 통해 수학 개념을 실제로 적용하는 방법을 배운다.

파이썬 코드와 라이브러리를 사용해 미적분, 확률, 통계, 선형대수학의 기초 개념을 직접 실습하며, 선형 회귀, 로지스틱 회귀, 신경망 모델을 파이썬으로 구현하고, 실제 데이터에 적용해본다.

그리고 기술 통계와 가설 검정을 통해 p 값과 통계적 유의성을 해석하고, 다양한 데이터 과학 문제를 해결하는 방법을 배운다.

 

| 대상 독자

- ​데이터 과학과 머신러닝에 관심 있는 개발자

'개발자를 위한 필수 수학'은 데이터 과학과 머신러닝에 관심 있는 개발자를 위해 쓰여졌다. 복잡한 수학 개념을 쉽게 풀어 설명하며, 개발자들이 데이터 과학의 핵심 개념을 이해하고 실제 문제에 적용할 수 있도록 돕는다.

개발자들은 이 책을 통해 수학적 기초를 탄탄히 다지고, 데이터 과학과 머신러닝 분야에서 두각을 나타낼 수 있는 능력을 갖출 수 있다.

 

- 데이터 분석 실무자 및 관련 분야 전문가

이 책은 데이터 분석 실무를 맡고 있는 데이터 엔지니어, 데이터 과학자, 머신러닝 엔지니어, 통계 전문가를 대상으로 한다.

실무에서 수학적 개념을 적용하는 방법을 배우고자 하는 이들에게 최적의 가이드를 제공한다. 또한, 통계적 유의성을 해석하고, 머신러닝 모델을 구축하며, 데이터 분석에 수학적 도구를 활용하는 방법을 배울 수 있다.


| 목차
1. 기초 수학과 미적분
정수론, 연산 순서, 변수, 함수, 합계, 거듭제곱, 로그, 오일러 수와 자연로그, 극한, 미분, 적분 등을 다루며, 기초 수학 개념을 탄탄히 다진다.

2. 확률
확률 이해하기, 확률 계산, 이항 분포, 베타 분포 등을 설명하며, 확률 이론과 그 응용을 배운다.

3. 기술 통계와 추론 통계
데이터의 정의, 기술 통계와 추론 통계, 모집단과 표본, 기술 통계, t 분포, 빅 데이터 고려 사항 등을 다룬다.

4. 선형대수학
벡터, 선형 변환, 행렬 곱셈, 행렬식, 특수 행렬, 연립 방정식과 역행렬, 고유 벡터와 고윳값 등을 설명한다.

5. 선형 회귀
기본 선형 회귀, 잔차와 제곱 오차, 최적의 직선 찾기, 과대적합 및 분산, 확률적 경사 하강법, 상관 계수, 통계적 유의성, 결정 계수 등을 다룬다.

6. 로지스틱 회귀와 분류
로지스틱 회귀의 이해와 수행 방법, 다변수 로지스틱 회귀, 로그 오즈 이해, R², p 값, 훈련/테스트 분할, 오차 행렬, 베이즈 정리와 분류, ROC 곡선과 AUC 등을 설명한다.

7. 신경망
간단한 신경망, 역전파, 사이킷런 사용법, 신경망과 딥러닝의 한계 등을 다룬다.

8. 경력 조언과 앞으로의 진로
데이터 과학의 재정의, 데이터 과학의 역사, 나만의 강점 찾기, 데이터 과학 직무 주의 사항, 꿈의 직업, 향후 진로 등을 안내한다.

9. 별책 부록 워크북
이 책에는 각 장에서 배운 개념을 복습하고 심화 학습할 수 있는 별책 부록 워크북이 포함되어 있다.

워크북은 다양한 연습 문제와 실습 예제를 통해 독자들이 배운 내용을 실제로 적용해 볼 수 있도록 도와준다.

심파이로 수학식 표현하기, 밑바닥부터 이항 분포 및 베타 분포 구현하기, 베이즈 정리 유도하기, CDF와 역CDF 구현하기, e를 사용해 시간 경과에 따른 사건 확률 예측하기, 언덕 오르기와 선형 회귀 및 로지스틱 회귀, 선형 계획법에 대한 간략한 소개, 사이킷런을 사용한 MNIST 분류기 등 다양한 주제를 심화 학습할 수 있다.

 

이 책은 기초 수학 개념부터 시작하여 데이터 과학과 머신러닝의 고급 주제까지 단계적으로 학습할 수 있도록 구성되어 있다.

각 장은 독자가 점진적으로 복잡한 개념을 이해할 수 있도록 설계되어 있으며, 기초 수학 개념을 탄탄히 다진 후, 이를 실제 데이터 과학 문제에 적용하는 방법을 배울 수 있다.

 

'개발자를 위한 필수 수학'은 발간 이후 많은 독자들로부터 호평을 받았다. 데이터 과학과 머신러닝 분야에서 성공적인 첫걸음을 내딛고자 하는 독자들에게 필수적인 가이드를 제공한다.

이 책을 통해 독자들은 수학적 기초를 탄탄히 다지고, 실무에서 데이터를 분석하고 모델을 구축하는 능력을 기를 수 있다. 또한, 경력 개발과 진로 선택에 필요한 유용한 조언을 얻을 수 있다.

 

개발자를 위한 필수 수학은 데이터 과학과 머신러닝에 필요한 수학적 기초를 다지고, 이를 실제 문제에 적용하는 데 필요한 실질적인 도구와 인사이트를 제공하는 완벽한 안내서이다.

 

탄탄한 수학 개념 이해로 시작하는 데이터 과학 첫걸음, 
지금 바로 시작하세요!


본 포스팅은 한빛미디어 <나는 리뷰어다> 
활동을 위해서 책을 제공받아 작성된 서평입니다.

결제하기
• 문화비 소득공제 가능
• 배송료 : 2,000원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

리뷰쓰기

닫기
* 상품명 :
개발자를 위한 필수 수학
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
개발자를 위한 필수 수학
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
개발자를 위한 필수 수학
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실

최근 본 상품1