파이썬을 활용한 금융 분석

spaci***l2022-05-09

[서평] 파이썬을 활용한 금융분석, 한빛미디어 ~금융공학, 머신러닝, 퀀트 분석, 매매시스템 구현까지

한빛미디어 나는 리뷰어다 자격을 통해 파이썬을 활용한 금융 분석 2판을 읽을 수 있었다.

전반적으로 두꺼운 책이 따라하기 용으로도 좋았고 레퍼런스 용도로도 좋았다.

책에서 파이썬 문법부터 금융 공학, 머신 러닝, 퀀트 투자 등등 까지 상세하게 알려주고 있으므로 파이썬을 처음 다뤄보는 사람이라도 따라하면서 배울 수 있게 구성되어 있었다.

요즘은 파이썬을 통해서 해외의 많은 대형 투자은행들이 위험 관리 시스템이나 트레이딩 시스템을 구축하고 있다고 한다.

국내에서도 ELS, DLS 같은 파생상품 업무를 제대로 수행하기 위해서는 파이썬의 분석 라이브러리나 고성능 계산 구현 능력이 필수적이라는 것을 인식하기 시작했다고 한다.

이 책은 파이썬 언어의 기초부터 금융 분석 작업의 핵심 그리고 최종 매매 시스템을 만드는 것 까지 모두 망라한 일종의 입문서나 쿡북 (cook-book) 에 가깝다.

금융 분냐 현업 주식 트레이딩을 공부하는 학생들 뿐 아니라 이 분야엥 관심을 두고 개인적으로 공부하려는 많은 독자분들이 파이썬의 다양한 기능을 살펴볼 수 있는 더할 나위 없는 재미있는 경험을 할 수 있는 기회가 될 수 있다 생각이 든다.

1장. 왜 금융 분석에 파이썬을 사용하는가 에서 부터

2장. 파이썬 기반 구조,

3장. 자료형과 자료구조,

4장. NumPy를 사용한 수치 계산,

5장 pandas를 사용한 데이터 분석,

6장 객체지향 프로그래밍,

7장 데이터 시각화,

8장 금융 시계열,

9장 입출력 작업,

10장 파이썬 성능 개선,

11장 수학용 도구,

12~13장 확률과 통계 분석,

14장 FXCM 트레이딩 플랫폼,

15장 매매 전략,

16장 매매 자동화,

17장 가치 평가 프레임워크,

18장 금융 모형 시뮬레이션 까지.

파이썬을 통한 금융 분석의 모든 내용을 총 망라하고 있다고 볼 수 있다.

현재 파이썬은 데이터와 인공지능이 주도하는 금융 분석 분야에서 대표적인 프로그래밍 언어로 사용되고 있다.

일부 대형 투자은행과 헤지펀드는 파이썬을 핵심적인 거래 시스템과 위험 관리 시스템 구축에 활용하고 있다.

이 책을 통해 파이썬과 파이썬 생태계가 금융업에 종사하는 기업과 개인에게 제공하는 기술적인 틀을 익혀나가는 계기가 될 수 있을 것으로 생각이 든다.

이 글은 한빛미디어 나는 리뷰어다 자격으로 작성되었습니다.

mwle***l2022-04-25

(리뷰) 파이썬을 활용한 금융분석

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

책제목 : 파이썬을 활용한 금융분석

저자 : 이브 힐피시

옮김 : 김도형

출판년도 : 2016/06/01 (초판), 2022/03/31 (2판)

책을 읽기 전에...

파인썬은 예전부터 관심이 있었다.

파이썬만 공부하기에는 재미가 없어서 파이썬과 연계해서

몇가지 책을 읽었는데 "파이썬을 활용한 금융공학 레시피"와 "파이썬을 이용한 비트코인 자동매매" 등 이었다.

파이썬 언어와 연계해서 주식, 비트코인을 잘 활용할 수 있어서 요즘같은 시대에

꽤 흥미로운 주제라서 재미있게 공부할 수 있었다.

이 책은 파인썬을 좀 더 잘 활용하고 좀 더 깊이있게 보고싶어서 선택한 책이다.

책의 내용...

이 책은 파이썬의 기초부터 금융공학, 머신러닝, 퀀트 분석, 매매 시스템 구현까지

기초부터 활용까지 파이썬을 활용한 금융분석에 대한 책이다.

초판은 좀 오래되었지만 이번에 파이썬 3에 맞게 업데이트 되어 재판 되었다.

총 5개의 파트로 내용이 나누어져 있다.

Part 1 파이썬과 금융

대화형 금융 분석 및 애플리케이션 개발을 위한 파이썬 입문.

기본적인 파이썬에 대한 소개와 금융에서 쓰이는 기술들,

그리고 금융공학을 위한 파이썬의 효율성과 생산성,

파이썬의 기반구조에 대해 설명한다.

Part 02 파이썬 기초 정복

파이썬 자료형 및 자료구조, NumPy, pandas와 DataFrame 클래스, 객체지향 프로그래밍.

파이썬의 기본 문법과 많이 활용되는 API들의 사용법. 파이썬의

객체지향 프로그래밍에 대해 설명한다.

Part 03 금융 데이터 과학

데이터 시각화, 금융 시계열 데이터, 데이터 입출력 작업, 머신러닝을 위한 파이썬 기술.

데이터들을 시각화 하고 통계 및 상관관계를 분석하는 방법,

DB나 CSV, 엑셀 등 입출력 방법, 파이썬 성능 개선 및

수학용 도구 사용방법, 확률과 통계 분석 방법에 대해 설명한다.

Part 04 알고리즘 트레이딩

파이썬을 사용한 백테스팅 및 자동화된 알고리즘 트레이딩 전략 배포.

데이터를 받아 계좌연동 및매매 전략 세우는 방법,

그리고 알고리즘으로 매매를 자동화 하는 방법들에 대해 설명한다.

Part 05 파생상품 분석

옵션 및 파생상품 가격결정, 위험 관리를 위한 강력하고 유연한 파이썬 패키지 개발.

가치평가를 위한 프레임 워크와 금융 모형 시뮬레이션에 대한 설명을 시작으로

파생상품 가치 평가 클래스 제작, 포트폴리오 가치평가, 시장기반 가치평가에 대해 설명한다.

책을 읽고나서

책 자체의 내용은 꽤 알차고 흥미로운 주제로 잘 나열되어있다.

만약 파이썬의 완전 초보자가 해당 책을 보려 한다면 좀 더 얇고 가벼운 책을

추천하고 싶다.

이 책은 기초부터 알려주는 책이긴 엄청난 두께와, 딱딱한 디자인으로 이루어져 있고

번역서다 보니 기타 구내 입문서들에 비해 쉽게 읽기는 힘들긴 하다.

오렐리 특유의 흑백느낌의 동물 이미지는 전공도서를 많이 접하는 나의 경우

익숙하고 반갑긴 하다.

오렐리 책 답게 책의 내용은 무척 알차고 유용한 정보로 가득하다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

nanhmjj***l2022-04-25

파이썬을 활용한 금융 분석

금융 데이터 분석에 Python을 어떻게 활용할 수 있는지 정리한 기술서로 확률 과정과 통계 분석 등 데이터 과학에 필요한 지식을 습득할 수 있으며 나아가 알고리즘 트레이딩과 파생상품 분석의 기초를 다루고 있다.

Python 스킬과 금융 공학이라는 두마리 토끼를 잡을 수 있는 책이다.

보통 두가지 주제를 한 번에 다루다 보면 어느 한 쪽을 깊이 다룰 수 없는 트레이드 오프가 발생하기 마련인데 대략 800페지이에 달하는 분량과 5개 파트, 21개 챕터에 이르는 방대한 양의 내용이 어느정도 트레이드 오프의 단점을 상쇄하고 있었다.

파트는 5개이지만 크게 세부분의 내용으로 압축할 수 있다.

파트1, 2의 내용은 Python 스킬을 키우는데 집중한다. 파트3는 Python과 금융공학의 교집합에 해당하는데 금융 공학으로 넘어가기 전 데이터 과학을 다룬다. 마지막으로 파트4,5는 알고리즘 트레이딩과 파생상품을 분석하고 있어 금융공학 입문을 맛볼 수 있다.

먼저 파트1, 2를 소개하자면 금융 데이터 분석에 초점을 맞춰 도메인 영역을 한정짓고 다른 언어 대비 Python만의 독특한 기능을 중심으로 간명하게 정리하고 있기에 읽기 편하고 빠르게 핵심에 집중할 수 있다는 것이 장점이라는 생각이 들었다.

51 ~ 52p에 걸친 코드 예제는 Python이 얼마나 유연하고 다양한 기능을 갖추었는지 보여주는 대표적인 예제이다.

일반적인 방법으로 Python 코드를 구현한 실행 시간은 1.6초이다. 이어 Numpy 라이브러리 Vectorization을 활용한 결과가 88밀리초로 줄어듬을 보여준다. numexpr을 활용하여 50밀리초로 성능을 개선한 후 멀티스레드를 활용하여 23밀리초로 실행 속도를 향상시킨다.

알고리즘이나 업무도메인 지식없이 Python 자체 제공 기능만으로 이런 성능 개선이 가능하다는 점은 Python 라이브러리가 제공하는 기능이 얼마나 다양한지 보여주는 단례이자 유연성과 고성능에 대한 생태계의 노력을 보여주는 한 단면이다.

이어서 로그수익률이나 SVM과 같은 간단한 머신러닝 알고리즘을 적용한 예제를 구현하는 실습이 이어지는데 Python이 금융 분석에 어떻게 활용될 수 있는지 빠르게 감을 잡기에 좋게 구성되어 있다.

Conda, Docker, Droplet 클라우드 서비스로 단 몇 분 만에 금융 데이터 분석 인프라를 구성할 수 있음을 보여줌으로써 앞으로 이어질 실습환경을 빠르게 구성할 수 있음은 물론 Python이 왜 금융 데이터 분석에 최적화되어있는지 간명하게 소개하고 있다.

파트2에는 Python만의 독특한 문법과 기능이 소개된다. 특히 다른 언어에 익숙하나 Python이 처음인 프로그래머들이 적응하기 좋게 구성되어 있다.

for문과 같은 루프문에서 별도의 카운터 변수 - for문을 돌며 몇번째 루프인지 파악하는 용도의 숫자 변수 - 를 활용하지 않고 리스트 객체를 활용하는 것은 Python 세계로 처음 넘어온 프로그래머들의 첫번째 생소함인데 이를 빼놓지 않고 언급하고 있다.

table, list, dict, set과 같은 다른 언어에 내장되지 않은 자료구조를 소개한 점도 맥락이 동일하다. 부동소수점 정밀도와 관련된 의도하지 않은 계산 결과, 문자열과 format, re 정규표현식 라이브러리 등 Python만의 독특한 점이 잘 소개되어 있다.

다른 언어 대비 절대 강점을 가지는 Numpy, Pandas 라이브러리는 각각 하나의 챕터를 활용하여 깊이있게 다루고 있으며 파트의 마지막 장에서 객체지향을 알아봄으로써 타 언어 대비 Python의 차이점을 최종적으로 정리해 볼 수 있다.

파트3는 데이터 과학을 다루는 장이다. 상대적으로 익히기 쉽고 직관적으로 빠른 이해가 가능한 시각화 파트를 먼저 다루고 있어 독자의 부담을 줄여준다. 특히 무분별한 시각화가 아닌 도메인이 금융 분야로 한정되어 있다. 덕분에 RSI와 같은 주식 지표를 시각화하는 방법을 쉽게 습득할 수 있었다.

시각화 부분을 1차원, 2차원, 정적3차원, 상호 2차원 등의 분류로 적절히 잘 나누고 있어 향후 각 aixs나 색상 등의 속성에 어떤 값을 연결해야 하는지 초보자가 직관적으로 이해할 수 있도록 분류한 구성이 마음에 들었다.

Pandas와 시계열을 잘 조합하여 설명한 부분도 마음에 들었다. 특히 금융분석은 시계열 그 자체이므로 Dataframe의 rolling 등의 기능에 능숙해져야 하는데 시계열을 중심으로 기능을 집중적으로 설명하고 있어 금융 분석에 도움이 될 수 있는 괜찮은 학습서라는 생각이 들었다.

다양한 포맷의 I/O 또한 데이터 분석을 어렵게 만드는 장애물 중 하나인데 HDF5, Pickle 직렬화, SQL, Numpy, file, csv, Pytables 등 어떠한 형태의 데이터일지라도 DB, File 가리지 않고 쉽고 빠르게 저장, 발췌를 가능하게 할 수 있도록 통합적으로 기술을 잘 정리하고 있다. 특히 out-of-memory 연산을 지원하는 TsTables이 소개되어 있어 더욱 마음에 들었다.

이어 다른 프로그래밍에서 다루는 자료구조 대비 한 차원 뛰어넘은 데이터 과학에서 자주 활용되는 독특한 자료구조를 알아본다. 원주율, 이항트리, 몬테카를로 시뮬레이션 등의 표현을 훈련하며 수학에서 활용하는 회귀법, 보간법, 최적화 내지 미적분을 Python으로 구현하는 방법을 습득하여 데이터 과학에 한걸음 더 접근해 나간다.

파트의 마지막은 12장의 확률 과정과 13장의 통계분석이 소개되는데 개인적으로 이 책에서 가장 마음에 든 부분이다.

전통적인 금융 공학 기법에서 닫힌 공식을 유도하기 위해 노력했던 것에서 탈피하여 확률 과정을 통한 몬테카를로 시뮬레이션이 유행하게 된 패러다임의 변화를 잘 소개하고 있으며 어려운 확률 분포들을 잘 정리하고 있었다.

파트 4,5에서 어이서 학습하게 될 기초 지식인 기하 브라운 운동 모형, 유러피안 옵션, 확률적 변동성 모형, 블랙-숄즈-머튼 모형 등의 기초 금융공학을 확률 과정과 잘 조화하여 소개하고 있다.

통계 분석에서는 정규성 검정, 프트폴리오 검정, 베이즈통계학, 머신러닝 등의 주제를 다룬다. 그동안 쉬운 데이터를 예제로 삼아 Q-Q 플롯을 그려는 봤어도 언제 실용적으로 써먹을 수 있는지 접할 기회가 적었는데 책이 금융 분야의 도메인을 다루다 보니 보다 실무적으로 깊이있는 활용 방법을 알 수 있어 유익했다.

아래 그림은 수익률이 정규분포를 따른다는 것을 가정한 후 가정이 맞는지 확인하는 정규성 검정의 예이다. 정규성검정

파트4부터는 본격적인 금융 공학을 다루기 시작한다. 알고리즘 트레이딩 파트는 FXCM이라는 프레임워크를 활용하여 일봉, 월봉 등의 정보를 가져와 기본적인 시세 차트를 만들어 본다든가 이평선, 선형회귀, 기본적인 머신러닝 방향성 예측 등을 활용하여 매매를 체결하는 API 호출 실습 등을 진행한다.

특히 16장은 시장의 방향을 예측한 전략을 배포하는 방법이나 자금 관리, 위험 평가를 위한 벡테스팅, 로깅 등의 일련의 과정이 잘 정리되어 있어 마음에 드는 구성이었다.

하지만 전반적으로 심도 깊은 알고리즘 트레이딩 기법이 소개되지 않아 약간은 아쉬웠다. 실제 현업에서 퀀트가 전략을 어떤 식으로 발굴하는지 이를 어떻게 구현하며 확장성 있는 시스템으로 흡수되는지 일련의 과정이 포함되어 있었다면 그래서 독자가 자신의 아이디어를 시스템화 할 수 있도록 친절하고 상세히 안내되어 있었다면 이 책은 더욱 뛰어난 양서가 되었을 것 같다는 생각이 든다.

파트5에서는 금융 공학의 큰 뿌리를 구성하는 파생상품 분석을 다룬다. 먼저 기본적인 가치 평가 프레임워크 DX를 설명하고 금융 모형을 시뮬레이션하는 방법을 소개한다.

특히 기하 브라운 운동, 점프 확산 모형, 제곱근 확산 모형 등을 하나씩 구현하고 적용 결과를 눈으로 확인하면서 금융 공학의 기초가 무엇인지 조금이나마 이해할 수 있어 유익했다.

이어서 파생상품, 포트폴리오, 시장 기반 등의 가치 평가 방법도 하나씩 소개되고 있는데 금융 공학에서 다루는 기초 입문 과정을 주제별로 구현해보는 기회를 가질 수 있다.

다만 아무리 금융 공학의 기초 지식이라 해도 금융 공학에 기본 이론 지식이 없다면 파트5에서 말하고자 하는 내용을 쉽게 이해하긴 어려울 것이다. 저자가 서문에 안내한 바와 같이 어느 정도의 금융 관련 기초 지식이 필요하다.

정리하자면 이 책은 금융 공학에 관련된 지식이 전무한 능숙한 프로그래머에게 가장 적합한 책일것 같다는 생각이 든다. 또는 금융 공학과 관련된 충분한 이론 및 지식을 갖추고 있고 어느정도의 프로그래밍 스킬을 보유하고 있지만 보다 금융 도메인에 특화된 스킬을 쌓고 싶은 이에게도 도움이 될 것 같다.

Python만 다루는 책이나 금융 분석만 다루는 책은 많겠지만 이 두 주제의 교집합을 적절히 심도있게 다루는 책은 드물다는 점이 이 책의 가치를 높이는 요소라 생각한다.

금융이라는 도메인 영역이 한정되어 있어 Python의 방대한 주제를 좁혀주고 더욱 심도있게 집중할 수 있게 해주는 점 또한 장점이다.

더불어 왠만한 입문서 뺨치게 Python의 기초를 핵심만 쏙쏙뽑아 스킬을 잘 전달하고 있으며 금융이라는 주제에 특화된 데이터 과학이 무엇인지 잘 전달하고 있기에 금융, Python, 데이터 과학 중 어느 하나에만 관심있는 독자일지라도 큰 도움을 받을 수 있을만한 양서라 확신한다.

책소개 - 파이썬을 활용한 금융 분석

applej***l2022-04-11

파이썬을 활용한 금융분석으로 야, 너도 할 수 있어!

파이썬, 퀀트, 매매, 금융 빅데이터, 금융공학, 대체 금융과 파이썬이 무슨 상관이 있어?

... 이게 다 뭐야!!! 하던 당신이라면 잘 들어왔습니다. ଘ(੭ˊ꒳ˋ)੭✧

<파이썬을 활용한 금융분석(2판)>은 금융분석에서 왜 파이썬을 쓸까? 에서부터 시작하거든요!

이 표지의 주인공인 솔레노돈이라는 포유류는 밖으로 나올 때는 겁이 많아 보이고 달리다가 발을 헛딧는다고 합니다.

하지만 밤이 되면 청각이나 후각, 촉각이 발달하는데.. 난 파이썬도 모르고, 금융 빅데이터도 모르고, 트레이딩도 모르고, 금융 알고리즘도 모른다 하시는 분들은 791p에 달하는 이 섬세하고 친절한데 사려깊은 책을 집접 실습해보며 공부한다면 이젠 솔레노돈처럼 두렵지만 두렵지 않는 파워를 가지게 되실거에요!

가장 흥미로웠던 매매 전략 파트!

이 책의 장점은 단계에 따른 설명이 명확하다는 것!

또한 실습을 시각화해서 내가 직접 해본 것과 비교해볼 수 있다는 것!

단순히 코드만 딱 올려놓아서 대체 결과가 어떤지 나와 어떤 부분이 다른지 헤메지 않아도 되서 편안해지는 책!

베이즈 회귀는 개념적으로만 아 이런 거였지 하고 어디서 들어봤는데 했었는데, 설명이 친절했다!

이 외에도 총 791p 분량이라 생략하는 것 없이 함수에 따른 인자도 설명해주는 친절함이 녹아있는 책이다.

방대한 양에 겁먹지 말고 차근차근 재미를 붙이며 읽기 좋았다.

서점에서 이 빨간 책을 발견하신다면 '야! 너 내가 읽었어! 아주 고맙다!' 하고 인사를 날려줄만한 책입니다 d=(´▽｀)

hye***l2016-07-08

금융 데이터 분석을 위한 실습용 교재로 추천

목차만 약 5~6장으로 대략 680 페이지 정도의 분량으로 이론보다는 실습 위주로 금융 분석을 위한 파이썬의 기능을 소개한다. 분량이 많은 만큼 금융 분야에 전반적으로 활용가능한 다양한 예시를 다룬다.

전체적인 학습 방향은 파이썬의 기능을 활용하여 금융데이터의 분석을 용이하게 하는 것이다. 책의 초반은 기본적인 환경설치 및 금융 데이터를 다루기 위한 자료구조와 필요한 라이브러리의 기능를 학습한다. 실습위주의 책이기 때문에 금융 분석과 관련된 상세한 이론적인 내용은 다루지 않는다. 후반부로 가면서 금융 주제로 데이터를 분석하는 것에 초점을 두고, 데이터 분석에 관련한 다양한 예제를 다룬다.

(* 원서는 2014년에 O'Reilly에서 발간된 Python for Finance 이며, 책이 번역 및 출간 된 시기가 2016년이다. 그렇다보니 번역자가 서문에 언급한대로, 동작하지 않는 몇몇 예제가 있다. )

실습을 하면서 번역자의 친절함을 느낄 수 있었다. 원서는 리눅스 환경에서 구동되는 예제를 보여주기 때문에 간혹 윈도우와 명령어가 다른 경우가 있는데, 그럴 때마다 친절하게 주석으로 윈도우용 명령어를 달아주고, 원서가 몇 년 전에 출간된 것을 고려하여 실습 예제가 다소 오래된 방식인 경우엔 더 나은 방법을 제시해준다. 목차에서도 불 수 있듯이 데이터 시각화는 물론 엑셀과 연동도 할 수 있고, 웹 관련 서비스도 구축할 수 있기 때문에 데이터 활용 측면에서 실로 활용방도가 높은 책이다. 일종의 cookbook이라 볼 수 있기에 필요한 경우 하나 하나 실습을 해보면서 분석방법을 익히기에 좋은 책이다.

요약하자면, 예전 책인 만큼 최신 내용을 반영하지는 않았으나 금융 데이터 활용에 관련한 기본적인 실습에는 충실한 책이다.

해당 책과 유사한 주제를 다루는 책으로 [머신러닝을 이용한 알고리즘 트레이딩 시스템 개발- 안명호, 류미현 저(한빛미디어,2016)]가 있다. 또한 (본 책의 참고 서적란에도 나와있지만) 파이썬의 기초 기능들을 다루는 부분은 [파이썬 라이브러리를 활용한 데이터 분석(수정보완판)-웨스 맥키니(한빛미디어,2013)] 을 참고하면 비단 금융 뿐만 아니라 다양한 데이터 분석을 위한 활용도 측면에서 도움이 될 것이라 생각한다.

사전에 수학, 통계학적 지식을 갖춘 금융공학도 및 해당 분야에 관심있는 독자들에게 추천하는 책이다. 파이썬에 관해서 어느정도 기본기만 있다면 실습하는 데에 문제는 없을 것이다.