오래전에 과외도 해보고, 속셈학원에서 알바도 해봤는데, 학생들이 수학을 공부하는 방법을 보면, 얼추 성적이 예상된다. 그냥 시간 때우고, 마지못해 공부하는 애들은 바닥권이 당연했고, 그래도 수업 따라오고 그러면 중간은 한다. 그런데 이 중간권의 수학 공부 방법이 참 문제가 많다. 한마디로 효율이 나쁜 경우가 많다. 그냥 무조건 공식 암기하고, 다다익선이란 생각으로 문제집만 많이 풀어 보려고 한다. 이 방법의 가장 큰 허점은 안 풀어 본 유형의 문제는 손도 못 댄다. 물론 풀어 봤다고 해도 다 기억 못 하는 것도 문제이긴 하다.
반면, 수학 점수 높은 애들은 수학 공식의 의미부터 제대로 이해하고 있다. 소위 하나를 가르쳐도 열은 안다. 친구 중에 과기대를 간 친구가 그런 유형이었다. 수학 시간에 선생님 방법보다 자기 방법이 더 빠르다고 하는 애였다. 문제집도 한 가지 정도만 풀었다. 가르친 애 중에도 비슷한 애가 있었다. 수학을 즐겼다. 당연히 성적은 상위권.
이런 이야기를 하는 이유는 원리나 개념 이해가 수학에서는 매우 중요하다는 이야기를 하고 싶어서다. 개념을 제대로 이해하면, 머릿속에도 오래 남고, 제대로 적용하는 것뿐만 아니라, 다양한 응용 아이디어도 얻을 수 있다. 비슷한 주제의 책을 봤을 때, 보다 빠르게 이해할 수도 있다. 현재 수학이 어렵고, 해도 늘지 않는다면, 문제 풀이보다는 개념 이해 이해 쪽으로 방법을 바꿀 필요가 있다는 것이다.
인공지능, AI에도 통계학, 미적분학, 선형대수학, 그래프이론 등 다양한 수학이 쓰인다. 그냥 라이브러리 쓰면 되지 않나 할 수 있으나, 아직 AI 쪽은 날 것에 가까워서 손댈 것도 많고, 어떤 방법이 쓰였는지 좀 알고 있어야 제대로 적용해서 원하는 결과를 얻을 수 있다. 그냥 따라만 하는 것은 아까 말한 이 문제집, 저 문제집 푸는 것과 같다. 어쩌다 맞을 수 있지만, 이건 효율 면에서 엉망이다.
아무리 급하다고, 바늘허리에 실 매어 쓸 수는 없다. 급할수록 돌아가라는 말도 있다. 기초가 부실하면, 높이 쌓아 올릴 수 없다. 여기에 딱 안성맞춤인 책이 할라 넬슨의 'AI를 위한 필수 수학'이다. 인공지능 관련 수학을 공부하거나 AI를 좀 더 깊게 이해하고자 하는 사람에게 강력 추천하고 싶은 책이다.
일단 필수 수학이란 제목만 보고 미리 겁먹을 필요 없다. 수학을 전혀 모른다면 읽기 어렵겠지만, 적어도 고등학교 수학 시간에 졸지 않아서 용어 정도는 들어 봤다 수준은 되어야 한다. 대학에서 편미분 포함한 교양 수학 또는 공업수학을 공부했다면, 'AI를 위한 필수 수학'을 보는데, 보다 수월할 것이다.
그러나 '난 문과라서 힘들겠네'하고 너무 실망하지 않아도 된다. 책 속에 많은 수학 공식이 등장하지만, 이것을 증명하거나 문제를 풀고 그러지는 않는다. 심지어 그 흔한 파이썬 코딩도 안 나온다. (본문에는 코드가 없으나 알고 싶을 사람을 위해 참고 주소 정도는 있다.) 어디까지나 인공지능에서 수학이 어떻게 쓰이는지 원리와 개념을 설명하고, 어떻게 응용하는지에 집중하고 있다. 수학 공식 잘 모르더라도 일단 읽어보면, 전혀 몰랐던 수학들이 어렴풋이 이해가 되기 시작할 것이다. 전반적으로 이해하는 것이 중요하며, 나중에 더욱 구체적으로 공부하면 된다고 생각한다.
역으로 수학에 자신 있다고 해도, 우습게 생각할 책이 아니다. 2차 함수 안다고 해서, 손전등 반사경, 대포 포탄 궤적 등에 바로 적용하지 못하는 것과 같이 통계, 선형대수, 미적분 등 수학을 많이 안다고 해도 바로 인공지능에 응용하기는 쉽지 않다. 경험자의 조언을 통해 어떻게 쓰는지 그 방법을 따로 배울 필요가 있다. 'AI를 위한 필수 수학'이 그런 것들을 보다 이해하기 쉽게 그리고 매우 자세히 알려주고 있다.
책 소개에 순서와 관계없이 읽어도 좋다고 되어 있으나, 빠르게라도 'AI를 위한 필수 수학' 맨 앞부분에 있는 '이 책에 대해서'와 챕터 1, 2장은 먼저 보는 쪽을 권하고 싶다. "이 책에 대해서'에는 챕터 14개의 주요 내용도 요약되어 있고 추천도서, 이 책의 목적 같은 것이 들어 있고, 챕터 1, 2장은 인공지능 수학을 배워야 하는 이유와 가장 기초적인 것들이 매우 잘 요약되어 담겨 있기 때문이다.
'AI를 위한 필수 수학'에서는 신경망, 비전, 이미지 처리, 자연어 처리, 트랜스포머, 딥러닝, 머신러닝, 강화학습, 인공지능의 법률과 윤리적 문제까지 대부분의 인공지능 파트들을 다 다루고 있다. 단지 수학을 중점적으로 다루고 있을 뿐이다.
인공지능에 있어, 최적화는 기본이면서 매우 중요한 부분이다. 최적화를 위해 통계뿐만 아니라, 미적분과 행렬, 경우에 따라 벡터도 활용된다. 인공지능이 답을 찾는 모습을 보면, 불필요한 자료를 걸러는 내는 과정과도 같다. 그걸 위해 각종 수학이 사용된다.
학창 시절 죽어라 미적분 문제를 많이 풀었는데, 미분은 최대, 최소, 점근선, 적분은 대부분 면적을 구하는 정도로 써왔고, 속도나 가속도, 때론 통계 정규분포도 연관되어 있는 정도만 배웠다. 미적분이 중요하단 말은 많이 들었지만, 어떻게 응용할 수 있는지는 잘 알지 못한다. 그런데 그게 인공지능을 공부하면 바로 알게 된다.
책 초반, 결합 확률 분포를 구하기 위해 적분을 세 번 하는 과정을 보면서 뭔가 깨닫게 되며, 책 후반에 편미분을 통해서는 각종 물리적 운동 해석처럼 수치의 해를 구하는데 얼마나 중요한지 알게 된다. 신경망뿐만 아니라 메쉬 학습과 같은 딥러닝에서도 쓰이고, 소볼레프 학습에도 쓰인다.
AI를 공부한 분이라면 알겠지만, 인공지능 프로그램을 개발하는 데는 참 많은 시행착오를 겪게 된다. 적정한 데이터 수집부터가 큰 난관이고 그것을 구했다고 해도, 초기 분석이 조금만 잘못돼도 전체 프로젝트를 망칠 수 있다. 알면 알수록 어려운 게 인공지능이란 생각이 든다. 그래서 경험자들의 팁이나 조언에 귀 기울이곤 하는데, 'AI를 위한 필수 수학'에서도 이런 팁과 조언을 많이 들을 수 있다.
많은 확률 이름을 어떻게 외웠는지, 테스트 데이터를 어디서 구했는지, 분포가 가진 각종 실용적 의미, 어떤 공식이 더 적합한지 등등이 저자의 경험과 각종 사례와 함께 이야기하고 있다. 사례 얘기가 나와서 그런데 'AI를 위한 필수 수학'이 수학을 다룬 책임에도 불구하고 관련 소프트웨어, 업체, 논문, 통계 자료, 역사적 사건과 사례 등이 담겨 있어서, 꾸벅꾸벅 졸지 않고 마냥 흥미롭고 재미있게 볼 수 있었다. 학창 시절에 선생님이나 교수님이 이렇게 강의했으면, 다들 수학 시간이 기다려졌을 거 같았다.
인공지능의 수학 영역이 워낙 넓기 때문에 처음부터 모두 다 알고 시작할 수 없다. 나 역시도 인공지능에 관심 있어 계속 책을 보고 있으나 모르는 게 너무 많다. 그런데 이번에 'AI를 위한 필수 수학'을 통해 하나를 알아도 제대로 알게 되었다는 쾌감 같은 걸 느낄 수 있었다. 알고 있는 수학 지식을 어떻게 써먹지 응용력도 기르고, 전체적인 맥락을 파악하는 안목도 높일 수 있었다. 인공지능 공부하는 사람에게 더할 나위 없이 좋은 책이다.
마지막으로 인공지능 수학을 보다 체계적으로 기초부터 공부하고 싶다면, 이번 'AI를 위한 필수 수학'을 먼저 읽어 전체적인 개념과 동기부여를 얻고, AI 수학을 기본부터 구체적으로 배우기 위해 전에 서평을 했던 같은 한빛미디어의 '개발자를 위한 필수 수학' 보기를 추천해 본다.