Q&A – 자주하는 질문

Q. 데이터 사이언스를 공부하고 싶은데 수학과 통계학은 어느 정도 알아야하나요?

A. 데이터 사이언스 수업을 듣기 위해서는 선형대수, 미분방정식, 회귀분석을 어느 정도 알고 있어야 합니다.

지금 알고 있는 내용으로 충분한지 자신이 없다면 데이터 사이언스를 위한 수학 & 통계 수업을 참고해주세요.

**참고: 본 글에서 말하는 통계학은 평균, 분산 찾는 고교 수준 통계학이 아니라, 회귀분석을 포함하는 학부 고학년 수준 통계학입니다

 

Q. 저는 수학과나 통계학과가 아니어서 위의 수학 & 통계학 수업을 들은 적이 없는데 어떻게 해야하나요?

A. 공대에서 공학수학, 선형계획법, 경제학에서 경제수학, 경제통계, 계량경제학 등의 수업을 가 보시면 유사한 커리큘럼을 찾을 수 있습니다. 기 수강생들의 후기를 볼 때, 학부 전공 수업 안에 위의 내용들이 들어가 있었다면 충분히 따라올 수 있는 수업을 진행하고 있습니다.

자연대에서 화학, 생물학을 제외한 모든 전공, 산업공학, 기계공학, 로봇공학, 컴퓨터공학, 경제학 등의 전공을 하셨으면 위의 내용들을 학부에서 배우셨을 것이라고 판단됩니다.

실제로 로봇공학, 산업공학, 경제학 학부 고학년 생들이 홍보 내용만 보고는 수학적으로 버거운 수업일 줄 알았는데, 의외로 배운 수학 개념들이 계속 등장한다고 반가워하는 경우를 많이 겪습니다. 반대로 그런 훈련을 학부 과정에서 받지 않으신 분들이 코딩인 줄 알았던 머신러닝이 왜 수학이냐고 당황하시는 경우도 있습니다.

 

Q. 수학 & 통계학을 모르는데 어떻게 해야할까요?

Data Scientist는 당신의 길이 아닙니다. 어릴 때도 이해못한 수학을 머리 굳고 난 다음에 이해하기란 더더욱 어려울 겁니다. 스스로를 학대할 각오가 없으시다면 수학 책을 다시 펴는 대신 포기하시는 것을 추천드립니다. (군생활 2년 후 다시 수학 공부할 때, 직장생활 2년하고 석사가서, 두 번이나 겪어봤기 때문에 누구보다 자신있게 이야기할 수 있습니다. 스스로를 학대할 필요는 없습니다.)

계속 욕심이 난다면, 수학과 통계학 몰라도 할 수 있다고 유혹하는 다른 강의를 추천드리고, 정말로 제대로 하고 싶으시다면 먼저 위의 수학 및 통계학 학부 과정 내용을 공부하시기 바랍니다.

이런 식으로 아쉬움이 많은 분들을 위해 Excel로 구현해보는 기초 강좌를 개설했으니 참고하시기 바랍니다.

약 1년간 강의를 거쳐가신 분들 데이터를 바탕으로 할 때, 위의 수학 & 통계학을 전혀 모르고 있다면, Excel로 구현해보는 기초 강좌를 통해서 데이터 사이언스 전반에 대한 대략적인 개념을 잡는 걸로 욕심을 타협하시는 것을 추천드립니다.

안타깝습니다만, 수학 없이 Copy & Paste로 코딩 위주의 개발자 커리어를 밟으신 공대 출신, 제대로 수학 수업을 들은 적이 없는 경영학과 출신 분들이 다시 수학 공부를 하시기는 굉장히 어려울 것이라고 생각합니다. 앞의 경우는 AWS 인스턴스 사용법을 가르쳐 주는 수업을 거쳐서 Data Engineer를 목표로 삼으시고, 뒤의 경우는 Data Visualization 툴들을 활용해서 Data Analyst가 되는 것을 목표로 공부하시는 것을 추천합니다.

 

Q. 데이터 사이언스는 개발자들이 할 수 있다고 하던데요?

개발자들이, 몇몇 IT 학원들이 오픈소스 코드 몇 줄로 당신을 속이고 있는 겁니다. 여러분들이 그렇게 속고 돈 버리지 말라고, 귀차니즘을 무릅쓰고 블로그를 운영하고 강의를 개설했습니다.

이건 수리통계적인 모델링을 할 수 있는, 최소한 그렇게 만들어진 모델을 이해할 수 있는 사람들이 하는 일입니다. 그런 IT 학원이 시장에서 퇴출될 때까지, 잘못된 생각을 가진 개발자 출신 Data Scientist들이 시장에서 쫓겨날 때까지, 저와 같은 생각을 가진 좋은 선생님이 시장에 나올 때까지 귀차니즘을 꾹 참고 강의를 계속하겠습니다.

 

Q. 좀 더 공부하고 싶은데, 따로 추천할만한 교재가 있나요?

A. 기초 통계학을 전혀 모르시는 분들께 서울대학교 경제학부 류근관 교수님의 [통계학]을 추천드립니다만, 이 책을 잘 이해하는 것과 데이터 사이언스를 잘 하는 것은 거의 관계없을만큼 쉽고 기초적인 내용으로만 구성되어 있습니다.

선형대수와 회귀분석을 어느정도 다루는 서적들을 찾고 있으시다면 [Introduction to Statistical Learning with Applications in R], [개발자를 위한 선형대수] 정도의 책들을 추천할 수 있습니다.

두 권 모두 PDF 버젼이 인터넷에 돌아다니니 참고하실 수 있겠네요.

조만간 제가 쓴 책을 추천드리도록 최대한 빠른 속도로 작업하겠습니다.

 

Q. R이나 Python을 한번도 써 본 적이 없는데 이 수업을 들을 수 있을까요?

A. 제 데이터 사이언스 메인 강좌는 통계학 공부를 하는 사람들이 주로 쓰는 툴인 R로 진행됩니다만, 모든 코드를 다 제공해드리기 때문에 딱히 수업 중에 코딩을 하실 일이 없습니다. 수업 시간에 코드 쳐 보라고 해 놓고 시간 때우는 강의를 매우 싫어하고, 수강생들이 집에가서 복습하시기 좋도록 강의 동영상까지 제공합니다. 개념을 이해하는 것이 중요하고, 코딩은 철저하게 부가적인 것이라는 철학을 갖고 있습니다.

 

Q. 석사 학위 이상의 실력이 있어야 따라갈 수 있는 수업인가요?

A. 학부 2학년 수준의 선형대수, 미분방정식, 회귀분석을 알고 있으면 따라오실 수 있도록 수업의 난이도를 최대한 낮췄습니다. 더 낮추면 더 이상 “데이터 ‘사이언스'”라고 부를 수 있는 수준의 강의가 아닌 것 같아서 이쯤에서 타협하려고 합니다.

 

Q. 이 수업에서 데이터 전처리를 많이 다루나요?

A. 제가 업무에서 일상적으로 만나는 상황들을 최대한 쉽고 간략하게 정리한 수업입니다. 데이터 전처리는 업무의 일부고, 딱 그 일부분만큼 다루고 있는 것 같습니다. 다만, 단순히 NA를 채워넣고, Balance를 맞추는 수준의 데이터 전처리가 아니라, 수리통계적인 기초 지식을 바탕으로 한 데이터 전처리, 활용하려는 모델에 적합하게 데이터 형태를 변형하는 맥락에서 이뤄지기 때문에, 단순히 NA 메워넣는 수준의 주제는 많이 다루지 않습니다.

 

Q. 가격 정책

A. 데이터 사이언스 이름 달고 수학&통계학에 기반에 제대로 된 강의를 하는게 아니라, 실상은 코딩 부트캠프처럼 운영되는 강의들 대비 절반 이하 가격입니다. 거꾸로 그런 코딩 강의스러운 수업보다 더 받질 않아서 제대로 된 강의가 아닌 줄 알았다는 수강생들도 있는 판국인데, 더 이상 가격으로 문의는 안 주셨으면 좋겠습니다.

X