How To Make a Portpolio (2)
들어가면서..
본격적으로 강의를 시작하면서, 수강생들에게 도움이 되는 글을 작성하고 싶었다. 아쉽지만, 본 포스팅에서 코딩과 관련된 글을 제공되지 않는다. 다만, 필자 역시 블로그를 시작하면서 하나의 포트폴리오를 만들어가는 것처럼, 부족한 나의 강의를 듣는 사람들에게도 도움이 될만한 글을 제공하고 싶었다.
원문: How to Build a Data Science Portfolio
원문을 번역하지만, 기타 필자의 개인적인 의견도 섞어서 개진하였음을 밝힌다.
데이터 과학분야에 어떻게 취직을 할 수 있을까? 신입의 입장에서, 통계, 기계학습, 프로그래밍, IT 기술, 클라우드 전반에 대해 모두 아는 것은 어렵다. 또한, 취업에 필요한 포트폴리오는 어떻게 만들어야 할지 취준생 입장에서는 이 또한 난감하다. 대학교에서, 직업훈련기관에서, 또는 독학으로. 열심히 공부해 왔다고 해도, 역시 포트폴리오를 만들어가는 것은 쉽지 않다. 그러나, 포트폴리오는 매우 중요하며
, 포트폴리오
가 있음으로 얻는 이점은 무궁무진하다. 그런데, 인사담당자 & 현업(사수가 될 사람)과의 미팅에서 눈을 사로잡으려면 포트폴리오는 강력한 무기가 될 수 있다.
이전 포스트 How To Make a Portpolio (1) 에서는 주로 포트폴리오의 중요성에 대해 다뤘다.
이번 포스트에서는 데이터싸이언스 취업 이력서 작성 방법에 대해 얘기하고자 한다.
I. 이력서 분석
이력서 분석은 무엇인가요? 우선 원문을 봅니다.
I applied to almost 125 jobs (for real, maybe you applied for much more), I got only like 25–30 replies. Some of them were just: Thanks but nope. And I got almost 15 interviews. I learned from each one. Got better. I had to deal with a lot of rejection. Something I was actually not prepared to. But I loved the process of getting interviewed (not all of them to be honest). I studied a lot, programmed everyday, read a lot of articles and posts. They helped a lot.
보통 취업을 할 때는 다양한 곳에 이력서를 뿌립니다. 사실 많이 뿌리고, 면접도 자주 보는 것을 추천합니다. 특히 면접을 볼 때는 합격보다는 면접자의 질문을 리뷰하는 것을 추천합니다. 면접을 하면서, 현업에서 필요한 프로그래밍 언어와 분석 스킬 등을 파악할 수 있습니다. 꼭 이 회사에 취직하겠다는 것 보다는 면접관과 대화를 하면서 부족한 Skill에 대해 파악하는 것이 중요합니다.
강사가 면접을 받으면서 받았던 주요 질문은 아래와 같습니다.
- 분석 데이터의 크기.
- 이전 직장 또는 프로젝트에서 사용했던 언어 또는 Tool. 예를 들면, GA 360, Power BI, Tableau 등
- 데이터 엔지니어링에 관한 일반적인 내용 겸업 가능 여부. (MongoDB, 클라우드 구축 등)
- 간단한 통계 및 머신러닝 관점에서의 질문
- SQL 활용 여부
다음 원문을 확인해봅니다.
Take note of all the interview questions you got asked, especially those questions you failed to answer. You can fail again, but don’t fail at the same spot. You should always be learning and improving.
특히 1:1 면접이라면, 가능하면 노트를 준비하는 것도 좋습니다. 특히, 면접의 질문을 메모하고 답변이 가능한 것과 가능하지 못한 것을 구별한 다음에 다시 리뷰하는 것은 다음 면접에서의 성공 가능성을 높이게 됩니다. 아래 그림을 참조하시기를 바랍니다. 자주 지원하세요. 꼭 좋은 회사가 아니어도 일단 지원하시고 면접이 오면 면접을 봐서 다양한 질의에 대응할 수 있는 능력을 갖추는 것을 추천합니다.
II. 이력서 작성 요령
이제 이력서 작성 방법입니다. 영어권과 국내의 이력서는 조금 다릅니다. 특히 대기업 같은 경우 자소서를 작성하는 것이 원칙이지만, 일반적으로 자소서에도 원칙은 동일합니다. General But Specific
한 방식으로 이력서가 구성이 되어야 합니다.
(1) 이력서의 길이
보통 이력서는 짧게 한눈에 들어올 수 있도록 하는 것이 좋습니다. 국내는 사람인
과 잡코리아
에서 보통 이력서를 기재하는 데, 특히 취업 준비생에게 있어서 포트폴리오 항목은 매우 중요한 부분입니다.
우선 외국의 Resume
를 보도록 합니다.
위 이력서
에서 주의깊게 보셔야 하는 것은 Coursera
의 영역입니다. Senior Software Engineer
항목에 보면 다양한 리스트들이 나옵니다. 데이터 직무와 관련된 항목을 토대로 설명을 하도록 하겠습니다.
Dev Environment: Analytics Environemnt based on docker and AWS, standardized the python and R dependencies. Wrote the core libraries that are shared by all data scientists
우선 본인이 했던 직무 중 개발환경설정을 담당했었고, 사용했던 툴은 docker and AWS
활용하여 파이썬과 R
의 패키지 관리를 했다는 부분이 나옵니다. 보통 신입 또는 취업준비생에게 데이터 싸이언티스트라고 하면 개발환경설정은 중요하지 않은 업무라고 생각할지 모르겠습니다. 데이터분석이 더 가치있는 업무라고 생각할 수 있을지 모르겠지만, 실무에서는 분석 툴을 다루는 법, 패키지 관리, 버전 관리 등이 매우 큰 이슈가 됩니다.
이와 같이, 데이터 분석에 대한 전반적인 업무에 관해서 일목 묘연하게 정리를 하였고, 깔끔하게 사용했던 Tool을 명시할 때, 현재 사내에서 진행하는 프로젝트와의 Tool이 매칭이 되면 그만큼 서류 통과 및 면접을 볼 기회가 한번 더 가질 수가 있게 됩니다.
즉, 면접에서는 이러한 Tool을 사용해봤냐가 아니라, 어떻게 활용했냐는 질문을 먼저 받아야 면접 시의 이야기의 폭이 그만큼 달라지고 넓어진다는 뜻이기도 합니다.
(2) Objective
원문에서는 Objective
를 가급적 넣지 말라고 합니다. 이유는 타 구직자와 차별성이 크지 않기 때문입니다.
Objective의 예: To assist a machine learning collective at an introductory level, leveraging my 10+ years of development experience and recent Deep Learning studies
(3) Coursework
학과 전공생이라면 Coursework
를 기재하는 것은 매우 자연스러울 것입니다. 그러나, 필자와 같이 비전공자인 경우에는 문제가 조금 다릅니다. 그리고 신입의 경우에는 더 어렵습니다.
비록 전공 수업은 듣지는 못했지만, 다양한 교육 싸이트(온라인/오프라인) 등을 통해서 수강하셨기에 이직을 하시는 거라면 관련 내용을 이와 같이 구체적으로 적어주시는 것이 좋습니다.
필자는 독학으로 공부를 시작했지만, 다양한 책을 읽었습니다. 몇가지를 예를 들면 아래와 같습니다.
- 프로그래밍 언어 R
- 통계: R로 배우는 분석 기술 (원문-The R Book, 저자 마이클 크롤리), 유쾌한 R 통계학 (저자 앤디 필드)
- 머신러닝: Applied Predictive Modeling (Max Kuhn & Kjell Johnson)
- 시각화: R Shiny 프로그래밍 가이드
- 프로그래밍 언어 Python
- 데이터 분석: 파이썬 머신러닝 데이터 분석 (저자 오승환)
- 딥러닝: 시작하세요 텐서플로 2.0 프로그래밍 (저자 김환희)
이 외에도 더 많이 있지만, 이러한 형태로 본인이 공부한 것을 정리해서 올려주는 것이 좋습니다. 특히 신입의 경우에는 이러한 부분이 훨씬 더 많이 필요합니다.
(4) Skills
가끔, 아래 그림과 같이 숫자로 표기하는 것을 좋아하는 경우가 있습니다. 또는 상,중,하로 구분하는 경우가 있습니다. 결론부터 말씀 드리면 좋지 않습니다.
지금까지 이력서 작성은 조금 Specific
한 관점에서 다루어졌다면, 본 Part
에서는 기본적으로 general
하게 가는 것을 추천합니다. 신입에게 있어서 회사는 전문성 보다는 다양한 경험이 때로는 중요합니다. 프로젝트 또는 시간이 흐르면서 특정 언어에 대한 실력은 늘 수 밖에 없습니다만, 다양한 언어를 다뤄봤다는 것만큼 좋은 것은 없습니다.
이 때 주의해야 하는 것은 본인이 가고자 하는 업무와 연관된 언어를 기재하는 것이 좋겠지요. 본인이 원치 않는 업무와 언어를 지속적으로 배운다면 취업한 직장에서 조금 다른 문제를 야기할 수도 있습니다. 가급적 아래와 같이 작성하는 것이 권장합니다.
(5) Projects
어떤 프로젝트를 담아야 할까요? 특히 데이터싸이언스 계통 취업준비생에게 가장 중요한 프로젝트는 결국 공모전
또는 Kaggle
대회에 나가는 것입니다. 입상이 목표가 아니라, 본인에게 주어진 알고리즘을 활용하여 경진대회에 참여함으로써 순위권에 도전하고 그것을 실증하는 것이 중요합니다.
입상을 하면 더 좋지만, 설령 하지 못하더라도 데이터 수집, EDA, 통계 분석, 데이터 처리, 사용했던 알고리즘에 대한 구체적인 설명서, 최종 결과값까지. 코드와 함께 문서화 시킨다면 그것만큼 더 좋은 프로젝트는 없습니다.
개발자분들이 잊고 있는 것 중의 하나는 코드 만큼 중요한 것은 문서화입니다. 문서화를 잘하느냐 못하느냐에 따라서, 향후에 더 높은 직급에서 일을 할지 못할지가 결정이 됩니다. 특히, 다양한 분석 보고서를 만들어야 하는 데이터싸이언티스트의 직무에서 코딩 만큼 중요한 것은 Power Point 작성 능력이며, 논문 및 보고서 작성 또한 갖추어야 더 진취적이고 다양한 프로젝트에 참여할 수 있는 기회를 얻을 수 있습니다.
(6) Portfolio
지금까지 준비한 것이 일종의 포트폴리오 준비과정입니다. 이제 마무리하는 것은 취업 담당자들에게 취업준비생이 준비한 것을 대담하게 용기있게 보여주는 것입니다. 가장 중요한 것은 Github
를 활용하는 것입니다. 캐글에 경진대회를 나가던지, 별도로 공부를 하더라도, 공부한 내용은 꼭 github
에 기록하는 것이 중요합니다.
필자 역시, 매일매일 강의를 준비하며 앞으로 진행하게 될 프로젝트를 꾸준하게 기록하게, 블로깅을 하고, 깃허브에 옮기는 것을 삶의 가장 최우선으로 삼고 있습니다. 깃허브와 블로그는 개개인의 삶의 Story이자, 자산입니다.
III. 국내외 주요 경진대회
국내외 주요 경진대회 리스트는 아래와 같습니다.
그 외에도 더 많은 경진대회가 있습니다만 취업준비생이라면 필수로 이러한 경진대회 참여 하는 것을 마다해서는 안됩니다. 실제 회사 생활을 하다보면 주말을 반납해야만 경진대회에 참여할 수 있기 때문에, 오히려 취업준비생이라면 긴 호흡을 하시고 꾸준하게 대회에 참여하시고, 문서화 하시고, 블로그 하시는 것에 많은 시간을 쏟으시기를 바랍니다.
Happy To Code
필자의 개인적인 의견이 취업 준비생에게 작은 도움이 되기를 바랍니다.
인프런 강의
- 취준생을 위한 강의를 제작하였습니다.
- 본 블로그를 통해서 강의를 수강하신 분은 게시글 제목과 링크를 수강하여 인프런 메시지를 통해 보내주시기를 바랍니다.
스타벅스 아이스 아메리카노를 선물
로 보내드리겠습니다.
- [비전공자 대환영] 제로베이스도 쉽게 입문하는 파이썬 데이터 분석 - 캐글입문기
Reference
Galarnyk, M. (2018, July 9). How to Build a Data Science Portfolio. Retrieved May 10, 2020, from https://towardsdatascience.com/how-to-build-a-data-science-portfolio-5f566517c79c