[Data analyst] Today I Learn/왜 데이터 분석가인가?

Data analyst 트랙을 시작하면서

pjw250 2024. 8. 27. 00:24

1. 데이터 분석 트랙에 참여한 계기

 

  "직무를 변경해야할 좋은 시기"

 

 생명공학과 석사를 졸업하고 제약회사 연구소에서 7년간 마이크로바이옴 연구원으로 근무를 하였다. 대학원에선 환경 미생물들의 메타지놈(metagenome)을 통해 환경 내 서식하고 있는 미생물을 파악하고 각 환경별 미생물들을 비교하면서 그 환경에서 어떤 역할을 하는지 연구했다. 토양 1g으로 부터 미생물 유전체의 집합체 즉, 메타지놈(metagenome)을 추출하면 수십 기가바이트(gigabyte)의 ATGC로 구성된 염기서열 데이터를 생성하게 되는데 이때 이러한 염기서열 데이터를 가공하고 연구하는 학문이 생명정보학(bioinformatics)이다.

 생명정보학(bioinformatics)을 배우면서 Python과 R을 부가적으로 배우게 되었다. 물론, QIIME (Quantitative Insights Into Microbial Ecology, QIIME 2)이라는 미생물 분석 파이프라인을 주로 사용하였지만, DNA로 구성된 raw data를 가공 혹은 통계 처리 할땐 Python 과 R 프로그램을 사용하였다. 컴퓨터공학과 출신이 아닌 비전공자 입장에서 코드를 백지장에서부터 빌드 업 하기엔 시간이 너무 촉박하다. 그래서 공유되있는 코드들, 즉, github나 R 패키지에 소개되어있는 문서들을 참고해서 몇 일 동안 이리저리 데이터를 뜯어보고 그래프를 그리다 보면 어느 덧 깔끔하고 이쁜 완성된 결과물이 생성된다.

 회사를 다니면서 일하는 시간 외 별도로 분석 툴들을 습득하는건 여간 쉬운일이 아니였다. 그럴싸한 툴들로 멋있게 결과물을 만들고 싶지만 당장 다음주가 발표면 엑셀과 PPT를 이용해서 manually 분석을 진행한다. 오히려 대학원생때 배웠던 것들로 회사에서 써먹는 느낌이들었고 학계에 있을때 보다 트랜드에서 뒤쳐지는 듯 했다.

 회사 경영상의 어려움으로 구조조정을 겪고 올해 4월에 희망퇴직을 하였다. 그 동안 못 했던 휴식을 취하면서 내가 정말 하고 싶은게 뭔지 내가 잘 할수 있는건 뭔지 고민하고 정리할 수 있는 좋은 시간을 보냈다. 연구원으로써의 삶은 정말 재밌고 성취감이 남달랐다. 돌이켜보면 나는 컴퓨터를 이용하는 작업을 좋아했고 데이터 정리나 데이터 시각화에 관심이 많았었다. 사실 대학원도 컴퓨터로 실험한다는 신생 렙이라는 소식을 듣고 제일 먼저 교수님을 찾아뵈었고 생명정보학이라는 분야를 알게 되었다.

 대학원을 졸업하고 사회로 진출해 보니 연구소는 매출을 일으키는 조직이 아니기에 빅파마와 같은 글로벌 기업이 아닌 이상 본업을 유지하는 것이 힘들다. 지금까지는 그 분야를 아는 사람만 이해하는 연구를 해왔었다면 앞으로는 기업의 이윤창출에 직접적으로 도움이 되는 분석가 역할을 하고 싶다.

 

2. 내가 생각하는 "데이터 분석가"의 역할

 

  "데이터 분석가는 중장기 계획을 수립하는 전략가이다."

 

 사실 연구원들은 데이터 분석가가 필요로 하는 역량이 무엇인지 다른 직군보다 잘 이해할 것이다. 왜냐하면 연구원들은 자신의 연구 데이터에서 의미를 찾고 결과를 공유하며 다음은 무엇을 해야할지 수 없이 많이 토론하기 때문이다.  다만, 내 개인적인 생각으로 연구원과 데이터 분석가는 약간의 차이가 있는 듯 하다.

 연구원은 자신의 연구주제(가설) 혹은 실험 목적을 달성하기 위해 검증된 연구 데이터로 빈 퍼즐을 끼워 맞춰 큰 그림을 완성하고자 한다면 데이터 분석가는 내부 혹은 외부 데이터를 통해 내가 속한 조직의 계획이나 솔루션을 제안하는 것에 초점이 큰 듯 하다.

 

3. 내가 경험해본 데이터 분석

 

 (1) 여러 미생물 후보군들로 실험하고 대조군 대비 통계적 유의성 확인

 (2) 동물 실험 데이터(정량적 수치)를 얻어 통계적 유의성 검정을 진행하고 bar 혹은 box graph로 도식화하는 작업.

 (3) 임상 데이터(환자의 키, 몸무게, 혈액마커 수치 등)과 환자별 장내 미생물 분포를 병합하여 환자군과 정상군 간의 장내 미생물 차이 분석 (주로 factor별 ANOVA, PCoA 분석)

 

4. 데이터 분석가의 역할을 수행하는데에 있어 나의 강점과 보완하고 개선할 점 (능력위주, 과거 혹은 현재)

 

 [강점]

 전문적인 수준은 아니지만 Python이나 R을 다뤄본 경험이 있기에 이번 부트 캠프를 통해 데이터 가공하는 능력을 잘 개발할 수 있을 것으로 보인다.

 

 [개선할 점]

 연구원의 습관은 너무 데이터에 집착한다는 것이다. 데이터 문해력을 잘 길러서 항상 내가 말하고자 하는 주제 혹은 목적과 히스토리를 잊지 말고 기획적 측면에서 데이터를 바라보는 습관을 길러야한다.

 

5. 본 코스 수료 후, 어떤 데이터 분석가로 성장하고 싶은가?

 

 사실 수료 후 어떤 직장을 가야겠다고 아직 정하지 않았다. 단지, 내가 걸어온 길을 돌아보면 앞으로 가야할 방향은 데이터 분석가로써의 길이 내 인생의 터닝 포인트가 되겠다고 판단하였고 본 부트캠프에 지원하게 되었다.

 다만, 나의 도메인은 헬스케어, 제약, 바이오이기 때문에 해당 분야에서 데이터 분석가로써 가닥을 잡는게 제일 좋지만, 다른 한편으로는 도메인을 바꾸고 싶은 마음이 크다. (1) 금융권(부동산 및 은행, 보험), (2) 커머셜(식품/화장품 등), (3) IT 업계(게임/소프트웨어 등) 에서 내부 데이터 및 시장 데이터로 잠재 시장을 발굴 하거나 기업 전략기획을 서포트 하는 업무를 하고싶다.

 

6. 본 코스 수료 후, 데이터 분석가가 된 5년 후 목표로 하는 점은?

 

 만약 내가 원하는 직군(변경된 도메인)에서 직무를 수행하려면 내 경력을 전부 포기하거나 많이 깎아서 입사해야 될 것이다. 때문에 첫 직장은 중소기업이나 벤처에서 시작할 것이고 2년 주기로 경력을 쌓아 대기업으로 이직하는게 첫 번째 목표이다. 대기업으로 가고자 하는 이유는 큰 회사일 수록 수집된 내부 데이터 양이 방대하고 데이터의 보존성(관리)도 뛰어날 것으로 생각되기 때문이다.

 5년 이후엔 그동안 회사에서 다양한 부서와 협업하며 insight를 도출한 경험을 바탕으로 경영컨설팅 업체로 이직하여 컨설턴트로 활동하고 싶다.