HomeAbout
Career
데이터에 입덕한지 1300일째 깨달은 6가지
주정민
September 26, 2022
3 min

Table Of Contents

01
Intro
02
1. 정량과 정성 그 사이 어딘가
03
2. Kaggle은 독이 될 수도 있다
04
3. 도메인 선정의 중요성
05
4. Easy하게 말과 글: 보고서와 커뮤니케이션
06
5. 데이터 분석가는 조직에서 아웃라이어다
07
6. 데이터 프로덕트화
08
Outro
  • 🕵🏻 이 글의 원문은 저자의 블로그에서 확인하실 수 있습니다.

Intro

안녕하세요. 데이터 분석가 주정민입니다. 저는 정보 통계학과를 졸업하고 제약, 패션, 배달 산업을 거쳐서 2년차 주니어 데이터 분석가로 일을 하고 있습니다. 짧은 시간안에 스타트업, 외국계, IT 기업, 대기업, 공공 기관에서 데이터 분석 업무를 모두 경험하면서 깨달은 점들이 많은데요. 이번 글에서 6가지로 나누어서 이야기를 풀어나가려고 합니다.

D-day
D-day

때는 바야흐로 2019년 3월을 시점으로 데이터를 공부한지 Grand Total 4년, 데이터 분석가로 Sub Total 2년, 일하면서 깨달았던 점들 6가지를 공유해보려고 합니다. 제가 직접 공부하고 일하면서 느꼈던 소소한 이야기들로 봐주셨으면 좋겠어요.

1. 정량과 정성 그 사이 어딘가

정성 한 스푼
정성 한 스푼
이제는 정량 데이터 100%가 아닌 정량과 정성 분석이 함께 해야 더 큰 시너지를 낼 수 있다는 걸 깨달았습니다. 실무에선 정성 관점에서 나온 인사이트를 정량화하는 것이 액션과 성과로 이어질 확률이 높습니다.

O2O 플랫폼같은 경우도 오프라인 현장에서는 생각치도 못했던 일들이 많이 발생합니다. 유저의 많은 케이스들을 데이터로 모두 예측할 수 없기 때문에 데이터만 믿고 섣불리 판단하면 안됩니다. 내가 본 데이터의 정합성이 안맞을지도, 일반화의 오류일 수도 있습니다. 그래서인지 넘쳐나는 데이터 속에서 요즘은 정성적인 부분들도 어떻게 정량화할 수 있을지를 고민하게 됩니다.

2. Kaggle은 독이 될 수도 있다

처음 데이터를 2년 정도 공부했을때는 데이터만 보고 달려들던, 머신러닝만 돌릴줄 알면 된다고 생각하던, 모델 정확성만 따졌었습니다. 공모전과 캐글에서 하던 모델링과 현업에서의 모델링은 달랐습니다. 데이터 분석가의 주관적인 관점에서 캐글의 가장 큰 문제점은 문제를 던져준다는 것입니다. 현업에서 일을 하면서 내가 직접 어떤 문제를 풀어야할지부터 정의해야합니다. 따라서 데이터 분석가가 캐글에서 얻어가야할 포인트는 EDA 과정이지 좋고 빠르고 정확한 모델링을 완성하냐가 아닙니다. 분석가냐 엔지니어냐의 관점에 따라 캐글을 대하는 접근법이 달라야합니다.

3. 도메인 선정의 중요성

이전에 제가 쓴 글에서도 언급했듯이, 데이터분석은 첫째도 둘째도 비즈니스라고 생각합니다. 내가 속한 산업의 비즈니스 모델을 제대로 파악하지 못한다면 좋은 분석의 방향으로 흘러갈 수 없습니다. 데이터 분석은 숲에서 나무를 봐야한다고 생각해요. 따라서 데이터가 잘 활용되고 잘 흘러가는 산업을 선택하는 것도 중요합니다.

저는 산업을 고를 때, 제약 -> 패션 -> 배달 순으로 선택을 했는데요. 이런 선택을 한 이유는 변화가 빠른 산업일수록 내가 한 분석이 Action으로 이어지기 쉽다는 것입니다. 어떤 산업이냐에 따라 주요 지표도 달라지고 분석 업무의 뱡향성도 달라질 수 있습니다.

  • 산업의 싸이클이 빠른지(예: 배달, 모빌리티, 이커머스 등)
  • 데이터의 법적인 제한이 있는 산업인지: 개인 정보 데이터 식별화가 어려운 경우, 데이터를 활용하고 분석할 수 있는 범위가 제한적일 수 있습니다.

4. Easy하게 말과 글: 보고서와 커뮤니케이션

보고서와 대시보드
보고서와 대시보드
데이터 분석가에게 중요한 역량 중 보고서와 커뮤니케이션 역량이 70%이상이 차지한다는 생각이 들어요. 그래서 내가 속한 팀이 기능 조직인지 목적 조직인지는 굉장히 중요합니다. CEO, 임원, 팀장님과 같은 직무인 데이터 분석가와 일을 할때는 말과 글의 방식이 크게 달라야합니다. 기능 조직에서 데이터 분석가들과 실무 커뮤니케이션을 할때, 목적 조직에서 다른 직무분들에게 보고서를 써야할때, 데이터 분석가끼리 소통할때 할 수 있는 말과 글은 크게 다릅니다. 나와 같은 전공을 가진 사람과 일을 할 때의 갭은 굉장히 크고 어떤 단어를 스킵하고 넘어갈 수 있을지, 주석을 달아서 설명해야할지를 고민을 하게 됩니다.

데이터는 깊게 파고 들면 제 3자가 보면 어려운 영역입니다. 보고서를 쓸때도 대시보드를 만들때도 이제는 “이것도 모를까?”가 아니라 “이런 부분들까지 심플하게 설명 해드려야겠다” 라고 이해할 수 있게 되었습니다. 기업의 규모가 커질수록 다양한 구성원이 존재하고 내가 한 분석이 의사결정에 반영되려면 통계적인 부분이 기각될 수도 있고 좀 더 심플해져야할 수도 있습니다.

5. 데이터 분석가는 조직에서 아웃라이어다

outlier
outlier
데이터팀만 경험했을때는 몰랐었지만 이전 회사에서 목적조직을 경험했을때는 크게 깨달을 수 있었습니다. 우리는 조직에서 기획자, 마케터, PM 등 다양한 분야의 동료들과 일을 합니다. 대부분의 사람들은 통계를 좋아하지 않고 어려워합니다. 평균값과 중앙값의 차이도, 빈도주의와 베이지안 통계학의 차이도 제대로 설명할 수 있는 사람이 현실에는 많지 않습니다. 통계학과 출신 조차도 잘 이해하고 설명할 수 있는 사람이 많지 않습니다.

요즘은 사람을 만날때 어떤 멋진 통계적 기법이자 수단을 사용할지가 아니라 내가 어떻게 통계적 수단을 언제 심플하게 활용할 수 있을지, 쉽게 설명해줄 수 있을까부터 먼저 고민하게 되는 것 같아요. 아무리 멋진 통계와 알고리즘을 사용해도 조직에서 모두가 공통적으로 이해하지 못하면 그 의미가 적다고 생각합니다. 요근래 가장 많이 하는 고민이자 앞으로 해결해나가야할 가장 큰 숙제가 아닐까 싶습니다.

6. 데이터 프로덕트화

데이터 분석 업무를 처음 했을때, 기능 조직이든 목적 조직이든 ad-hoc성의 데이터 추출 업무를 무수히 경험하게 됩니다. 저도 끝없이 SQL로 데이터를 추출하고 Excel로 레포트를 만들기도 했었는데요. 수비수인 레포트와 시각화 머신, 쿼리몽키에서 벗어나는 방법은 공격수가 되는 것입니다.

서포트 업무외에도 비즈니스 또는 서비스에 적용될 수 있는 부분들을 제안을 하는 것도 좋을 것 같아요. 공격수가 되어서 AB 테스트 실험 설계부터 결과 배포까지 내가 직접 기획한 것들이 서비스에 적용되어야 합니다. 내가 한 분석이 기획되어 서비스에 Action으로 이어지는 것이 베스트라고 생각해요.

Outro

데이터 분석가로서의 작고 소중한 4년 정도의 경험 속에서 나온 이야기 보따리를 풀어보았습니다. 데이터 공부는 통계, 프로그래밍, 비즈니스 등 공부해야할 부분들이 끝이 없는데요. 가야할 길이 멀고 험난하지만 데이터를 애정하는 한 사람으로서 앞으로 데이터, 비즈니스, 글로벌 3가지 영역내에서 영향력있는 삶이 목표입니다.


Tags

#데이터분석

Share


Related Posts

데이터 분석가 면접 보러가서 내가 해봤던 질문 14가지
2022-09-26
4 min
© 2023, All Rights Reserved.
Powered By

Quick Links

About UsOfficial Page

Social Media