HomeAbout
Etc
단순 데이터 추출은 멈추자
윤석준
April 30, 2023
3 min

data_ex

*DW/BI 업무를 주로했던 시절 경험을 토대로 데이터 추출에 대해 개인적인 경험에 대해서 정리하였습니다.

데이터 관련 업무를 하다보면 데이터 추출을 생각보다 많이 하게 됩니다.

취업하고 처음 업무를 받으면서 가장 많이 한 일이 데이터 추출이였을 정도로 해당 업무가 굉장히 많았는데, 해당 업무를 하면서 항상 저는 다음과 같이 생각했었습니다.

“이거 그냥 반복 업무 아닌가… 이걸 왜 해야 하는 거지.. 나에게 아무런 도움도 안 되는 거 같은데”

하루 종일 쿼리만 보면서 단순히 데이터 추출을 하고 있으면 당연히 위처럼 생각이 들 수밖에 없을 것입니다.

여기서 핵심은 ”단순히 데이터 추출만 한다면” 입니다.

여기서 말하는 단순한 데이터 추출이란 다음과 같이 일을 하는 것을 의미합니다.

  • 누군가 나에게 “이러한 지표 어떻게 뽑아주세요”라고 요청한다.
  • 나는 그것을 그대로 실행하여 데이터를 뽑아서 준다.

만약 위처럼 요청한 것을 그대로 준다면 좋을 수 있지만 오히려 또 다른 비효율적인 추출 업무가 늘어날 수 있습니다. 가령 데이터를 뽑아서 줬는데 갑자기 “아 이 데이터도 필요할 것 같아요”라는 요청이 오거나 혹은 “아!다시 보니까 해당 데이터가 필요하진 않네요”라는 말을 들을 수도 있습니다. 혹은 모든 데이터를 다 뽑았는데 아예 사용하지 않는 경우도 있습니다. 그리고 누군가 요청한 것을 그대로 실행하면 흔히 말하는 진짜 쿼리 기계가 될 수밖에 없습니다.

그럼 단순한 데이터 추출이 아닌 것은 무엇일까요?

과거 스스로 여러 번 데이터 추출 업무에 대해서 고민해보고 다양한 시도를 해본 경험을 토대로 이야기해보겠습니다.

01. 요청 주신 데이터가 과연 목적에 맞는 데이터일까요?

보통 추출 요청이 오면 요청 목적과 데이터 형식을 받게 됩니다.

이러한 요청을 받은 후에 “데이터 형식에 맞게 쿼리를 작성해야지”라고 생각하는 것이 아니라 “해당 목적에 과연 저 데이터를 보는 게 맞을까?”를 먼저 생각해야 한다고 생각됩니다.

예를 들어, 스테이지성 게임 초반 난이도 밸런스를 보기 위해 신규 가입 기간별 레벨별 진척률을 뽑아달라는 요청이 왔다고 해봅시다.

과연 난이도 밸런스를 보기 위해 레벨별 진척률을 보는게 맞을까를 생각해보면 반은 맞다고 생각할 수 있습니다.

아마 레벨별 진척율을 보면 유저들이 평균적으로 어느 구간까지 도달하는지를 알 수 있기에 참고할 수 있는 데이터가 될 수 있을 것 입니다.

하지만 레벨에 따른 여러 게임내 부가적인 컨텐츠 및 요인들이 있기 때문에 레벨 진척률만으로 특정 구간의 난도가 높다 낮다고 판단하는 것은 무리가 있을 수 있습니다.

02. 목적에 맞는 데이터(지표)들을 추가적으로 제공하자.

자 그럼 “스테이지성 게임 초반 난이도 밸런스”를 확인하기 위해 어떤 데이터를 보는 것이 좋을지 생각해보면 다음과 같은 데이터를 추가적으로 생각해볼 수 있다.

  • 구간별 유저 이탈률
  • 구간별 유저 게임 보유 머니
  • 구간별 유저 플레이 시간 및 플레이 횟수
  • 게임 아이템 사용 횟수 등

이 밖에도 여러 가지 지표들이 있을 수 있지만, 여기서 핵심은 목적에 맞게 능동적으로 데이터를 구상하여 제공한다는 것입니다.

목적에 맞게 데이터를 구상하여 제공하는 것은 말은 쉬워보이지만 굉장히 많은 생각을 해야하고 중요합니다.  

목적과 가설에 따른 측정 지표를 세울 수 있어야 한다”는 말은 분석에서도 그리고 데이터 추출에서도 모두 공통적으로 중요한 말이라고 생각됩니다.

03. Ad-hoc 탐색적 분석 결과도 같이 제공하자.

데이터를 뽑아서 데이터만 주는 것보다 해당 데이터를 탐색한 시각화 및 그에 대한 의견도 같이 전달하는 것이 좋습니다.

탐색적 분석한 결과를 제공하면 다음과 같은 이점이 있습니다.

  • 탐색과정에서 파생되는 문제를 발견할 수 있다.
  • 데이터 추출을 요청한 사람에게 더 명확한 정보를 제공할 수 있다.
  • 데이터 추출을 요청한 사람과 해당 목적에 대해 가설을 다시 세우고 단순 추출이 아닌 의미있고 임팩트 있는 분석으로 진행될 수 있다,

실제로 “데이터 추출을 요청한 사람과 해당 목적에 대해 가설을 다시 세우고 단순 추출이 아닌 의미있고 임팩트 있는 분석으로 진행될 수 있다.” 이 부분이 핵심이라고 생각합니다.

단순히 데이터 추출만 제공하는 것이 아닌 능동적인 데이터 구상과 탐색적 분석의 결과를 같이 제공하게 되면

1) 데이터 리터러시 역량을 성장시킬 수 있고 2) 이 과정 속에 생각지도 못한 인사이트가 발견될 수 있고 3) 그에 대한 가설을 세워 테스트 혹은 사업의 방향성을 결정하는데 크게 기여할 수 있습니다.

실제로 과거 저의 경험으로 단순 난이도 밸런스 추출 요청이 탐색적 분석을 통해 난이도 밸런싱뿐만 아니라 아이템 관련 밸런스 및 경제시스템 기획이 생각하지 못한 오류가 있다는 인사이트를 발견할 수 있었고 이후에는 해당 게임을 빠르게 운영을 중지하고 새로운 게임 제작 방향으로 의사결정이 된 경우가 있었습니다.

  • 단순 스테이지성 게임으로 아이템이 해당 게임의 콘텐츠 전부였기에 아이템을 새로 기획하는 것보다 전체적인 게임을 새로 만드는 것이 좋겠다는 방향으로 의사결정이 진행되었습니다.

이처럼 추출 업무도 내가 어떻게 하는가에 따라 단순 노동이 될 수 있고 혹은 의미있고 임팩트 있는 일이 될 수 있다고 생각이 됩니다.

추추출 뿐 아니라 어떠한 일들이라도 다시 한번 회고해보고 어떻게 더 효율적/회사에 이득이 되는 방향으로 진행할 수 있을지 고민해보는 것도 좋을 것 같습니다.


Share


Related Posts

데이터를 공부하는 마음
2023-05-29
5 min
© 2023, All Rights Reserved.
Powered By

Quick Links

About UsOfficial Page

Social Media