최근에 사내의 데이터 분석가 분들과 데이터 분석가가 하는 일에 대해서 이야기를 나눴습니다. 데이터 분석가라고 하면 “분석”을 하는 사람이라고 인식하는데요. 평소에 데이터 분석가가 하는 일의 범주는 상당히 넓다고 느껴요. 다양한 일을 하는 것이 재미가 있고 팀에도 필요하다고 생각해요. 하지만 장기적으로 생각하면 일의 중심이 없다면 지속가능하지 않아요. 데이터 분석가가 분석 업무를 요청받고 있지만 사실 분석이라는 것이 무엇인지 명확하게 모르고 있다고 생각이 들었어요. 그래서 사내의 데이터 분석가가 한 자리에 모여서 분석이란 무엇인지 이야기하기 시작했어요.
우리가 안다고 생각한 것을 정의해보려고 시도할 때 사실은 잘 몰랐다는 것을 깨닫는 것 같아요. 다들 예상할 수 있다시피 모여서 처음 이야기를 시도할 때 긴 정적이 흘렀습니다. 개념을 정의한다는 일이 어렵다는 것을 깨달은거죠. 그래서 평소에 우리가 하는 일 중에 어떤 것이 분석이고 어떤 것이 아닌지를 분류해보기 시작했어요. 다음 예시로 한 번 생각해봤어요.
예시를 통해 생각해보니 한 차원 더 들어가서 생각해야 하는 것 같았어요. 예를 들어, “X라는 행동을 한 사람의 수를 알고 싶다”라는 일을 한다고 가정할께요. 단순히 이 숫자만 구한다면, 분석이 아니라는 생각이 들어요. 하지만 “X라는 행동이 사용자에게 다시 돌아오게 만드는 원인일 가능성이 있다고 생각한다. 이 행동이 사용자에게 좋은 영향을 줬다면 N명 이상이 사용해야한다고 생각한다. 그래서 X라는 행동을 한 사람의 수를 보고자 한다.” 라고 하면 어떨까요? 이 경우는 분석같죠?
분석이냐 분석이 아니냐의 차이는 “무엇”을 하느냐가 아니라 “그것을 왜 하느냐” “어떤 맥락에서 하느냐”의 차이라는 생각이 들었어요. 단순히 숫자를 구하는 것은 분석이 아니지만 문제 의식과 가설의 존재 여부가 분석이 분석이 되도록 만든다고 생각하게 됐어요. 쉽게 말해서 “이걸 논문으로도 쓸 수 있을까?”라는 질문을 했을 때, 대답할 수 있다면 분석이지 않나라는 생각이 들었어요. 그래서 분석을 다음과 같이 정의해보고자 해요.
가설을 세우고 데이터를 통해 가설에 관한 유의미한 정보를 얻어내는 것
분석 관점에서 생각했을 때 가장 좋은 일하는 흐름은 다음과 같지 않을까 싶어요.
하지만 대부분의 경우 문제의식에서 바로 답으로 가는 경우가 많아요. “성장이 정체된 것 같은데?” -> “데이터를 보니 이것 때문인 것 같은데?”와 같은 식으로요. 문제 의식이 질문으로 이어지고 이 질문을 가설로 만드는 것이 “문제 정의”라고 생각해 요. 어떻게 보면 분석에서 가장 중요한 것은 문제 정의일지도 모르겠어요. 문제 정의가 잘 되지 않는다면 틀린 답을 얻을 가능성이 너무 높으니까요.
데이터 분석가끼리 이야기하다보니 다른 팀원들과 차별화되는 가치는 “깊은 분석을 할 수 있다”라는 것 같았어요. 분석이라는 것을 정의했으니, 무엇이 깊은 분석인지 이야기가 가능하더라구요. 이 또한 쉽지 않아서, 한동안 정적이 흘렀어요. 이 시간을 견디는게 생각보다 어려웠어요. 그래서 또 다시 예시를 생각해보기 시작했어요.
이제는 분석이 무엇인지 정의를 했으니 분석의 관점에서 어떻게 문제에 접근하는지 예시로 생각해볼께요. 다음과 같은 예시는 분석가 이외에 PM 분들이 충분히 하실 수 있는 얕은 분석이라는 공감대가 생겼어요.
얕은 분석의 예시를 생각해봤으니, 좀 더 어려운 문제를 생각해보기로 했어요. 서비스를 만드시는 분들이라면 다음 예시가 친숙하실 거에요 (저는 이제 피하고 싶은 문제네요). 이 문제가 상당히 어렵다고 생각하는데 왜 어려운지를 우리가 이해할 수 있다면, 어떤 분석이 깊은 분석인지 정의 할 수 있겠다라는 생각이 들었어요.
이 문제가 어려운 이유는 3가지입니다.
만약 문제가 정형화되어 있고 데이터 또한 잘 정형화되어 있으며 데이터 양이 적다면 “얕은 분석”이라고 할 수 있어요. 데이터 분석가가 아니더라도 누구나 할 수 있는 분석이라고 생각해요. 하지만 위 3개 중에 하나라도 충족되지 않는다면, 데이터 분석가가 (혹은 데이터 엔지니어가) 빛을 발해야 하는 “깊은 분석”이 된다고 생각하게 되더라구요.
깊은 분석이 무엇인지 알게 되었고, 데이터 분석가는 이러한 깊은 분석을 잘 할 수 있어야 한다는 공감대를 형성했어요. 하지만 더 도전적인 상황이 있어요. 만약에 분석가가 10명이 있고 전사에 400명이 있다고 생각해봐요. 10명의 분석가가 10개씩 분석을 한다면 총 100개의 분석 결과물을 만들 수 있을 거에요. 하지만 400명이 2개씩 분석을 한다면 어떨까요? 800개의 분석 결과물이 만들어져요.
이 사고 흐름은 “임팩트” 중심의 사고입니다. 데이터 분석가는 분석을 하는 것을 넘어서서 전사에 임팩트를 낼 수 있다고 생각해요. 데이터 분석가가 분석을 통해 임팩트를 낼 수도 있지만, 좀 더 큰 임팩트는 모두가 분석을 할 수 있게 만드는 것이에요. 문제는 얕은 분석은 누구나 할 수 있지만, 깊은 분석은 누구나 할 수 없다는 것이에요. 하지만 깊은 분석은 앞으로도 계속 도전적인 분석으로 남아있어야만 할까요? 곰곰히 생각해보면, 그렇지 않을 수 있다는 생각을 하게 됩니다.
시간이 흘러 미래가 된다고 해도, 여전히 깊은 분석은 존재할거고 어렵지만 가치있는 발견을 하는 사람들이 존재할 거라고 믿어요. 하지만 현재 우리가 깊다라고 생각하는 분석의 대부분은 미래에 얕다라고 생각하게 되지 않을까해요. Computer라는 말은 원래 숫자 계산을 하는 사람을 의미했어요. 주어진 시간 내에 정확하게 복잡한 계산을 해야하기 때문에 이들의 전문성이 필요했어요. 하지만 우리가 알고 있는 Computer라는 것이 발명되고 퍼지면서 이제 Computer는 더이상 사람을 뜻하지 않아요. 어떻게 보면 다음이 가장 중요한 질문일 수도 있겠다 싶어요. 이 질문으로 글을 마무리 해볼께요!
“5년 뒤에도, 10년 뒤에도 우리가 잘 할 수 있고 이미 임팩트를 끼치고 있을 일이 무엇일까?”