온라인 비즈니스에서 Customer journey, 고객의 여정을 살펴보는 것은 중요합니다. 사이트의 상품 또는 서비스에 대한 고객의 직접적인 반응을 path로 연결하여 관찰함으로써 우리 사이트가 고객에게 제공하려는 핵심 가치가 제대로 전달되고 있는 지, 그렇지 못하다면 어디에서 문제가 있었는 지를 파악할 수 있습니다.
고객 여정 분석에 가장 많이 활용되는 것이 AARRR framework(또는 Pirate Metrics framework) 기반의 퍼널 분석입니다. AARRR은 실리콘 밸리 투자가이자 500 Startups 대표인 Dave McClure가 개발한 프레임워크로 초기 스타트업이 표면적인 KPI에만 집중해 사업의 방향성을 잃는 모습을 보고 그들을 돕기 위해 만들었다고 합니다. 최근에는 Retention의 중요성이 강조되면서 비즈니스의 규모와 성장 단계에 따라 RARRA (Retention-Activation-Referral-Revenue-Acquisition) framework를 택하기도 합니다. 이와 같은 퍼널 분석 framework은 비즈니스 지표를 각 단계별로 직관적으로 평가할 수 있게 하여 전반적인 비즈니스 성장에 대한 health check을 가능하게 한다는 점에서 매우 유용합니다. (AARRR에 대한 자세한 내용은 Reference 1, 2번 참조)
데이터 관점에서 이러한 퍼널 분석 framework은 Business-driven 모델이라고 볼 수 있습니다. 한 회사의 퍼널을 수립하는 과정을 살펴보면 여러 연관부서가 모여 Design-thinking 등의 논의 과정을 통해 비즈니스 관점에서 고객 접점 채널(Touchpoint)과 고객 행동(behavior), 고객 여정을 정의하고 이를 데이터로 검증하면서 점차 구체적인 퍼널을 완성시키게 됩니다.
이와 반대로 데이터를 통해 고객 여정을 알 수 있다면 비즈니스 가설과 실제 데이터 간의 갭을 좀 더 빠르게 줄일 수 있지 않을까요? 이런 관점에서 data-driven customer journey에 대한 고민을 하게 되었고 그 과정에서 온라인 비즈니스에서의 프로세스 마이닝 활용 사례에 관심을 가지고 살펴 본 내용을 소개해 드리려 합니다.
프로세스 마이닝은 로그 데이터를 기반으로 오퍼레이션 프로세스를 분석하는 방법론으로 업무가 어떻게 흘러가는지, 상품이 어떤 과정으로 제작되는지, 고객이 서비스 내에서 어떤 여정을 거치는 지 등의 프로세스를 도출해 가시화함으로써 인사이트를 얻을 수 있습니다. 프로세스 마이닝 방법론은 크게 세 가지가 있습니다.
이벤트 로그는 반드시 세 가지 요소를 갖추어야 합니다.
위의 표를 사례로 들어보면, 환자 ID가 5541번인 고객은 이 병원에서 혈액 검사를 받고 두 번의 방사선 치료를 각각 다른 시간에 받았음을 알 수 있습니다. 여기서 케이스는 환자가 되고, 전체 프로세스의 과정 하나하나가 activity, 그리고 이 이벤트들은 timestamp로 구분됩니다. 이 외에도 자원 정보, 거래 정보들을 부가적으로 포함하여 상세한 분석을 진행할 수도 있습니다.
Case ID : 이벤트 로그가 유의미한 최소 단위. 병원 진료 기록의 경우는 환자 ID, 상품 제조 공정 기록이라면 SKU, 고객 행동 로그면 고객 ID
Activity : 이벤트가 발생하는 최소 단위
Timestamp : Activity가 발생한 시간 정보
이 사례를 이커머스에 적용해본다면 다음과 같이 이벤트 로그를 구성해볼 수 있겠습니다.
우선 가상의 사례를 통해 이커머스에 프로세스 마이닝을 어떻게 적용할 수 있을 지 살펴보겠습니다. 프로틴 쉐이크를 파는 회사 A가 있다고 해봅시다. A사는 온라인 쇼핑몰에서 프로틴 쉐이크를 비롯한 보충제, 건강음료 등 판매 상품을 넓게 확장했습니다. 이들은 Google analytics로 데이터를 분석하고 있었지만 프로세스 마이닝을 통해 고객 행동을 좀 더 깊이 있게 이해하고자 했습니다. 이들은 Process discovery를 통해 다음과 같은 인사이트를 얻을 수 있었습니다.
음악 스트리밍 서비스 멜론을 운영하는 로엔엔터테인먼트의 사례에서는 신규 고객의 유입 여정에 대한 분석 결과를 볼 수 있습니다. 2016년 1월에 카카오에 인수된 로엔은 신규 이용자 확보에 집중하고 있었고 CVR을 높히고자 프로세스 마이닝으로 신규 고객의 journey를 탐색하였습니다. 데이터 분석가가 프로세스 마이닝을 위한 데이터를 준비하고, 마케터가 도메인 지식을 기반으로 분석 방향을 설정한 후 분석을 수행하였습니다.
하루 동안 신규 가입한 고객들의 프로세스 분석한 결과 사용 패턴에 따라 5개의 고객 세그먼트로 분류할 수 있었습니다 (음악 서비스 비용을 지불한 그룹, 음악 서비스 비용을 지불하지 않은 그룹 등). 각 세그먼트의 프로세스를 분석하여 그들의 가입 의도와 방문한 주요 페이지를 명확하게 식별할 수 있었고, 이를 기반으로 각 세그먼트가 자주 방문하는 주요 페이지에서 세그먼트의 특성을 반영한 맞춤형 마케팅 캠페인을 실시할 계획을 수립하게 되었습니다. 이 후 세그먼트별 CVR이 얼마나 개선되었는 지 보고 성과가 저조한 그룹을 대상으로 프로세스 마이닝 분석을 통해 다시 한 번 목표 CVR을 달성하지 못한 근본 원인을 파악하게 될 것입니다.
이 사례에서는 프로세스 분석과 일반적인 웹 로그 분석이 상호보완적 활용을 긍정적으로 평가하고 있습니다. 웹 로그 분석은 사용자가 방문한 특정 페이지의 이전, 이후에 대한 상세 분석이 가능하고, 프로세스 마이닝은 End-to-end 프로세스 맵, 반복 패턴 및 페이지 또는 메뉴 간 소요 시간 등 개괄적인 정보를 제공하므로 각 방식에서 놓칠 수 있는 부분을 보완해줍니다.
이커머스의 웹 로그를 활용하여 프로세스 마이닝을 수행한다면 세 가지 목적으로 활용해 볼 수 있겠습니다.
한편 이커머스 영역에서 특히 주의해야 할 부분이 activity일 것입니다. 웹 로그의 양이 워낙 방대하고 페이지와 발생 이벤트의 수가 매우 많기 때문에 자칫 복잡한 프로세스 맵을 결과물로 얻게 되어 활용이 어려워질 수 있습니다. 따라서 고객의 주요 여정을 파악할 수 있을 정도의 단위로 activity를 정의하는 것이 중요합니다. 너무 상세해도 판단이 어렵지만 과도하게 단순한 형태로 정의하면 오판단의 가능성이 커지게 됩니다.
또한 프로세스를 적절한 subgroup으로 잘라 보는 것도 필요합니다. Overview에서 페이지 또는 activity로 드릴다운하는 형태가 될 수도 있고, 고객 cluster별로 나누어 프로세스를 관찰하여 특정 고객군에 대한 인사이트를 얻을 수도 있습니다.