TIL/멋사_AI스쿨_TIL

[비즈니스 데이터 분석] 온라인 리테일 데이터 분석

둥둥런 2022. 12. 19. 17:04

12월 19일 TIL

코호트, 잔존률, RFM, 군집 분석, KPI 등

online retail data 실습 순서

EDA(리텐션) => RFM(segmentation)을 판다스로 구하고 => 군집화로 고객 세분화(segmentation) 

=> 유사도를 통한 추천시스템

대시보드 샘플 참고하기!!

[SaaS 비즈니스 대시보드 템플릿]

- 방문자 수 (신규)

- 월간 성장률

- 신규 회원가입 수

- 오거닉

- 유료 마케팅

- 방문자 중 회원가입한 사람 비율

- 유료고객 수

- 취소율(Churn rate)

- 월간 반복매출(MRR)

- 고객획득비용(CAC) --> 마케팅 비용

 

오거닉이란?

쉽게 이해하면, 비용을 쓰지 않고 알아서 우리 사이트에 방문한 이용자들

오가닉 트래픽(Organic Traffic)이란 광고나 소셜미디어, 리퍼럴 사이트와 같은 채널을 통해 사이트로 유도되는 트래픽을 제외하고 검색 엔진을 통해 곧바로 유입되거나 동일한 도메인 안에서 유입되는 트래픽을 말한다.

 

사용할 데이터 셋: Online Retail II UCI

https://www.kaggle.com/datasets/mashlyn/online-retail-ii-uci

 

Online Retail II UCI

A real online retail transaction data set of two years.

www.kaggle.com

더보기

Attribute Information:

InvoiceNo: Invoice number. Nominal. A 6-digit integral number uniquely assigned to each transaction. If this code starts with the letter 'c', it indicates a cancellation.
StockCode: Product (item) code. Nominal. A 5-digit integral number uniquely assigned to each distinct product.
Description: Product (item) name. Nominal.
Quantity: The quantities of each product (item) per transaction. Numeric.
InvoiceDate: Invice date and time. Numeric. The day and time when a transaction was generated.
UnitPrice: Unit price. Numeric. Product price per unit in sterling (£).
CustomerID: Customer number. Nominal. A 5-digit integral number uniquely assigned to each customer.
Country: Country name. Nominal. The name of the country where a customer resides.

 

코호트, 잔존률 분석

AARRR

https://www.apptentive.com/blog/app-marketing-metrics-for-pirates/

retention 날짜별, 주간, 월별, 게임별 등등 세분화해서 구분함

 

코호트 분석 cohort analysis

코호트란? 집단 구분 -> 관련 그룹으로 묶는 것)

코호트 분석의 유형

- 시간 집단 -> 이번 실습에 활용

- 행동 집단

- 규모 집단

 

잔존율 분석(Retention rate analysis)

리텐션 분석은 고객이 이탈하는 방법과 이유를 이해하기 위해 사용자 메트릭을 분석하는 과정

리텐션이란? 재구매율, 재사용율

ex)온라인 강의에서 처음부터 평생 수강권을 주지 않고 30일 수강권을 주고 절반 이상 수강하면 평생 수강할 수 있게 해주고 그 다음에 다른 강의를 수강할 수 있는 쿠폰을 준다?!

회사나 제품마다 측정하는 메트릭이 다 다릅니다. 절반 이상 수강했다면 다른 강의를 수강할 확률이 높아진다?
이런 것들을 데이터 분석을 통해 얻을 수 있다.
-> 데이터 분석을 통해 해당 제품에서 어떤 지표를 볼 것인지 정함
-> 북극성 지표 (특정 제품에서 가장 중요시 여기는 지표)
 
요일, 시간 분석
광고사도 요일, 시간을 근거로 광고 가격을 다르게 측정한다.
 
 

RFM 분석

가치있는 고객을 추출해내어 이를 기준으로 고객을 분류할 수 있는 분석 방법

구매 가능성이 높은 고객을 선정하기 위함이며, 가장 큰 과제는 그룹의 경계를 정의하는 것이다

Recency - 거래의 최근성

Frequency - 거래 빈도

Monetary - 거래 규모

 

-> 파이썬으로  직접 실습해보기

https://dogplot42-6.tistory.com/123

파레토 법칙(Pareto's law)
상위 20%의 고객이 전체 매출의 80%fm를 차지한다
-> 고객 구분, 관리, 유지의 필요성!