12월 19일 TIL
코호트, 잔존률, RFM, 군집 분석, KPI 등
online retail data 실습 순서
EDA(리텐션) => RFM(segmentation)을 판다스로 구하고 => 군집화로 고객 세분화(segmentation)
=> 유사도를 통한 추천시스템
대시보드 샘플 참고하기!!
[SaaS 비즈니스 대시보드 템플릿]
- 방문자 수 (신규)
- 월간 성장률
- 신규 회원가입 수
- 오거닉
- 유료 마케팅
- 방문자 중 회원가입한 사람 비율
- 유료고객 수
- 취소율(Churn rate)
- 월간 반복매출(MRR)
- 고객획득비용(CAC) --> 마케팅 비용
오거닉이란?
쉽게 이해하면, 비용을 쓰지 않고 알아서 우리 사이트에 방문한 이용자들
오가닉 트래픽(Organic Traffic)이란 광고나 소셜미디어, 리퍼럴 사이트와 같은 채널을 통해 사이트로 유도되는 트래픽을 제외하고 검색 엔진을 통해 곧바로 유입되거나 동일한 도메인 안에서 유입되는 트래픽을 말한다.
사용할 데이터 셋: Online Retail II UCI
https://www.kaggle.com/datasets/mashlyn/online-retail-ii-uci
Attribute Information:
InvoiceNo: Invoice number. Nominal. A 6-digit integral number uniquely assigned to each transaction. If this code starts with the letter 'c', it indicates a cancellation.
StockCode: Product (item) code. Nominal. A 5-digit integral number uniquely assigned to each distinct product.
Description: Product (item) name. Nominal.
Quantity: The quantities of each product (item) per transaction. Numeric.
InvoiceDate: Invice date and time. Numeric. The day and time when a transaction was generated.
UnitPrice: Unit price. Numeric. Product price per unit in sterling (£).
CustomerID: Customer number. Nominal. A 5-digit integral number uniquely assigned to each customer.
Country: Country name. Nominal. The name of the country where a customer resides.
코호트, 잔존률 분석
AARRR
retention 날짜별, 주간, 월별, 게임별 등등 세분화해서 구분함
코호트 분석 cohort analysis
코호트란? 집단 구분 -> 관련 그룹으로 묶는 것)
코호트 분석의 유형
- 시간 집단 -> 이번 실습에 활용
- 행동 집단
- 규모 집단
잔존율 분석(Retention rate analysis)
리텐션 분석은 고객이 이탈하는 방법과 이유를 이해하기 위해 사용자 메트릭을 분석하는 과정
리텐션이란? 재구매율, 재사용율
ex)온라인 강의에서 처음부터 평생 수강권을 주지 않고 30일 수강권을 주고 절반 이상 수강하면 평생 수강할 수 있게 해주고 그 다음에 다른 강의를 수강할 수 있는 쿠폰을 준다?!
RFM 분석
가치있는 고객을 추출해내어 이를 기준으로 고객을 분류할 수 있는 분석 방법
구매 가능성이 높은 고객을 선정하기 위함이며, 가장 큰 과제는 그룹의 경계를 정의하는 것이다
Recency - 거래의 최근성
Frequency - 거래 빈도
Monetary - 거래 규모
-> 파이썬으로 직접 실습해보기
https://dogplot42-6.tistory.com/123
파레토 법칙(Pareto's law)
상위 20%의 고객이 전체 매출의 80%fm를 차지한다
-> 고객 구분, 관리, 유지의 필요성!