Python
Python 데이터 분석(주피터 노트북) - 쇼핑몰(3)_고객
developers developing
2022. 12. 9. 19:00
쇼핑몰
- UCI ML Repository (https://archive.ics.uci.edu/ml/datasets/Online+Retail#)
- 온라인 리테일 사이트의 2010/12 ~ 2011/12 주문 기록 데이터
- 약 500,000 건 데이터
라이브러리 및 세팅
- import seaborn as sns
- seaborn 폰트 사용 - 한글처리보다 먼저 선언해야함
- sns.set(font_scale=1)
- import pandas as pd
- import matplotlib.pyplot as plt
- 한글처리
- plt.rcParams['font.family'] = 'Malgun Gothic'
- plt.rcParams['axes.unicode_minus'] = False
- 경고 메세지
- import warnings
- warnings.simplefilter("ignore")
- seaborn 스타일의 그래프를 사용
- plt.style.use('seaborn')
- from datetime import datetime
데이터 로드
데이터 분석
1. 우수 고객
- 구매 횟수 기준
- 지불 금액 기준
1) 고객 ID 기준 count
- 아이디별 구매 수량 확인
- 쇼핑몰에서 많이 구매하는 고객 TOP 10
2) 고객 ID 기준 CheckoutPrice sum
- 아이디별 구매액 확인
2. 월별 재구매율
- 1년의 데이터가 들어 있음
1) 사용자를 기준으로 최초 구매한 월 구하기
- 함수 생성
- 년, 월 추출
- Month로 담기
- Month를 기준으로 최소 값 구하기(제일 낮은 숫자)
- 최초 구매일 : MonthStarted 생성
2) 기준이 되는 월과 실제 구매월의 차이 계산
- 각 구매가 최초 구매로부터 얼마나 개월수가 지났는지 계산
- MonthPassed 컬럼 생성 : Month의 월과 MonthStarted의 월을 구해서 빼기
3) MonthStarted, MonthPassed 기준으로 고객 카운팅
- count : 중복값이 들어 있음
- 함수가 필요함
- 첫 달 구매는 885명
- 한달 뒤 재구매는 324명
4) 차트 그리기
- 기본 차트
- 눈금 설정