Python
Python 데이터 분석(주피터노트북) - 쇼핑몰(2)_매출
developers developing
2022. 12. 9. 14:00
쇼핑몰
- UCI ML Repository (https://archive.ics.uci.edu/ml/datasets/Online+Retail#)
- 온라인 리테일 사이트의 2010/12 ~ 2011/12 주문 기록 데이터
- 약 500,000 건 데이터
라이브러리 및 세팅
- import seaborn as sns
- seaborn 폰트 사용 - 한글처리보다 먼저 선언해야함
- sns.set(font_scale=1)
- import pandas as pd
- import matplotlib.pyplot as plt
- 한글처리
- plt.rcParams['font.family'] = 'Malgun Gothic'
- plt.rcParams['axes.unicode_minus'] = False
- 경고 메세지
- import warnings
- warnings.simplefilter("ignore")
- seaborn 스타일의 그래프를 사용
- plt.style.use('seaborn')
데이터 로드
데이터 탐색
데이터 전처리
1) 날짜 InvoiceDate 데이터 타입 변환
데이터 탐색
1) 해당 기간의 매출
- 전체 매출
- 국가별 매출
- bar차트
- 월별 매출
- 요일별 매출
- 시간별 매출
※ 매출 데이터 insight
- 전체 매출액의 82% UK 에서 발생
- 2011년도의 가장 주문이 많이 발생한 달 11월(12월 전체 데이터가 반영되지 않았음)
- 일주일 중 목요일까지는 증가세를 보이다가, 이후로 하락
- 7시를 시작으로 주문이 시작되어 12시까지 증가세, 15시부터 하락세
2) 제품
- Top 10 판매 제품(Quantity)
- Top 10 매출 제품(CheckoutPrice)