Python
Python 데이터 분석(주피터 노트북) - 쇼핑몰(1)_데이터 확인
developers developing
2022. 12. 9. 09:00
쇼핑몰
- UCI ML Repository (https://archive.ics.uci.edu/ml/datasets/Online+Retail#)
- 온라인 리테일 사이트의 2010/12 ~ 2011/12 주문 기록 데이터
- 약 500,000 건 데이터
라이브러리
- import pandas as pd
데이터 로드
데이터 탐색
- InvoiceNo : 주문번호
- StockCode : 아이템 아이디
- Description : 상품설명
- Quantity : 상품 주문 수량
- InvoiceDate : 주문날짜 및 시간
- UnitPrice : 상품 가격
- CustomerID : 고객 아이디
- Country : 고객 거주 지역(국가)
데이터 전처리
1) CustomerID 가 null 인 행 제거
2) 수량, 가격이 0보다 작은 행 제거
3) customerID 타입 변경
- float 64 ==> int32로 변경
4) 새로운 컬럼 생성
- CheckoutPrice = Quantity * UnitPrice
CSV 저장
- 인덱스는 제외