Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- Python
- matplotlib
- 파이썬데이터분석
- 수업기록
- 맷플롯립
- 파이썬데이터분석주피터노트북
- sql연습
- 데이터분석시각화
- 주피터노트북판다스
- 파이썬
- 주피터노트북
- 주피터노트북맷플롯립
- 주피터노트북그래프
- SQLSCOTT
- SQL수업
- 파이썬시각화
- 파이썬크롤링
- 팀플기록
- 파이썬알고리즘
- SQL
- 파이썬차트
- sql연습하기
- python알고리즘
- python데이터분석
- python수업
- 판다스데이터분석
- 파이썬수업
- 주피터노트북데이터분석
- 판다스그래프
- sql따라하기
Archives
- Today
- Total
IT_developers
Python 데이터 분석(주피터 노트북) - 쇼핑몰(1)_데이터 확인 본문
쇼핑몰
- UCI ML Repository (https://archive.ics.uci.edu/ml/datasets/Online+Retail#)
- 온라인 리테일 사이트의 2010/12 ~ 2011/12 주문 기록 데이터
- 약 500,000 건 데이터
라이브러리
- import pandas as pd
데이터 로드

데이터 탐색
- InvoiceNo : 주문번호
- StockCode : 아이템 아이디
- Description : 상품설명
- Quantity : 상품 주문 수량
- InvoiceDate : 주문날짜 및 시간
- UnitPrice : 상품 가격
- CustomerID : 고객 아이디
- Country : 고객 거주 지역(국가)



데이터 전처리
1) CustomerID 가 null 인 행 제거

2) 수량, 가격이 0보다 작은 행 제거


3) customerID 타입 변경
- float 64 ==> int32로 변경

4) 새로운 컬럼 생성
- CheckoutPrice = Quantity * UnitPrice

CSV 저장
- 인덱스는 제외

'Python' 카테고리의 다른 글
Python 데이터 분석(주피터 노트북) - 쇼핑몰(3)_고객 (0) | 2022.12.09 |
---|---|
Python 데이터 분석(주피터노트북) - 쇼핑몰(2)_매출 (0) | 2022.12.09 |
Python 차트 시각화(주피터 노트북) - plotly (0) | 2022.12.08 |
Python 데이터 분석(주피터노트북) - Lakers(농구) (0) | 2022.12.07 |
Python 데이터 분석(주피터노트북) - 국제 축구 경기 (0) | 2022.12.06 |
Comments