일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- SQLSCOTT
- 파이썬데이터분석
- 데이터분석시각화
- python수업
- 판다스그래프
- sql연습하기
- 파이썬수업
- 파이썬크롤링
- 파이썬시각화
- SQL
- 파이썬데이터분석주피터노트북
- 주피터노트북
- 파이썬
- 판다스데이터분석
- 팀플기록
- 주피터노트북판다스
- SQL수업
- 주피터노트북데이터분석
- 맷플롯립
- matplotlib
- Python
- 파이썬알고리즘
- 주피터노트북맷플롯립
- 수업기록
- sql따라하기
- sql연습
- 주피터노트북그래프
- python데이터분석
- 파이썬차트
- python알고리즘
- Today
- Total
목록python데이터분석 (12)
IT_developers

데이터 수집 https://datalab.visitkorea.or.kr/datalab/portal/main/getMainForm.do 한국관광공사 125개 엑셀파일 코로나 이후 관광객 추이 라이브러리 및 세팅 import seaborn as sns seaborn 폰트 사용 - 한글처리보다 먼저 선언해야함 sns.set(font_scale=1) seaborn 스타일의 그래프를 사용 plt.style.use('seaborn') import pandas as pd import numpy as np import matplotlib.pyplot as plt 한글처리 plt.rcParams['font.family'] = 'Malgun Gothic' plt.rcParams['axes.unicode_minus'] = ..

데이터 수집 https://datalab.visitkorea.or.kr/datalab/portal/main/getMainForm.do 한국관광공사 라이브러리 및 세팅 import pandas as pd import numpy as np 경고 메세지 import warnings warnings.simplefilter("ignore") 데이터 로드 usecols : 사용하고 싶은 컬럼 skipfooter : 아래에 행 제거 header : 첫 행을 1번행으로 사용 데이터 탐색 head tail shape info null 데이터 확인 Dtype 확인 object : 범주형 데이터 int : 수치형 데이터 ==> describe 확인 describe ※ 관광, 상용, 공용, 유학/연수 데이터 중에서 min 값..

데이터 출처 브라질에서 가장 큰 백화점의 이커머스 쇼핑몰 2016 ~ 2018년도 100k 개의 구매 데이터 정보 구매상태, 가격, 지불수단, 물류 관련, 리뷰관련, 상품정보, 구매자 지역 관련 정보 url : https://olist.com/pt-br/ 라이브러리 및 세팅 import seaborn as sns seaborn 폰트 사용 - 한글처리보다 먼저 선언해야함 sns.set(font_scale=1) seaborn 스타일의 그래프를 사용 plt.style.use('seaborn') import pandas as pd import numpy as np import matplotlib.pyplot as plt 한글처리 plt.rcParams['font.family'] = 'Malgun Gothic' ..

쇼핑몰 UCI ML Repository (https://archive.ics.uci.edu/ml/datasets/Online+Retail#) 온라인 리테일 사이트의 2010/12 ~ 2011/12 주문 기록 데이터 약 500,000 건 데이터 로그 데이터(웹서버 남겨진 데이터) 접속 IP 세션 아이디 언제접속했는지 어느 경로를 이용했는지 byte 사이즈 라이브러리 및 세팅 import pandas as pd import numpy as np from plotly import graph_objects as go 데이터 로드 sep : \s 공백으로 구별하기 engine : 파이썬을 외부 DB 연동을 통해 확장시키기 위해서 필요 names : 헤더로 쓸 이름 지정 데이터 탐색 info() head() 데이터..

쇼핑몰 UCI ML Repository (https://archive.ics.uci.edu/ml/datasets/Online+Retail#) 온라인 리테일 사이트의 2010/12 ~ 2011/12 주문 기록 데이터 약 500,000 건 데이터 라이브러리 및 세팅 import seaborn as sns seaborn 폰트 사용 - 한글처리보다 먼저 선언해야함 sns.set(font_scale=1) import pandas as pd import matplotlib.pyplot as plt 한글처리 plt.rcParams['font.family'] = 'Malgun Gothic' plt.rcParams['axes.unicode_minus'] = False 경고 메세지 import warnings warnin..

쇼핑몰 UCI ML Repository (https://archive.ics.uci.edu/ml/datasets/Online+Retail#) 온라인 리테일 사이트의 2010/12 ~ 2011/12 주문 기록 데이터 약 500,000 건 데이터 라이브러리 및 세팅 import seaborn as sns seaborn 폰트 사용 - 한글처리보다 먼저 선언해야함 sns.set(font_scale=1) import pandas as pd import matplotlib.pyplot as plt 한글처리 plt.rcParams['font.family'] = 'Malgun Gothic' plt.rcParams['axes.unicode_minus'] = False 경고 메세지 import warnings warnin..

쇼핑몰 UCI ML Repository (https://archive.ics.uci.edu/ml/datasets/Online+Retail#) 온라인 리테일 사이트의 2010/12 ~ 2011/12 주문 기록 데이터 약 500,000 건 데이터 라이브러리 및 세팅 import seaborn as sns seaborn 폰트 사용 - 한글처리보다 먼저 선언해야함 sns.set(font_scale=1) import pandas as pd import matplotlib.pyplot as plt 한글처리 plt.rcParams['font.family'] = 'Malgun Gothic' plt.rcParams['axes.unicode_minus'] = False 경고 메세지 import warnings warnin..

쇼핑몰 UCI ML Repository (https://archive.ics.uci.edu/ml/datasets/Online+Retail#) 온라인 리테일 사이트의 2010/12 ~ 2011/12 주문 기록 데이터 약 500,000 건 데이터 라이브러리 import pandas as pd 데이터 로드 데이터 탐색 InvoiceNo : 주문번호 StockCode : 아이템 아이디 Description : 상품설명 Quantity : 상품 주문 수량 InvoiceDate : 주문날짜 및 시간 UnitPrice : 상품 가격 CustomerID : 고객 아이디 Country : 고객 거주 지역(국가) 데이터 전처리 1) CustomerID 가 null 인 행 제거 2) 수량, 가격이 0보다 작은 행 제거 3)..