Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- 파이썬시각화
- 파이썬알고리즘
- 팀플기록
- 주피터노트북판다스
- matplotlib
- 파이썬차트
- SQLSCOTT
- 주피터노트북
- 파이썬데이터분석
- sql따라하기
- 수업기록
- SQL
- 판다스데이터분석
- sql연습하기
- 맷플롯립
- python알고리즘
- 파이썬수업
- sql연습
- python데이터분석
- 주피터노트북데이터분석
- 데이터분석시각화
- 파이썬크롤링
- SQL수업
- Python
- 판다스그래프
- python수업
- 파이썬데이터분석주피터노트북
- 주피터노트북그래프
- 파이썬
- 주피터노트북맷플롯립
Archives
- Today
- Total
IT_developers
Python 데이터 분석(주피터 노트북) - 한국 관광_10년 자료 본문
데이터 수집
- https://datalab.visitkorea.or.kr/datalab/portal/main/getMainForm.do
- 한국관광공사
- 125개 엑셀파일
- 코로나 이후 관광객 추이
라이브러리 및 세팅
- import seaborn as sns
- seaborn 폰트 사용 - 한글처리보다 먼저 선언해야함
- sns.set(font_scale=1)
- seaborn 스타일의 그래프를 사용
- plt.style.use('seaborn')
- import pandas as pd
- import numpy as np
- import matplotlib.pyplot as plt
- 한글처리
- plt.rcParams['font.family'] = 'Malgun Gothic'
- plt.rcParams['axes.unicode_minus'] = False
- 경고 메세지
- import warnings
- warnings.simplefilter("ignore")
- import plotly.express as px
- import plotly.graph_objects as go
데이터 로드
- 125개 로드 시키기 위해 함수 만들기
- 파일명 : kto_년도,월
1) 함수 생성
2) 함수테스트
3) 모든 엑셀 파일을 읽은 후 합치기
- 반복문
4) 완성
- 2020년도는 5월까지만 있음
EDA & Visualization
1) 전체 정보를 엑셀 파일로 저장(df)
- 파일명 : kto_total
2) 기준년월 데이터 타입 변경
- object => datetime
3) 년도, 월 컬럼 생성
1. 중국 데이터
1) 중국만 수집
2) 중국 데이터 저장(10년)
3) 중국, 컬럼(관광, 기준년월)
4) 중국 관광객 시각화
※ 차트 분석
- 2010 ~ 2016 관광객 수가 꾸준히 증가
- 2015 여름에 관광객 수 급감(메르스)
- 2017 관광객 수 급감(사드 배치 인한 관광 중지)
- 2020 초 관광객 수 급감(코로나)
2. 국적별 관광객 상위 5개국
- sort_values('컬럼', ascending=False)
1) 상위 5개국에 대한 데이터 가지고 오기
- isin
2) 국적별 관광객 추이 시각화
- Seaborn - relplot (kind='line')
- col_wrap :
- aspect :
3) 세부 지정 포함한 시각화
- for 문 사용 : 추출하고 차트 그리기
4) 중국 관광객 시각화 heatmap
5) 상위 5개국 시각화 heatmap
3. 국적별 엑셀 파일 저장
- 국적 확인
- 국적 개수 확인
- for문 작성
'Python' 카테고리의 다른 글
Python 웹 개발(Django) - myphoto 프로젝트 (1) | 2022.12.14 |
---|---|
Python 웹 개발(Django) - 설치 및 기본 환경 설정 (0) | 2022.12.14 |
Python 데이터 분석(주피터 노트북) - 한국 관광_201901 (0) | 2022.12.12 |
Python 데이터 분석(주피터 노트북) - 브라질 쇼핑몰 (0) | 2022.12.11 |
Python 데이터 분석(주피터 노트북) - 쇼핑몰(5)_로그 데이터 (0) | 2022.12.10 |
Comments