Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- sql연습하기
- 파이썬알고리즘
- SQL
- SQLSCOTT
- python데이터분석
- 주피터노트북데이터분석
- 파이썬데이터분석주피터노트북
- 수업기록
- python수업
- 파이썬
- 판다스그래프
- 파이썬시각화
- 주피터노트북판다스
- 맷플롯립
- sql따라하기
- sql연습
- matplotlib
- 파이썬차트
- 파이썬크롤링
- Python
- 주피터노트북그래프
- 파이썬수업
- 팀플기록
- 주피터노트북맷플롯립
- 데이터분석시각화
- python알고리즘
- SQL수업
- 판다스데이터분석
- 파이썬데이터분석
- 주피터노트북
Archives
- Today
- Total
IT_developers
Python 데이터 분석(주피터노트북) - 지하철 시간대 별 데이터 분석(티머니) 본문
데이터 수집
- 대중교통통계자료(https://www.t-money.co.kr/ncs/pct/ugd/ReadTrcrStstList.dev)
- 2022년 6월 자료
라이브러리 및 세팅
- import seaborn as sns
- seaborn 폰트 사용 - 한글처리보다 먼저 선언해야함
- sns.set(font_scale=1)
- import pandas as pd
- import matplotlib.pyplot as plt
- 한글처리
- plt.rcParams['font.family'] = 'Malgun Gothic'
- plt.rcParams['axes.unicode_minus'] = False
- 경고 메세지
- import warnings
- warnings.simplefilter("ignore")
- seaborn 스타일의 그래프를 사용
- plt.style.use('seaborn')
데이터 로드
- sheet_name : 사용할 시트
- skiprows : 건너 뛸 셀
- usecols : 사용할 셀
- thousands
데이터 전처리
1) 컬럼명 변경
- Unnamed: 1 --> 호선명
- Unnamed: 3 --> 지하철역
- 승차 --> 승차_4(새벽 4시 승차) ~ 승차_26(새벽 2시 하차)
- 하차 --> 하차_4(새벽 4시 하차) ~ 하차_26(새벽 2시 하차)
- 전체 길이 확인
EDA
1) 출근 시간대 사람들이 가장 많이 타는 역
- 승차_7 + 승차_8 + 승차_9 = 출근 계
2) 출근 시간대 사람들이 가장 많이 내리는 역
- 하차_7 + 하차_8 _ 하차_9 = 하차 계
3) 밤 11시에 사람들이 가장 많이 타는 역
4) 사용자로부터 입력 받은 시간대에 사랍들이 가장 많이 타는 역
5) 시간대별로 승객이 가장 많이 타고 내리는역
5-1) 4~24시 컬럼 추출
5-2) 각 시간대별 최대인원 추출
5-3) 각 시간대별 최대 인원의 인덱스 번호 추출
5-4) passenger_max와 kdxmax_list 이용해서 새로운 데이터 프레임 생성(time_df)
5-5) idx_max 값을 이용해서 지하철 역 이름 찾기
5-6) time_df에 지하철역 컬럼 생성 후 5-1) 번 내용 추가
5-7) 승하차 컬럼에서 시간 잘라낸 후 hour 컬럼에 담기
5-8) hour의 타입을 int64
5-9) 혼잡역 컬럼 생성 : 지하철역_hour(ex 구로 4)
6) 시각화
6-1) 승차시 혼잡역
- pandas
6-2) 하차 시 혼잡역
- pandas
6-3) 혼잡한 승하차역
- seaborn barplot
- pie plot
- seaborn countplot
'Python' 카테고리의 다른 글
Python 지도 시각화(주피터노트북) - folium(2) (0) | 2022.12.03 |
---|---|
Python 지도 시각화(주피터노트북) - folium(1) (0) | 2022.12.03 |
Python 데이터 분석(주피터노트북) - 지하철 유,무임승차 데이터 분석(티머니) (0) | 2022.12.01 |
Python 데이터 분석(주피터노트북) - 서울시 구별 CCTV 설치 대비 범죄율 데이터 분석 (0) | 2022.11.30 |
Python 데이터 분석(주피터노트북) - 스타워즈 데이터 분석 (0) | 2022.11.29 |
Comments