Python 데이터 분석(주피터노트북) - 지하철 시간대 별 데이터 분석(티머니)

Notice

Recent Posts

Recent Comments

Link

« 2025/09 »
일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

Tags more

Archives

Today

Total

관리 메뉴

IT_developers

Python 데이터 분석(주피터노트북) - 지하철 시간대 별 데이터 분석(티머니) 본문

Python

Python 데이터 분석(주피터노트북) - 지하철 시간대 별 데이터 분석(티머니)

developers developing 2022. 12. 2. 12:00

데이터 수집

대중교통통계자료(https://www.t-money.co.kr/ncs/pct/ugd/ReadTrcrStstList.dev)
2022년 6월 자료

라이브러리 및 세팅

import seaborn as sns
seaborn 폰트 사용 - 한글처리보다 먼저 선언해야함
- sns.set(font_scale=1)
import pandas as pd
import matplotlib.pyplot as plt
한글처리
- plt.rcParams['font.family'] = 'Malgun Gothic'
- plt.rcParams['axes.unicode_minus'] = False
경고 메세지
- import warnings
- warnings.simplefilter("ignore")
seaborn 스타일의 그래프를 사용
- plt.style.use('seaborn')

데이터 로드

sheet_name : 사용할 시트
skiprows : 건너 뛸 셀
usecols : 사용할 셀
thousands

데이터 전처리

1) 컬럼명 변경

Unnamed: 1 --> 호선명
Unnamed: 3 --> 지하철역
승차 --> 승차_4(새벽 4시 승차) ~ 승차_26(새벽 2시 하차)
하차 --> 하차_4(새벽 4시 하차) ~ 하차_26(새벽 2시 하차)

전체 길이 확인

EDA

1) 출근 시간대 사람들이 가장 많이 타는 역

승차_7 + 승차_8 + 승차_9 = 출근 계

2) 출근 시간대 사람들이 가장 많이 내리는 역

하차_7 + 하차_8 _ 하차_9 = 하차 계

3) 밤 11시에 사람들이 가장 많이 타는 역

4) 사용자로부터 입력 받은 시간대에 사랍들이 가장 많이 타는 역

5) 시간대별로 승객이 가장 많이 타고 내리는역

5-1) 4~24시 컬럼 추출

5-2) 각 시간대별 최대인원 추출

5-3) 각 시간대별 최대 인원의 인덱스 번호 추출

5-4) passenger_max와 kdxmax_list 이용해서 새로운 데이터 프레임 생성(time_df)

5-5) idx_max 값을 이용해서 지하철 역 이름 찾기

5-6) time_df에 지하철역 컬럼 생성 후 5-1) 번 내용 추가

5-7) 승하차 컬럼에서 시간 잘라낸 후 hour 컬럼에 담기

5-8) hour의 타입을 int64

5-9) 혼잡역 컬럼 생성 : 지하철역_hour(ex 구로 4)

6) 시각화

6-1) 승차시 혼잡역

pandas

6-2) 하차 시 혼잡역

pandas

6-3) 혼잡한 승하차역

seaborn barplot

pie plot

seaborn countplot

저작자표시 비영리 변경금지 (새창열림)

'Python' 카테고리의 다른 글

Python 지도 시각화(주피터노트북) - folium(2) (0)	2022.12.03
Python 지도 시각화(주피터노트북) - folium(1) (0)	2022.12.03
Python 데이터 분석(주피터노트북) - 지하철 유,무임승차 데이터 분석(티머니) (0)	2022.12.01
Python 데이터 분석(주피터노트북) - 서울시 구별 CCTV 설치 대비 범죄율 데이터 분석 (0)	2022.11.30
Python 데이터 분석(주피터노트북) - 스타워즈 데이터 분석 (0)	2022.11.29