Python
Python 데이터 분석(주피터노트북) - 동네 인구 구조 데이터 분석
developers developing
2022. 11. 25. 13:00
https://jumin.mois.go.kr/ageStatMonth.do
202206_202206_연령별인구현황_월간.csv 다운
라이브러리
- import pandas as pd
- 경고메세지 지우기
- import warnings
- warnings.simplefilter("ignore")
- import matplotlib.pyplot as plt
- 한글처리
- plt.rcParams['font.family'] = 'Malgun Gothic'
- plt.rcParams['axes.unicode_minus'] = False
1. 데이터 로드
인코딩 에러 ==> encoding='cp949'
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc7 in position 1: invalid continuation byte
1) 파일 정보 확인
2) , 제거하고 로드
3) int 값 확인
2. 데이터 탐색
- 행렬 조회
- 수치형 데이터 조회
- object 데이터 조회
- NaN 개수 조회
3. 데이터 전처리
- 필요없는 컬럼제거
- 컬럼명 변경
1) 필요없는 컬럼 제거
- 총 인구수
- 연령 구간 인구수
2) 컬럼명 변경
- 2022년 6월_계_ : 제거
- rename()
- rename(columns={"원본" : "변경"})
- 새로 담거나, inplace=True 필요
- columns[]
- columns[바꿀 컬럼 나열]
- 기본 inplace=True
- replace()
- columns.str.replace("원본","바꿀 내용")
- 2022년 6월_계_ : 제거
1> 종로구 평창동 인구 구조
- 1) 종로구 평창동 찾기
- 2) 평창동 df에서 행정구역 컬럼 제거
- 3) 선 그래프
- matplotlib
- pandas
- 4) 막대 그래프
- matplotlib
- pandas
- 5) 수평 그래프
- matplotlib
- pandas
1) 종로구 평창동 찾기
▶ 컬럼일 때
1-1) 인덱스 일 때 평창동 찾기
- 행정 구역을 인덱스로 설정
1-2) 행정구역 인덱스 해제
2) 평창동 df에서 행정구역 컬럼제거
- 행/열 변경
- 컬럼명 변경
3) 선차트
- matplotlib
- pandas
4) 막대차트
- matplotlib
- pandas
5) 수평 막대
- matplotlib
- pandas
2> 우리동네 인구 구조 알아보기
1) 사용자로부터 동네 입력받기
2) 사용자가 입력한 동을 찾아 새로운 데이터 프레임으로 생성
3) 데이터 전처리
- 인덱스
- 행렬 변경
- 컬럼명 변경
4) 시각화
- 막대그래프
- matplotlib
- pandas
- 원 그래프
- matplotlib
1) 사용자로부터 동네 입력받기
- input('문구')
2) 사용자가 입력한 동을 찾아 새로운 데이터 프레임 생성
3) 데이터 전처리
- 인덱스 변경 : set_index
- 행렬 변경 : .T
- 컬럼명 변경 : .columns
4) 시각화
- 막대 그래프
- 원 그래프
막대 그래프
원 그래프